埃里克·詹纳
人员信息
优化列表
![笔记](https://dblp2.uni-trier.de/img/note-mark.dark.12x12.png)
2020年–今天
2024 [第九章] 莱昂·朗 , 戴维斯·富特 , 斯图尔特·罗素 , 安卡·D·德拉甘 , 埃里克·詹纳 , 斯科特·埃蒙斯 :
当你的人工智能欺骗你:奖励学习中人类评估者的部分可观察性的挑战。 CoRR公司 abs/2402.17747 ( 2024 ) [i8] 安瓦尔 , 阿布哈尔·萨帕罗夫 , 哈维尔·兰多 , 丹尼尔·帕莱卡 , Miles Turpin公司 , 彼得·哈斯 , Ekdeep Singh Lubana公司 , 埃里克·詹纳 , 斯蒂芬·卡斯珀 , 奥利弗·索尔布特 , 本杰明·埃德尔曼 , 张兆伟 , 马里奥·古特 , 安东·科里内克 , 何塞·埃尔南德斯·奥拉洛 , 刘易斯·哈蒙德 , 埃里克·毕格罗 , 亚历山大·潘 , 劳罗·兰戈斯科 , 托马斯·科巴克 , 张海迪 , 中瑞琪(Ruiqi Zhong) , Seán Ohéigeartaigh先生 , 加布里埃尔·里奇亚 , 朱利奥·科尔西 , 陈幼坚 , 马库斯·安德荣格 , 莉莲·爱德华兹 , 本吉奥 , 陈丹琪 , 塞缪尔·奥尔巴尼 , 特根·马哈拉吉 , 雅各布·福斯特 , 弗洛里安电车 , 呵呵呵呵 , 阿图萨·卡西尔扎德 , Yejin Choi(Yejin Choi) , 大卫·克鲁格 :
确保大型语言模型的一致性和安全性方面的基本挑战。 CoRR公司 abs/2404.09932 ( 2024 ) [i7] 史莱亚斯·卡普尔 , 埃里克·詹纳 , 斯图尔特·罗素 :
程序合成语法树上的扩散。 CoRR公司 abs/2405.20519 ( 2024 ) 2023 [i6] Joar Skalse公司 , 露西·法尼克 , 苏梅特·拉梅什·莫特瓦尼 , 埃里克·詹纳 , 亚当·格莱夫 , 亚历山德罗·阿巴特 :
STARC:量化奖励功能之间差异的通用框架。 CoRR公司 abs/2309.15257 ( 2023 ) 2022 【c2】 埃里克·詹纳 , 莫里斯·韦勒 :
等变神经网络的可操纵偏微分算子。 ICLR公司 2022 [i5] 埃里克·詹纳 , 亚当·格莱夫 :
预处理奖励函数以实现可解释性。 CoRR公司 abs/2203.13553 ( 2022 ) [i4] 埃里克·詹纳 , 赫尔克·范·霍夫 , 亚当·格莱夫 :
MDPs上的微积分:作为梯度的潜力塑造。 CoRR公司 腹肌/2208.09570 ( 2022 ) [i3] 亚当·格莱夫 , 穆罕默德·陶费奎 , 胡安·罗卡蒙德 , 埃里克·詹纳 , 史蒂芬·H·王 , 萨姆·托耶 , 马克西米利安·厄内斯特斯 , 诺拉·贝尔罗斯 , 斯科特·埃蒙斯 , 斯图尔特·罗素 :
模仿:干净的模仿学习工具。 CoRR公司 abs/2211.11972 ( 2022 ) 2021 【c1】 埃里克·詹纳 , 恩里克·菲塔·桑马汀 , 弗雷德·汉普雷希特 :
Karger算法的扩展:为什么它们在理论上失败,以及它们在实践中如何有用。 ICCV公司 2021 : 4582-4591 [i2] 埃里克·詹纳 , 莫里斯·韦勒 :
等变神经网络的可操纵偏微分算子。 CoRR公司 abs/2106.10163 ( 2021 ) [i1] 埃里克·詹纳 , 恩里克·菲塔·桑马汀 , 弗雷德·汉普雷希特 :
Karger算法的扩展:为什么它们在理论上失败,以及它们在实践中如何有用。 CoRR公司 abs/2110.02750 ( 2021 )
合著者索引
![](https://dblp2.uni-trier.de/img/cog.dark.24x24.png)