阿德里安·埃科菲
人员信息
SPARQL查询
优化列表
2020年–今天
2024 【c6】 科林·伯恩斯 , 帕维尔·伊兹迈洛夫 , 简·亨德里克·基什内尔 , 鲍文·贝克 , 高里奥 , 利奥波德·阿舍布伦纳 , 陈一宁 , 阿德里安·埃科菲 , 玛纳斯·约格勒卡尔 , 简·雷克 , 伊利亚·萨茨克沃 , 杰弗里·吴 :
弱到强泛化:在监管薄弱的情况下激发强大的能力。 ICML公司 2024 2023 [i10] 科林·伯恩斯 , 帕维尔·伊兹迈洛夫 , 简·亨德里克·基什内尔 , 鲍文·贝克 , 高里奥 , 利奥波德·阿舍布伦纳 , 陈一宁 , 阿德里安·埃科菲 , 玛纳斯·约格勒卡尔 , 简·雷克 , 伊利亚·萨茨克沃 , 吴建福 :
弱到强泛化:在监管薄弱的情况下激发强大的能力。 CoRR公司 abs/2312.09390 ( 2023 ) 2022 【c5】 鲍文·贝克 , 伊尔赫·阿卡亚 , 彼得·霍霍夫 , Joost Huizinga公司 , 杰唐 , 阿德里安·埃科菲 , 布兰登·霍顿 , 劳尔·桑佩德罗 , 杰夫·克伦 :
视频预训(VPT):通过观看未标记的在线视频学习表演。 NeurIPS公司 2022 [第九章] 鲍文·贝克 , 伊尔赫·阿卡亚 , 彼得·霍霍夫 , Joost Huizinga公司 , 杰唐 , 阿德里安·埃科菲 , 布兰登·霍顿 , 劳尔·桑佩德罗 , 杰夫·克伦 :
视频预训(VPT):通过观看未标记的在线视频学习表演。 CoRR公司 abs/2206.11795 ( 2022 ) 2021 [j1] 阿德里安·埃科菲 , Joost Huizinga公司 , 乔尔·雷曼 , 肯尼思·斯坦利 , 杰夫·克伦 :
首先返回,然后探索。 国家。 590 ( 7847 ) : 580-586 ( 2021 ) 【c4】 阿德里安·埃科菲 , 乔尔·雷曼 :
道德不确定性下的强化学习。 ICML公司 2021 : 2926-2936 [i8] 英格玛·卡尼切德 , Joost Huizinga公司 , 大卫·法希 , 威廉·赫布根·格斯 , 布兰登·霍顿 , 劳尔·桑佩德罗 , 彼得·霍霍夫 , 鲍文·贝克 , 阿德里安·埃科菲 , 杰唐 , 奥列格·克里莫夫 , 杰夫·克伦 :
在一个复杂、可视化、硬勘探领域的多任务课程学习:Minecraft。 CoRR公司 abs/2106.14876 ( 2021 ) 2020 【c3】 阿什利·D·爱德华兹 , 希曼舒·萨尼 , 罗莎娜·刘 , 简·洪 , 安基特耆那教 , 王瑞(Rui Wang) , 阿德里安·埃科菲 , 托马斯·米科尼 , 查尔斯·伊斯贝尔 , 杰森·尤辛斯基 :
用深度确定性动力学梯度估计Q(s,s’)。 ICML公司 2020 : 2825-2835 【c2】 安德烈亚·马多托 , 马赫迪·纳马齐法尔 , Joost Huizinga公司 , 皮耶罗·莫利诺 , 阿德里安·埃科菲 , 郑怀秀 , 亚历山大·帕潘格里斯 , 黛玉(Dian Yu) , 钱德拉·卡特里 , 哥坎·蒂尔 :
基于文本游戏的探索式语言学习。 国际JCAI 2020 : 1488-1494 【c1】 阿德里安·埃科菲 , 杰夫·克伦 , 乔尔·雷曼 :
创建安全开放式人工智能的开放性问题:控制和创造力之间的紧张关系。 阿里夫 2020 : 27-35 [i7] 安德烈亚·马多托 , 马赫迪·纳马齐法尔 , Joost Huizinga公司 , 皮耶罗·莫利诺 , 阿德里安·埃科菲 , 郑怀秀 , 亚历山大·帕潘格里斯 , 黛玉(Dian Yu) , Chandra Khatri公司 , 哥坎·蒂尔 :
基于文本游戏的探索式语言学习。 CoRR公司 abs/2001.08868 ( 2020 ) [i6] 阿什利·D·爱德华兹 , 希曼舒·萨尼 , 罗莎娜·刘 , 简·洪 , 安基特耆那教 , 王瑞(Rui Wang) , 阿德里安·埃科菲 , 托马斯·米科尼 , 查尔斯·伊斯贝尔 , 杰森·尤辛斯基 :
用深度确定性动力学梯度估计Q(s,s’)。 CoRR公司 abs/2002.09505 ( 2020 ) [i5] 阿德里安·埃科菲 , Joost Huizinga公司 , 乔尔·雷曼 , 肯尼思·斯坦利 , 杰夫·克伦 :
首先返回,然后探索。 CoRR公司 abs/2004.12919 ( 2020 ) [i4] 阿德里安·埃科菲 , 乔尔·雷曼 :
道德不确定性下的强化学习。 CoRR公司 abs/2006.04734 ( 2020 ) [i3] 阿德里安·埃科菲 , 杰夫·克伦 , 乔尔·雷曼 :
创建安全开放式人工智能的开放性问题:控制和创造力之间的紧张关系。 CoRR公司 abs/2006.07495 ( 2020 )
2010 – 2019
2019 [i2] 黛玉(Dian Yu) , Chandra Khatri公司 , 亚历山大·帕潘格里斯 , 安德烈亚·马多托 , 马赫迪·纳马齐法尔 , Joost Huizinga公司 , 阿德里安·埃科菲 , 郑怀秀 , 皮耶罗·莫利诺 , 杰夫·克伦 , 周宇 , Kenji Sagae公司 , Gökhan Tür公司 :
通过具体环境中的语言进行常识和语义引导导航。 ViGIL@NeurIPS 2019 [i1] 阿德里安·埃科菲 , Joost Huizinga公司 , 乔尔·雷曼 , 肯尼思·斯坦利 , 杰夫·克伦 :
探索:一种解决艰难探索问题的新方法。 CoRR公司 abs/1901.10995 ( 2019 )