爱德华·休斯 0001
人员信息
附属: 英国伦敦DeepMind Technologies Limited
其他同名人员
SPARQL查询
优化列表
2020年–今天
2024 [公元20年] 赵云凡 , 尼基尔·贝哈里 , 爱德华·休斯 , 埃德温·张 , Dheeraj Nagaraj公司 , 卡尔·图尔斯 , 阿帕娜·塔内加 , 米林德·坦贝 :
在不安的多武器匪徒中实现零射击学习。 美国原子能机构 2024 : 2618-2620 [第19条] 爱德华·休斯 , 迈克尔·D·丹尼斯 , 杰克·帕克霍尔德 , 费亚尔·M·P·贝巴哈尼 , 阿迪蒂·马瓦兰卡 , 于戈什 , 汤姆·绍尔 , 蒂姆·罗克塔舍尔 :
立场:开放性是人工超人智能的基础。 ICML公司 2024 [第18条] 杰克·布鲁斯 , 迈克尔·D·丹尼斯 , 阿什利·爱德华兹 , 杰克·帕克霍尔德 , 于戈什 , 爱德华·休斯 , 马修·赖 , 阿迪蒂·马瓦兰卡 , 里奇·斯泰格沃 , Chris应用程序 , 优素福·艾塔尔 , 莎拉·贝赫特尔 , 费亚尔·M·P·贝巴哈尼 , 斯蒂芬妮·C.Y.·陈 , 尼古拉斯·希斯 , 露西·冈萨雷斯 , 西蒙·奥斯宾多 , 谢尔吉尔·奥扎尔 , 斯科特·里德 , 张静伟(Jingwei Zhang) , 康拉德·佐纳 , 杰夫·克伦 , 南多·德·弗雷塔斯 , 萨汀德·辛格 , 蒂姆·罗克塔舍尔 :
精灵:生成交互环境。 ICML公司 2024 [i33] 杰克·布鲁斯 , 迈克尔·丹尼斯 , 阿什利·爱德华兹 , 杰克·帕克霍尔德 , 于戈什 , 爱德华·休斯 , 马修·赖 , 阿迪蒂·马瓦兰卡 , 里奇·斯泰格沃 , Chris应用程序 , 优素福·艾塔尔 , 莎拉·贝赫特尔 , 费亚尔·M·P·贝巴哈尼 , 斯蒂芬妮·陈 , 尼古拉斯·希斯 , 露西·冈萨雷斯 , 西蒙·奥斯宾多 , 谢尔吉尔·奥扎尔 , 斯科特·里德 , 张静伟(Jingwei Zhang) , 康拉德·佐纳 , 杰夫·克伦 , 南多·德·弗雷塔斯 , 萨汀德·辛格 , 蒂姆·罗克塔舍尔 :
精灵:生成交互环境。 CoRR公司 abs/2402.15391 ( 2024 ) [i32] 艾森·加布里埃尔 , 阿里安娜·曼奇尼 , 杰夫·基林 , 丽莎·安妮·亨德里克斯 , 维伦娜·里瑟 , 哈桑·伊克巴尔 , 内纳德·托马塞夫 , 伊拉·克特纳 , 扎卡里·肯顿 , 米凯尔·罗德里格斯 , 塞利姆·埃尔·萨耶德 , 萨沙·布朗 , 坎弗·阿克布卢特 , 安德鲁·特拉斯克 , 爱德华·休斯 , A.史蒂夫·伯格曼 , 蕾妮·谢尔比 , 纳赫玛·马查尔 , 科诺·格里芬 , 胡安·马特奥斯·加西亚 , 劳拉·魏丁格 , 温妮街 , 本杰明·兰格 , 亚历克斯·英格曼 , 艾莉森·伦茨 , 里德·恩格尔 , 安德鲁·巴拉卡特 , 维多利亚·克拉科夫纳 , 约翰·奥利弗·西伊 , 泽布·库思·内尔森 , 阿曼达·麦克罗斯克里 , 维杰·博利纳 , 哈里·劳 , 默里·沙纳汉 , 莉斯·阿尔伯茨 , 博尔贾·巴利 , 萨拉·德·哈斯 , Yetune Ibitoye公司 , 阿兰·达福 , 贝斯·戈德堡 , 塞巴斯蒂安·克里尔 , 亚历山大·里斯 , Sims威瑟斯彭 , 威尔·霍金斯 , 玛丽贝斯·劳赫 , 唐·华莱士 , 马蒂亚·富兰克林 , 乔什·A·戈尔茨坦 , 乔尔·雷曼 , 迈克尔·克伦克 , 香农·瓦勒 , 考特尼·比尔斯 , 梅雷迪思·林格尔·莫里斯 , 海伦·金 , 布莱斯·阿圭拉(Blaise Agüera y Arcas) , 艾萨克 , 詹姆斯·曼伊卡 :
高级人工智能助理的道德规范。 CoRR公司 abs/2404.16244 ( 2024 ) [i31] 乔纳森库克 , 卢沛宁 , 爱德华·休斯 , 乔尔·雷波 , 雅各布·N·福斯特 :
人工代际智能:强化学习中的文化积累。 CoRR公司 abs/2406.00392 ( 2024 ) [i30] 爱德华·休斯 , 迈克尔·丹尼斯 , 杰克·帕克霍尔德 , 费亚尔·M·P·贝巴哈尼 , 阿迪蒂·马瓦兰卡 , 于戈什 , 汤姆·绍尔 , 蒂姆·罗克塔舍尔 :
开放性是人工超人智能的基础。 CoRR公司 abs/2406.04268 ( 2024 ) 2023 [第17条] 雅各布·鲍尔 , 凯特·鲍姆利 , 费亚尔·M·P·贝巴哈尼 , 阿维什卡尔·博普昌德 , Nathalie Bradley-Schmieg(纳撒利·布莱德利·施密格) , 迈克尔·张 , 娜塔莉·克莱 , 阿德里安·科利斯特 , 维巴瓦里·达萨吉 , 露西·冈萨雷斯 , 卡罗尔·格雷戈 , 爱德华·休斯 , 谢利姆·卡塞姆 , 玛丽亚·洛克斯·汤普森 , 汉娜·奥普肖 , 杰克·帕克霍尔德 , Shreya Pathak先生 , 尼古拉斯·佩雷斯·尼维斯 , 内曼尼娅·拉基切维奇 , 蒂姆·罗克塔舍尔 , 扬尼克·施罗德克 , 萨汀德·辛格 , 雅库布·辛格诺夫斯基 , 卡尔·图尔斯 , 莎拉·约克 , 亚历山大·扎切尔 , 张磊(Lei M.Zhang) :
开放式任务空间中的人-时间尺度适应。 ICML公司 2023 : 1887-1935 [i29] 自适应代理团队 , 雅各布·鲍尔 , 凯特·鲍姆利 , 萨廷德·巴韦亚 , 费亚尔·M·P·贝巴哈尼 , 阿维什卡尔·博普昌德 , Nathalie Bradley-Schmieg(纳撒利·布莱德利·施密格) , 迈克尔·张 , 娜塔莉·克莱 , 阿德里安·科利斯特 , 维巴瓦里·达萨吉 , 露西·冈萨雷斯 , 卡罗尔·格雷戈 , 爱德华·休斯 , 谢利姆·卡塞姆 , 玛丽亚·洛克斯·汤普森 , 汉娜·奥普肖 , 杰克·帕克霍尔德 , Shreya Pathak先生 , 尼古拉斯·佩雷斯·尼维斯 , 内曼尼娅·拉基切维奇 , 蒂姆·罗克塔舍尔 , 扬尼克·施罗德克 , 雅库布·辛格诺夫斯基 , 卡尔·图尔斯 , 莎拉·约克 , 亚历山大·扎切尔 , 张磊(Lei Zhang) :
开放式任务空间中的人-时间尺度适应。 CoRR公司 abs/2301.07608 ( 2023 ) [第28条] 乌达里·马杜沙尼 , 凯文·麦基 , 约翰·阿加皮欧 , 乔尔·雷波 , 理查德·埃弗雷特 , 托马斯·安东尼 , 爱德华·休斯 , 卡尔·图尔斯 , 埃德加·杜涅兹·古斯曼 :
异质性社会价值取向导致了连续性社会困境中的意义多样性。 CoRR公司 abs/2305.00768 ( 2023 ) [i27] 赵云凡 , 尼基尔·贝哈里 , 爱德华·休斯 , 埃德温·张 , Dheeraj Nagaraj公司 , 卡尔·图尔斯 , 阿帕娜·塔内加 , 米林德·坦贝 :
在不安的多武器匪徒中实现零射击学习。 CoRR公司 abs/2310.14526 ( 2023 ) 2022 【j4】 伊恩·杰普 , 托马斯·安东尼 , 约拉姆·巴赫拉赫 , 阿维什卡尔·博普昌德 , 卡莱沙·布拉德 , 杰罗姆·康纳 , 维巴瓦里·达萨吉 , 巴特·德·维尔德 , 埃德加·杜涅兹·古斯曼 , 罗穆尔·伊利 , 理查德·埃弗雷特 , 丹尼尔·海恩斯 , 爱德华·休斯 , 米纳·汗 , 马克·兰科特 , 凯特·拉森 , 拉线杆 , 刘思奇 , 卢克·马里斯 , 凯文·麦基 , 保罗·穆勒 , 朱利安·佩罗拉 , 弗洛里安·斯特鲁布 , 安德烈亚·塔切蒂 , 尤金·塔拉索夫 , 王哲(Zhe Wang) , 卡尔·图尔斯 :
在多智能体环境中开发、评估和缩放学习智能体。 AI通讯。 35 ( 4 ) : 271-284 ( 2022 ) [i26] 阿维什卡尔·博普昌德 , 贝萨尼·布朗菲尔德 , 阿德里安·科利斯特 , 阿古斯汀·达尔·拉戈 , 阿什利·爱德华兹 , 理查德·埃弗雷特 , 亚历山大·弗雷谢特 , 扬科·吉塔希·奥利维拉 , 爱德华·休斯 , 科里·W·马修森 , 皮尔玛丽亚·门多利奇奥 , 朱莉娅·帕瓦尔 , 米鲁娜·皮斯拉 , 亚历克斯·普拉托诺夫 , 埃文·森特 , 苏赫迪普·辛格 , 亚历山大·扎切尔 , 张磊(Lei M.Zhang) :
学习无需人工数据的稳健实时文化传播。 CoRR公司 abs/2203.00715 ( 2022 ) [i25] 迈克尔·布拉德利·约翰逊 , 爱德华·休斯 , 芬巴尔木材 , 乔尔·雷波 :
多智能体强化学习中的紧急交换行为。 CoRR公司 abs/2205.06760 ( 2022 ) 【i24】 伊恩·杰普 , 托马斯·安东尼 , 约拉姆·巴赫拉赫 , 阿维什卡尔·博普昌德 , 卡莱沙·布拉德 , 杰罗姆·康纳 , 维巴瓦里·达萨吉 , 巴特·德·维尔德 , 埃德加·杜涅兹·古斯曼 , 罗穆尔·伊利 , 理查德·埃弗雷特 , 丹尼尔·海恩斯 , 爱德华·休斯 , 米纳·汗 , 马克·兰科特 , 凯特·拉森 , 拉线杆 , 刘思奇 , 卢克·马里斯 , 凯文·麦基 , 保罗·穆勒 , 朱利安·佩罗拉 , 弗洛里安·斯特鲁布 , 安德烈亚·塔切蒂 , 尤金·塔拉索夫 , 王哲(Zhe Wang) , 卡尔·图尔斯 :
在多智能体环境中开发、评估和缩放学习智能体。 CoRR公司 abs/2209.10958 ( 2022 ) 2021 [第16条] 米歇尔·巴克尔 , 理查德·埃弗雷特 , 劳拉·魏丁格 , 艾森·加布里埃尔 , 威廉·艾萨克 , 乔尔·雷波 , 爱德华·休斯 :
具有时空复杂性的网络游戏合作建模。 美国原子能机构 2021 : 1455-1457 [第15条] DJ频闪 , 凯文·麦基 , 马特·博特维尼克 , 爱德华·休斯 , 理查德·埃弗雷特 :
在没有人工数据的情况下与人类合作。 NeurIPS公司 2021 : 14502-14515 [第23条] 波尔·莫雷诺 , 爱德华·休斯 , 凯文·麦基 , 贝尔纳多·阿维拉·皮雷斯 , 塞奥帕恩·韦伯(Théophane Weber) :
多智能体强化学习中的神经递归信念状态。 CoRR公司 腹肌/2102.02274 ( 2021 ) [i22] 米歇尔·巴克尔 , 理查德·埃弗雷特 , 劳拉·魏丁格 , 艾森·加布里埃尔 , 威廉·艾萨克 , 乔尔·雷波 , 爱德华·休斯 :
具有时空复杂性的网络游戏合作建模。 CoRR公司 abs/2102.06911 ( 2021 ) 【i21】 凯文·麦基 , 爱德华·休斯 , Tina O.Zhu(朱婷) , 马丁·查德威克 , 拉斐尔·科斯特 , 安东尼奥·加西亚·卡斯塔涅达 , 查理·比蒂 , 格雷佩尔 , 马修·博特维尼克 , 乔尔·雷波 :
深度强化学习为人类合作的涌现动力学建模。 CoRR公司 abs/2103.04982 ( 2021 ) [i20] DJ频闪 , 凯文·麦基 , 马特·博特维尼克 , 爱德华·休斯 , 理查德·埃弗雷特 :
与没有人类数据的人类合作。 CoRR公司 abs/2110.08176 ( 2021 ) 2020 [j3] 卡尔·图尔斯 , 朱利安·佩罗拉 , 马克·兰科特 , 爱德华·休斯 , 理查德·埃弗雷特 , 乔尔·雷波 , Csaba Szepesvariá , 格雷佩尔 :
实证博弈论分析的边界和动力学。 自动。 Agent多Agent系统。 34 ( 1 ) : 7 ( 2020 ) [注2] 诺兰·巴德 , 雅各布·N·福斯特 , 萨拉斯·钱达尔 , 尼尔·伯奇 , 马克·兰科特 , H.弗朗西斯·宋 , 埃米利奥·帕里索托 , 文森特·杜穆林 , Subhodeep Moitra先生 , 爱德华·休斯 , 伊恩·邓宁 , 希布尔·穆拉德 , 雨果·拉罗谢尔 , 马克·贝勒马尔 , 迈克尔·鲍林 :
哈纳比挑战:人工智能研究的新前沿。 Artif公司。 因特尔。 280 : 103216 ( 2020 ) [j1] 约拉姆·巴赫拉赫 , 理查德·埃弗雷特 , 爱德华·休斯 , 安吉利基·拉扎里杜 , 乔尔·雷波 , 马克·兰科特 , 迈克尔·约翰逊 , Wojciech M.Czarnecki公司 , 格雷佩尔 :
使用深度强化学习进行团队组建谈判。 Artif公司。 因特尔。 288 : 103356 ( 2020 ) [第14条] 爱德华·休斯 , 托马斯·安东尼 , 汤姆·埃克尔斯 , 乔尔·雷波 , 大卫·巴尔杜齐 , 约拉姆·巴赫拉赫 :
学习解决多人零和游戏中的联盟困境。 美国原子能机构 2020 : 538-547 [第13条] 凯文·麦基 , 伊恩·杰普 , 布莱恩·麦克威廉姆斯 , 埃德加·杜涅兹·古斯曼 , 爱德华·休斯 , 乔尔·雷波 :
混合动力强化学习中的社会多样性和社会偏好。 美国原子能机构 2020 : 869-877 [第12条] 大卫·巴尔杜齐 , Wojciech M.Czarnecki公司 , 汤姆·安东尼 , 伊恩·杰普 , 爱德华·休斯 , 乔尔·雷波 , 乔治·皮里奥拉斯 , 格雷佩尔 :
平滑市场:组织基于梯度的学习者的基本机制。 ICLR公司 2020 [第11条] 保罗·穆勒 , 沙耶根·奥米德沙维埃 , 马克·罗兰 , 卡尔·图尔斯 , 朱利安·佩罗拉 , 刘思奇 , 丹尼尔·海恩斯 , 卢克·马里斯 , 马克·兰科特 , 爱德华·休斯 , 王哲(Zhe Wang) , 拉线杆 , 尼古拉斯·希斯 , 格雷佩尔 , 雷米·穆诺斯 :
多智能体学习的广义训练方法。 ICLR公司 2020 [第10条] 杨嘉晨 , 李安(Ang Li) , Mehrdad Farajtabar公司 , 彼得·苏尼哈格 , 爱德华·休斯 , 查宏远 :
学习激励其他学习代理。 NeurIPS公司 2020 [i19] 大卫·巴尔杜齐 , Wojciech M.Czarnecki公司 , 托马斯·安东尼 , 伊恩·杰姆 , 爱德华·休斯 , 乔尔·雷波 , 乔治·皮里奥拉斯 , 格雷佩尔 :
平稳市场:组织基于梯度的学习者的基本机制。 CoRR公司 abs/2001.04678 ( 2020 ) [i18] 凯文·麦基 , 伊恩·杰普 , 布莱恩·麦克威廉姆斯 , 埃德加·杜涅兹·古斯曼 , 爱德华·休斯 , 乔尔·雷波 :
混合动力强化学习中的社会多样性和社会偏好。 CoRR公司 abs/2002.02325 ( 2020 ) [i17] 爱德华·休斯 , 托马斯·安东尼 , 汤姆·埃克尔斯 , 乔尔·雷波 , 大卫·巴尔杜齐 , 约拉姆·巴赫拉赫 :
学习解决多人零和游戏中的联盟困境。 CoRR公司 abs/2003.00799 ( 2020 ) [i16] 杨嘉晨 , 李安(Ang Li) , Mehrdad Farajtabar公司 , 彼得·苏尼哈格 , 爱德华·休斯 , 查宏远 :
学习激励其他学习代理。 CoRR公司 abs/2006.06051 ( 2020 ) 【i15】 拉斐尔·科斯特 , 凯文·麦基 , 理查德·埃弗雷特 , 劳拉·魏丁格 , 威廉·艾萨克 , 爱德华·休斯 , 埃德加·杜涅兹·古斯曼 , 格雷佩尔 , 马修·博特维尼克 , 乔尔·雷波 :
具有异构偏好的多智能体强化学习中的无模型约定。 CoRR公司 abs/2010.09054 ( 2020 ) [第14条] 约拉姆·巴赫拉赫 , 理查德·埃弗雷特 , 爱德华·休斯 , 安吉利基·拉扎里杜 , 乔尔·雷波 , 马克·兰科特 , 迈克尔·约翰逊 , Wojciech M.Czarnecki公司 , 格雷佩尔 :
使用深度强化学习协商团队组建。 CoRR公司 腹肌/2010.10380 ( 2020 ) [i13] 阿兰·达福 , 爱德华·休斯 , 约拉姆·巴赫拉赫 , Tantum Collins公司 , 凯文·麦基 , 乔尔·雷波 , 凯特·拉森 , 格雷佩尔 :
合作人工智能中的开放问题。 CoRR公司 abs/2012.08630 ( 2020 )
2010 – 2019
2019 【c9】 简·X·王 , 爱德华·休斯 , 克莉莎·费尔南多 , Wojciech M.Czarnecki公司 , 埃德加·杜涅兹·古斯曼 , 乔尔·雷波 :
利他行为的内在动机不断演变。 美国原子能机构 2019 : 683-692 【c8】 乔尔·雷波 , 朱利安·佩罗拉 , 爱德华·休斯 , 史蒂文·惠莱特 , 亚当·H·大理石 , 埃德加·杜涅兹·古斯曼 , 彼得·苏尼哈格 , 伊恩·邓宁 , 格雷佩尔 :
马尔萨斯强化学习。 美国原子能机构 2019 : 1099-1107 【c7】 汤姆·埃克尔斯 , 爱德华·休斯 , 杰诺斯·克拉马尔 , 史蒂文·惠莱特 , 乔尔·雷波 :
模仿游戏:马尔可夫游戏中的习得互惠。 美国原子能机构 2019 : 1934-1936 【c6】 Dzmitry Bahdanau公司 , 费利克斯·希尔 , 简·雷克 , 爱德华·休斯 , 赛义德·阿里安·侯赛尼 , Pushmet Kohli公司 , 爱德华·格雷芬斯特特 :
通过奖励建模学习理解目标规范。 ICLR(海报) 2019 【c5】 雅各布·N·福斯特 , H.弗朗西斯·宋 , 爱德华·休斯 , 尼尔·伯奇 , 伊恩·邓宁 , 西蒙·怀特森 , 马修·博特维尼克 , 迈克尔·鲍林 :
用于深度多智能体强化学习的贝叶斯动作解码器。 ICML公司 2019 : 1942-1951 【c4】 娜塔莎·贾克斯 , 安吉利基·拉扎里杜 , 爱德华·休斯 , 圣格雷 , 佩德罗·奥尔特加 , DJ频闪 , 乔尔·雷波 , 南多·德·弗雷塔斯 :
社会影响是多智能体深度强化学习的内在动机。 ICML公司 2019 : 3040-3049 【c3】 彼得·苏尼哈格 , 拉线杆 , 刘思奇 , 乔什·梅雷尔 , 尼古拉斯·希斯 , 乔尔·雷波 , 爱德华·休斯 , 汤姆·埃克尔斯 , 格雷佩尔 :
强化学习代理在模拟生态系统中获得群集和共生行为。 阿里夫 2019 : 103-110 [i12] Ishita Dasgupta公司 , 简·X·王 , 西尔维娅·齐亚帕 , 约瓦娜·米特罗维奇 , 佩德罗·奥尔特加 , 大卫·拉波索 , 爱德华·休斯 , 彼得·巴塔利亚 , 马修·博特维尼克 , 泽布·库思·内尔森 :
元强化学习中的因果推理。 CoRR公司 abs/1901.08162 ( 2019 ) [i11] 诺兰·巴德 , 雅各布·N·福斯特 , 萨拉斯·钱达尔 , 尼尔·伯奇 , 马克·兰科特 , H.弗朗西斯·宋 , 埃米利奥·帕里索托 , 文森特·杜穆林 , Subhodeep Moitra先生 , 爱德华·休斯 , 伊恩·邓宁 , 希布尔·穆拉德 , 雨果·拉罗谢尔 , 马克·贝勒马尔 , 迈克尔·鲍林 :
哈纳比挑战:人工智能研究的新前沿。 CoRR公司 abs/1902.00506 ( 2019 ) [i10] 乔尔·雷波 , 爱德华·休斯 , 马克·兰科特 , 格雷佩尔 :
自动课程与社会互动中创新的涌现:多智能体智能研究宣言。 CoRR公司 abs/1903.00742 ( 2019 ) [第九章] 汤姆·埃克尔斯 , 爱德华·休斯 , 杰诺斯·克拉马尔 , 史蒂文·惠莱特 , 乔尔·雷波 :
在复杂的顺序社会困境中学习互惠。 CoRR公司 abs/1903.08082 ( 2019 ) [i8] 马克·兰科特 , 爱德华·洛克哈特 , Jean-Baptiste Lespiau女士 , 维尼希乌斯·弗洛雷斯·赞巴尔迪 , Satyaki Upadhyay公司 , 朱利安·佩罗拉 , 斯里拉姆·斯里尼瓦桑 , 芬巴尔木材 , 卡尔·图尔斯 , 沙耶根·奥米德沙维埃 , 丹尼尔·海恩斯 , 达斯汀·莫里尔 , 保罗·穆勒 , 蒂莫·埃瓦兹 , 瑞恩·福克纳 , 杰诺斯·克拉马尔 , 巴特·德·维尔德 , 布伦南·塞塔 , 詹姆斯·布拉德伯里 , 大卫·丁 , 塞巴斯蒂安·博尔盖乌德 , 马修·赖 , 朱利安·施里特维瑟 , 托马斯·安东尼 , 爱德华·休斯 , 伊沃·达尼埃尔卡 , 乔纳·瑞安·达维斯 :
OpenSpiel:游戏强化学习框架。 CoRR公司 abs/1908.09453 ( 2019 ) [i7] 保罗·穆勒 , 沙耶根·奥米德沙维埃 , 马克·罗兰 , 卡尔·图尔斯 , 朱利安·佩罗拉 , 刘思奇 , 丹尼尔·海恩斯 , 卢克·马里斯 , 马克·兰科特 , 爱德华·休斯 , 王哲(Zhe Wang) , 拉线杆 , 尼古拉斯·希斯 , 格雷佩尔 , 雷米·穆诺斯 :
多智能体学习的广义训练方法。 CoRR公司 abs/1909.12823 ( 2019 ) 2018 【c2】 Dzmitry Bahdanau公司 , 费利克斯·希尔 , 简·雷克 , 爱德华·休斯 , Pushmet Kohli公司 , 爱德华·格雷芬斯特特 :
从指令和目标状态中共同学习“什么”和“如何”。 ICLR(车间) 2018 【c1】 爱德华·休斯 , 乔尔·雷波 , 马修·菲利普斯 , 卡尔·图尔斯 , 埃德加·杜涅兹·古斯曼 , 安东尼奥·加西亚·卡斯塔涅达 , 伊恩·邓宁 , 蒂娜·朱 , 凯文·麦基 , 拉斐尔·科斯特 , 希瑟·罗夫 , 格雷佩尔 :
不平等厌恶改善了跨期社会困境中的合作。 NeurIPS公司 2018 : 3330-3340 [i6] 爱德华·休斯 , 乔尔·雷波 , 马修·菲利普斯 , 卡尔·图尔斯 , 埃德加·杜涅兹·古斯曼 , 安东尼奥·加西亚·卡斯塔涅达 , 伊恩·邓宁 , 蒂娜·朱 , 凯文·麦基 , 拉斐尔·科斯特 , 希瑟·罗夫 , 格雷佩尔 :
不平等厌恶解决了跨时期的社会困境。 CoRR公司 abs/1803.08884 ( 2018 ) [i5] Dzmitry Bahdanau公司 , 费利克斯·希尔 , 简·雷克 , 爱德华·休斯 , Pushmet Kohli公司 , 爱德华·格雷芬斯特特 :
通过对抗性奖励诱导学习遵循语言指导。 CoRR公司 腹肌/1806.01946 ( 2018 ) [i4] 娜塔莎·贾克斯 , 安吉利基·拉扎里杜 , 爱德华·休斯 , 圣格雷 , 佩德罗·奥尔特加 , DJ频闪 , 乔尔·雷波 , 南多·德·弗雷塔斯 :
多Agent RL中通过因果影响的内在社会动机。 CoRR公司 abs/1810.08647 ( 2018 ) [i3] 雅各布·N·福斯特 , H.弗朗西斯·宋 , 爱德华·休斯 , 尼尔·伯奇 , 伊恩·邓宁 , 西蒙·怀特森 , 马修·博特维尼克 , 迈克尔·鲍林 :
用于深度多智能体强化学习的贝叶斯动作解码器。 CoRR公司 abs/1811.01458 ( 2018 ) [i2] 简·X·王 , 爱德华·休斯 , 克莉莎·费尔南多 , 沃伊切赫·M·恰尔内茨基 , 埃德加·杜涅兹·古斯曼 , 乔尔·雷波 :
利他行为的内在动机不断演变。 CoRR公司 abs/1811.05931 ( 2018 ) [i1] 乔尔·雷波 , 朱利安·佩罗拉 , 爱德华·休斯 , 史蒂文·惠莱特 , 亚当·H·大理石 , 埃德加·杜涅兹·古斯曼 , 彼得·苏尼哈格 , 伊恩·邓宁 , 格雷佩尔 :
马尔萨斯强化学习。 CoRR公司 abs/1812.07019 ( 2018 )