理查德·埃弗雷特 0001
人员信息
附属: 英国伦敦DeepMind Technologies Limite
优化列表
2020年–今天
2023 [第14条] 乌达里·马杜沙尼 , 凯文·麦基 , 约翰·阿加皮欧 , 乔尔·雷波 , 理查德·埃弗雷特 , 托马斯·安东尼 , 爱德华·休斯 , 卡尔·图尔斯 , 埃德加·杜涅兹·古斯曼 :
异质性社会价值取向导致了连续性社会困境中的意义多样性。 CoRR公司 abs/2305.00768 ( 2023 ) 2022 【j4】 凯文·麦基 , 乔尔·雷博 , 查理·比蒂 , 理查德·埃弗雷特 :
量化多智能体强化学习中环境和人口多样性的影响。 自动。 Agent多Agent系统。 36 ( 1 ) : 21 ( 2022 ) [j3] 伊恩·杰普 , 托马斯·安东尼 , 约拉姆·巴赫拉奇 , 阿维什卡尔·博普昌德 , 卡莱沙·布拉德 , 杰罗姆·康纳 , 维巴瓦里·达萨吉 , 巴特·德·维尔德 , 埃德加·杜涅兹·古斯曼 , 罗穆尔·伊利 , 理查德·埃弗雷特 , 丹尼尔·海恩斯 , 爱德华·休斯 , 米纳·汗 , 马克·兰科特 , 凯特·拉森 , 拉线杆 , 刘思奇 , 卢克·马里斯 , 凯文·麦基 , 保罗·穆勒 , 朱利安·佩罗拉 , 弗洛里安·斯特鲁布 , 安德烈亚·塔切蒂 , 尤金·塔拉索夫 , 王哲(Zhe Wang) , 卡尔·图尔斯 :
在多智能体环境中开发、评估和缩放学习智能体。 AI通讯。 35 ( 4 ) : 271-284 ( 2022 ) 【c9】 伊恩·杰普 , 凯文·麦基 , 理查德·埃弗雷特 , 埃德加·杜涅兹·古斯曼 , 约拉姆·巴赫拉赫 , 大卫·巴尔杜齐 , 安德烈亚·塔切蒂 :
D3C:降低多智能体学习中无政府的代价。 美国原子能机构 2022 : 498-506 【c8】 伊恩·杰普 , 拉胡尔·萨瓦尼 , 马克·兰科特 , 约拉姆·巴赫拉赫 , 托马斯·安东尼 , 理查德·埃弗雷特 , 安德烈亚·塔切蒂 , 汤姆·埃克尔斯 , János Kramár公司 :
基于梯度下降的大型多人博弈中纳什的样本逼近。 美国原子能机构 2022 : 507-515 [i13] 科帕拉普 , 埃德加·杜涅兹·古斯曼 , 贾伊德·马蒂亚斯 , 亚历山大·萨沙·维日涅维茨 , 约翰·阿加皮欧 , 凯文·麦基 , 理查德·埃弗雷特 , Janusz Marecki公司 , 乔尔·雷波 , 格雷佩尔 :
隐藏议程:一个具有多元学习均衡的社会演绎游戏。 CoRR公司 abs/2201.01816 ( 2022 ) [i12] 阿维什卡尔·博普昌德 , 贝萨尼·布朗菲尔德 , 阿德里安·科利斯特 , 阿古斯汀·达尔·拉戈 , 阿什利·爱德华兹 , 理查德·埃弗雷特 , 亚历山大·弗雷谢特 , 扬科·吉塔希·奥利维拉 , 爱德华·休斯 , 科里·W·马修森 , 皮尔玛丽亚·门多利奇奥 , 朱莉娅·帕瓦尔 , Miruna双鱼座 , 亚历克斯·普拉托诺夫 , 埃文·森特 , 苏赫迪普·辛格 , 亚历山大·扎切尔 , Lei M.Zhang(张磊) :
学习无需人工数据的稳健实时文化传播。 CoRR公司 abs/2203.00715 ( 2022 ) [i11] 伊丽莎·范德波尔 , 伊恩·杰普 , 约拉姆·巴赫拉赫 , 理查德·埃弗雷特 :
大型图聚类的随机可并行特征间隙扩张。 CoRR公司 abs/2207.14589 ( 2022 ) [i10] 伊恩·杰普 , 托马斯·安东尼 , 约拉姆·巴赫拉赫 , 阿维什卡尔·博普昌德 , 卡莱沙·布拉德 , 杰罗姆·康纳 , 维巴瓦里·达萨吉 , 巴特·德·维尔德 , 埃德加·杜涅兹·古斯曼 , 罗穆尔·伊利 , 理查德·埃弗雷特 , 丹尼尔·海恩斯 , 爱德华·休斯 , 米纳·汗 , 马克·兰科特 , 凯特·拉森 , 拉线杆 , 刘思奇 , 卢克·马里斯 , 凯文·麦基 , 保罗·穆勒 , 朱利安·佩罗拉 , 弗洛里安·斯特鲁布 , 安德烈亚·塔切蒂 , 尤金·塔拉索夫 , 王哲(Zhe Wang) , 卡尔·图尔斯 :
在多智能体环境中开发、评估和缩放学习智能体。 CoRR公司 abs/2209.10958 ( 2022 ) 2021 【c7】 米歇尔·巴克尔 , 理查德·埃弗雷特 , 劳拉·魏丁格 , 艾森·加布里埃尔 , 威廉·艾萨克 , 乔尔·雷波 , 爱德华·休斯 :
具有时空复杂性的网络游戏合作建模。 美国原子能机构 2021 : 1455-1457 【c6】 DJ频闪 , 凯文·麦基 , 马特·博特维尼克 , 爱德华·休斯 , 理查德·埃弗雷特 :
在没有人工数据的情况下与人类合作。 NeurIPS公司 2021 : 14502-14515 [第九章] 米歇尔·巴克尔 , 理查德·埃弗雷特 , 劳拉·魏丁格 , 艾森·加布里埃尔 , 威廉·艾萨克 , 乔尔·雷博 , 爱德华·休斯 :
具有时空复杂性的网络游戏合作建模。 CoRR公司 abs/2102.06911 ( 2021 ) [i8] 凯文·麦基 , 乔尔·雷波 , 查理·比蒂 , 理查德·埃弗雷特 :
量化多智能体强化学习中的环境和种群多样性。 CoRR公司 abs/2102.08370 ( 2021 ) [i7] 伊恩·杰普 , 拉胡尔·萨瓦尼 , 马克·兰科特 , 约拉姆·巴赫拉赫 , 托马斯·安东尼 , 理查德·埃弗雷特 , 安德烈亚·塔切蒂 , 汤姆·埃克尔斯 , 杰诺斯·克拉马尔 :
基于梯度下降的大型多人博弈中纳什的样本逼近。 CoRR公司 abs/2106.01285 ( 2021 ) [i6] DJ频闪 , 凯文·麦基 , 马特·博特维尼克 , 爱德华·休斯 , 理查德·埃弗雷特 :
与没有人类数据的人类合作。 CoRR公司 abs/2110.08176 ( 2021 ) 2020 [注2] 卡尔·图尔斯 , 朱利安·佩罗拉 , 马克·兰科特 , 爱德华·休斯 , 理查德·埃弗雷特 , 乔尔·雷波 , Csaba Szepesvariá , 格雷佩尔 :
实证博弈论分析的边界和动力学。 自动。 Agent多Agent系统。 34 ( 1 ) : 7 ( 2020 ) [j1] 约拉姆·巴赫拉赫 , 理查德·埃弗雷特 , 爱德华·休斯 , 安吉利基·拉扎里杜 , 乔尔·雷波 , 马克·兰科特 , 迈克尔·约翰逊 , Wojciech M.Czarnecki公司 , 格雷佩尔 :
使用深度强化学习进行团队组建谈判。 Artif公司。 因特尔。 288 : 103356 ( 2020 ) 【c5】 托马斯·安东尼 , 汤姆·埃克尔斯 , 安德烈亚·塔切蒂 , János Kramár公司 , 伊恩·杰普 , 托马斯·哈德森 , 尼古拉斯·波切 , 马克·兰科特 , 朱利安·佩罗拉 , 理查德·埃弗雷特 , 萨汀德·辛格 , 格雷佩尔 , 约拉姆·巴赫拉赫 :
学习通过最佳应对政策迭代来实施无压力外交。 NeurIPS公司 2020 [i5] 托马斯·安东尼 , 汤姆·埃克尔斯 , 安德烈亚·塔切蒂 , 杰诺斯·克拉马尔 , 伊恩·杰普 , 托马斯·哈德森 , 尼古拉斯·波切 , 马克·兰科特 , 朱利安·佩罗拉 , 理查德·埃弗雷特 , 萨汀德·辛格 , 格雷佩尔 , 约拉姆·巴赫拉赫 :
学习通过最佳应对政策迭代来实施无压力外交。 CoRR公司 abs/2006.04635 ( 2020 ) [i4] 伊恩·杰普 , 凯文·麦基 , 理查德·埃弗雷特 , 埃德加·杜涅兹·古斯曼 , 约拉姆·巴赫拉赫 , 大卫·巴尔杜齐 , 安德烈亚·塔切蒂 :
D3C:降低多智能体学习中无政府的代价。 CoRR公司 abs/2010.00575 ( 2020 ) [i3] 拉斐尔·科斯特 , 凯文·麦基 , 理查德·埃弗雷特 , 劳拉·魏丁格 , 威廉·艾萨克 , 爱德华·休斯 , 埃德加·杜涅兹·古斯曼 , 格雷佩尔 , 马修·博特维尼克 , 乔尔·雷波 :
具有异质偏好的多智能体强化学习中的无模型约定。 CoRR公司 abs/2010.09054 ( 2020 ) [i2] 约拉姆·巴赫拉奇 , 理查德·埃弗雷特 , 爱德华·休斯 , 安吉利基·拉扎里杜 , 乔尔·雷波 , 马克·兰科特 , 迈克尔·约翰逊 , Wojciech M.Czarnecki公司 , 格雷佩尔 :
使用深度强化学习协商团队组建。 CoRR公司 abs/2010.10380 ( 2020 )
2010 – 2019
2019 【c4】 理查德·埃弗雷特 , 亚当·科布 , 安德鲁·马卡姆 , 斯蒂芬·罗伯茨 :
优化世界以评估和影响强化学习代理。 美国原子能机构 2019 : 1943-1945 2018 【c3】 理查德·埃弗雷特 , 斯蒂芬·罗伯茨 :
利用对手建模和深度强化学习对抗非静态代理。 AAAI春季研讨会 2018 【c2】 亚当·科布 , 理查德·埃弗雷特 , 安德鲁·马卡姆 , 斯蒂芬·罗伯茨 :
用高斯过程向量演算识别多智能体中的源和汇。 KDD公司 2018 : 1254-1262 [i1] 亚当·科布 , 理查德·埃弗雷特 , 安德鲁·马卡姆 , 斯蒂芬·罗伯茨 :
用高斯过程向量演算识别多智能体中的源和汇。 CoRR公司 abs/1802.10446 ( 2018 ) 2016 【c1】 理查德·埃弗雷特 , Jason R.C.护士 , 阿诺·埃罗拉 :
在线欺骗剖析:是什么让自动文本令人信服? 囊 2016 : 1115-1120