查理·比蒂
人员信息
附属: 英国伦敦DeepMind
SPARQL查询
优化列表
2020年–今天
2022 [j3] 凯文·麦基 , 乔尔·雷波 , 查理·比蒂 , 理查德·埃弗雷特 :
量化多智能体强化学习中环境和人口多样性的影响。 自动。 Agent多Agent系统。 36 ( 1 ) : 21 ( 2022 ) 2021 【c3】 乔尔·雷波 , 埃德加·杜涅兹·古斯曼 , 亚历山大·维日涅夫斯 , 约翰·阿加皮欧 , 彼得·苏尼哈格 , 拉斐尔·科斯特 , 贾伊德·马蒂亚斯 , 查理·比蒂 , 伊戈尔·莫达奇 , 格雷佩尔 :
使用Melting Pot对多智能体强化学习进行可扩展评估。 ICML公司 2021 : 6187-6199 [i10] 凯文·麦基 , 乔尔·雷波 , 查理·比蒂 , 理查德·埃弗雷特 :
量化多智能体强化学习中的环境和群体多样性。 CoRR公司 abs/2102.08370 ( 2021 ) [第九章] 凯文·麦基 , 爱德华·休斯 , Tina O.Zhu(朱婷) , 马丁·查德威克 , 拉斐尔·科斯特 , 安东尼奥·加西亚·卡斯塔涅达 , 查理·比蒂 , 格雷佩尔 , 马修·博特维尼克 , 乔尔·雷波 :
深度强化学习为人类合作的涌现动力学建模。 CoRR公司 abs/2103.04982 ( 2021 ) [i8] 丹·罗森鲍姆 , 玛尔塔·加内洛 , 米查尔·齐林斯基 , 查理·比蒂 , 埃伦·克兰西 , 安德里亚·胡贝尔 , Pushmet Kohli公司 , 高级安德鲁·W , 空军参谋长约翰·江珀 , 卡尔·多尔施 , S.M.Ali Eslami先生 , 奥拉夫·隆尼伯格 , 乔纳斯·阿德勒 :
使用VAE从低温EM图像推断原子坐标的连续分布。 CoRR公司 abs/2106.14108 ( 2021 ) [i7] 乔尔·雷波 , 埃德加·杜涅兹·古斯曼 , 亚历山大·萨沙·维日涅维茨 , 约翰·阿加皮欧 , 彼得·苏尼哈格 , 拉斐尔·科斯特 , 贾伊德·马蒂亚斯 , 查尔斯·比蒂 , 伊戈尔·莫达奇 , 格雷佩尔 :
使用Melting Pot对多智能体强化学习进行可扩展评估。 CoRR公司 abs/2107.06857 ( 2021 ) 2020 [i6] 查尔斯·比蒂 , 托马斯·科普 , 埃德加·杜涅兹·古斯曼 , 乔尔·雷波 :
DeepMind实验室2D。 CoRR公司 abs/2011.07027 ( 2020 )
2010 – 2019
2018 [注2] 安德烈亚·巴尼诺 , 卡斯韦尔·巴里 , 贝尼尼奥·乌里亚 , 查尔斯·布伦德尔 , 蒂莫西·利利克拉普 , 彼得·米洛夫斯基 , 亚历山大·普里策 , 马丁·查德威克 , 托马斯·迪吉斯 , 约瑟夫·莫达伊尔 , 格雷格·韦恩 , 休伯特·索耶 , 法比奥·维奥拉 , 布莱恩·张 , 罗斯·戈罗欣(Ross Goroshin) , 尼尔·C·拉比诺维茨 , 拉兹万·帕斯卡努 , 查理·比蒂 , 斯蒂格·彼得森 , 阿米尔·萨迪克 , 斯蒂芬·加夫尼 , 海伦·金 , Koray Kavukcuoglu公司 , 哈萨比斯 , Raia Hadsell公司 , 达山库马兰 :
在人工代理中使用类似网格表示的基于矢量的导航。 国家。 557 ( 7705 ) : 429-433 ( 2018 ) [i5] 乔尔·雷波 , Cyprien de Masson d'Autume公司 , 丹尼尔·佐兰 , 大卫·阿莫斯 , 查尔斯·比蒂 , 基思·安德森 , 安东尼奥·加西亚·卡斯塔涅达 , 马努埃尔·桑切斯 , 西蒙·格林 , Audrunas Gruslys公司 , 谢恩·莱格 , 哈萨比斯 , 马修·博特维尼克 :
心理实验室:深度强化学习代理的心理实验室。 CoRR公司 abs/1801.08116 ( 2018 ) [i4] 马克斯·贾德伯格 , 沃伊切赫·M·恰尔内茨基 , 伊恩·邓宁 , 卢克·马里斯 , 拉线杆 , 安东尼奥·加西亚·卡斯塔涅达 , 查尔斯·比蒂 , 尼尔·C·拉比诺维茨 , 阿里·莫科斯 , 阿夫拉罕·鲁德曼 , 尼古拉斯·桑纳雷特 , 提姆·格林 , 路易丝·迪森 , 乔尔·雷波 , 大卫·西尔弗 , 哈萨比斯 , Koray Kavukcuoglu公司 , 格雷佩尔 :
基于人口的深度强化学习在第一人称多人游戏中的人性化表现。 CoRR公司 abs/1807.01281 ( 2018 ) 2017 【c2】 朱利安·佩罗拉 , 乔尔·雷波 , 维尼丘斯·弗洛雷斯·赞巴尔迪 , 查尔斯·比蒂 , 卡尔·图尔斯 , 格雷佩尔 :
公共工具资源分配的多智能体强化学习模型。 NIPS公司 2017 : 3643-3652 [i3] 朱利安·佩罗拉 , 乔尔·雷波 , 维尼丘斯·弗洛雷斯·赞巴尔迪 , 查尔斯·比蒂 , 卡尔·图尔斯 , 格雷佩尔 :
公共工具资源分配的多智能体强化学习模型。 CoRR公司 abs/1707.06600 ( 2017 ) 2016 [i2] 查尔斯·比蒂 , 乔尔·雷波 , 丹尼斯·特普利亚申 , 汤姆·沃德 , 马库斯·温赖特 , 海因里希·库特勒 , 安德鲁·勒弗朗克 , 西蒙·格林 , 维克托·巴尔德斯 , 阿米尔·萨迪克 , 朱利安·施里特维瑟 , 基思·安德森 , 莎拉·约克 , 最大铁路超高 , 亚当·凯恩 , 阿德里安·博尔顿 , 斯蒂芬·加夫尼 , 海伦·金 , 哈萨比斯 , 谢恩·莱格 , 斯蒂格·彼得森 :
DeepMind实验室。 CoRR公司 abs/1612.03801 ( 2016 ) 2015 [j1] 沃洛德米尔·姆尼赫 , Koray Kavukcuoglu公司 , 大卫·西尔弗 , 安德烈·鲁苏 , 乔尔·维内斯 , 马克·贝勒马尔 , 亚历克斯·格拉夫斯 , 马丁·里德米勒 , 安德烈亚斯·菲德杰兰 , 乔治·奥斯特罗夫斯基 , 斯蒂格·彼得森 , 查尔斯·比蒂 , 阿米尔·萨迪克 , Ioannis Antonoglou公司 , 海伦·金 , 达山库马兰 , Daan Wierstra公司 , 谢恩·莱格 , 哈萨比斯 :
通过深度强化学习进行人性化控制。 国家。 518 ( 7540 ) : 529-533 ( 2015 ) [i1] 阿伦·奈尔 , 普拉文·斯里尼瓦桑 , 萨姆·布莱克威尔 , 卡格达斯·阿尔切克 , 罗里·费龙 , 亚历山德罗·德·玛丽亚 , Vedavyas Panneershelvam公司 , 穆斯塔法·苏莱曼 , 查尔斯·比蒂 , 斯蒂格·彼得森 , 谢恩·莱格 , 沃洛德米尔·姆尼赫 , Koray Kavukcuoglu公司 , 大卫·西尔弗 :
深度强化学习的大规模并行方法。 CoRR公司 abs/1507.04296 ( 2015 )