Ioannis Antonoglou公司
人员信息
SPARQL查询
优化列表
2020年–今天
2024 [第14条] 马谢尔·里德 , 尼古拉·萨维诺夫 , 丹尼斯·特普利亚辛 , 德米特里·勒皮钦 , 蒂莫西·利利克拉普 , Jean-Baptiste Alayrac公司 , 拉杜·索里科特 , 安吉利基·拉扎里杜 , 奥汉·菲拉特 , 朱利安·施里特维瑟 , Ioannis Antonoglou公司 , 罗汉·阿尼尔 , 塞巴斯蒂安·博尔盖乌德 , 安德鲁·M·戴 , 凯蒂·米利肯 , 伊桑·戴尔 , 米娅·格莱斯 , Thibault Sottiaux公司 , 李湛忞 , 法比奥·维奥拉 , 马尔科姆·雷诺兹 , 徐元忠 , 詹姆斯·莫洛伊 , 吉林陈 , 迈克尔·伊萨德 , 保罗·巴勒姆 , 汤姆·亨尼根 , 罗斯·麦克罗伊 , 梅尔文·约翰逊 , 约翰·沙尔克威克 , 伊莱·科林斯 , 伊丽莎·卢瑟福 , 埃里卡·莫雷拉 , 卡里姆·阿尤布 , 梅加·戈尔 , 克莱门斯·迈尔 , 格雷戈里·桑顿 , 甄扬 , 亨利克·米查勒夫斯基 , 扎赫尔·阿巴斯 , 内森·舒彻 , 安克什·阿南德 , 理查德·艾凡斯 , 詹姆斯·基林 , 卡雷尔·伦克 , 塞勒姆·海卡尔 , Siamak Shakeri先生 , 普拉纳夫·希亚姆 , Aakanksha Chowdhery公司 , 罗马戒指 , 史蒂芬·斯宾塞 , 埃伦·塞泽纳 , 等。 :
双子座1.5:在数百万的背景符号中释放多模态理解。 CoRR公司 abs/2403.05530 ( 2024 ) 2023 [i13] 罗汉·阿尼尔 , 塞巴斯蒂安·博尔盖乌德 , 吴永辉 , Jean-Baptiste Alayrac公司 , 余嘉惠 , 拉杜·索里科特 , 约翰·沙尔克威克 , 安德鲁·M·戴 , 安贾·豪斯 , 凯蒂·米利肯 , 大卫·西尔弗 , 斯拉夫·彼得罗夫 , 梅尔文·约翰逊 , Ioannis Antonoglou公司 , 朱利安·施里特维瑟 , 阿米莉亚·格莱斯 , 吉林陈 , 艾米丽·皮特勒 , 蒂莫西·利利克拉普 , 安吉利基·拉扎里杜 , 奥汉·菲拉特 , 詹姆斯·莫洛伊 , 迈克尔·伊萨德 , 保罗·罗纳德·巴勒姆 , 汤姆·亨尼根 , 李湛忞 , 法比奥·维奥拉 , 马尔科姆·雷诺兹 , 徐元忠 , 瑞恩·多尔蒂 , 伊莱·科林斯 , 克莱门斯·迈尔 , 伊丽莎·卢瑟福 , 埃里卡·莫雷拉 , 卡里姆·阿尤布 , 梅加·戈尔 , 乔治·塔克 , 恩里克·皮奎拉斯 , 马克西姆·克里坤 , 伊恩·巴尔 , 尼古拉·萨维诺夫 , 伊沃·达尼埃尔卡 , 贝卡·罗洛夫斯 , 安娜·怀特 , 安德斯·安德烈亚森 , 塔玛拉·冯·格伦 , 拉克希曼·雅加蒂 , 梅赫兰·卡泽米 , 卢卡斯·冈萨雷斯 , 米沙·卡尔曼 , 雅库布·辛格诺夫斯基 , 等。 :
双子座:一系列功能强大的多模模型。 CoRR公司 abs/2312.11805 ( 2023 ) 2022 [c10] Ioannis Antonoglou公司 , 朱利安·施里特维瑟 , 谢尔吉尔·奥扎尔 , 托马斯·休伯特 , 大卫·西尔弗 :
使用学习模型在随机环境中进行规划。 ICLR公司 2022 2021 【c9】 雷米·勒布朗德 , Jean-Baptiste Alayrac公司 , 劳伦特·西弗雷 , 米鲁娜·皮斯拉 , Jean-Baptiste Lespiau女士 , Ioannis Antonoglou公司 , 凯伦·西蒙扬 , Oriol葡萄酒 :
超越波束搜索的机器翻译解码。 EMNLP(1) 2021 : 8410-8434 【c8】 托马斯·休伯特 , 朱利安·施里特维瑟 , Ioannis Antonoglou公司 , 穆罕默德·巴雷卡坦 , 西蒙·施密特 , 大卫·西尔弗 :
复杂行动空间中的学习和规划。 ICML公司 2021 : 4476-4486 【c7】 谢尔吉尔·奥扎尔 , 李亚哲 , 阿里·拉扎维 , Ioannis Antonoglou公司 , 阿伦·范登·奥尔德 , Oriol葡萄酒 :
规划的矢量量化模型。 ICML公司 2021 : 8302-8313 【c6】 朱利安·施里特维瑟 , 托马斯·休伯特 , 阿莫尔·曼德哈内 , 穆罕默德·巴雷卡坦 , Ioannis Antonoglou公司 , 大卫·西尔弗 :
通过学习模型规划进行在线和离线强化学习。 NeurIPS公司 2021 : 27580-27591 [i12] 雷米·勒布朗德 , Jean-Baptiste Alayrac公司 , 劳伦特·西弗雷 , 米鲁娜·皮斯拉 , Jean-Baptiste Lespiau女士 , Ioannis Antonoglou公司 , 凯伦·西蒙扬 , Oriol葡萄酒 :
超越波束搜索的机器翻译解码。 CoRR公司 abs/2104.05336 ( 2021 ) [i11] 朱利安·施里特维瑟 , 托马斯·休伯特 , 阿莫尔·曼德哈内 , 穆罕默德·巴雷卡坦 , Ioannis Antonoglou公司 , 大卫·西尔弗 :
通过学习模型规划进行在线和离线强化学习。 CoRR公司 abs/2104.06294 ( 2021 ) [i10] 托马斯·休伯特 , 朱利安·施里特维瑟 , Ioannis Antonoglou公司 , 穆罕默德·巴雷卡坦 , 西蒙·施密特 , 大卫·西尔弗 :
复杂行动空间中的学习和规划。 CoRR公司 abs/2104.06303 ( 2021 ) [第九章] 谢尔吉尔·奥扎尔 , 李亚哲 , 阿里·拉扎维 , Ioannis Antonoglou公司 , 阿伦·范登·奥尔德 , Oriol葡萄酒 :
规划的矢量量化模型。 CoRR公司 abs/2106.04615 ( 2021 ) 2020 【j4】 朱利安·施里特维瑟 , Ioannis Antonoglou公司 , 托马斯·休伯特 , 凯伦·西蒙扬 , 劳伦特·西弗雷 , 西蒙·施密特 , 阿瑟·盖兹 , 爱德华·洛克哈特 , 哈萨比斯 , 格雷佩尔 , 蒂莫西·利利克拉普 , 大卫·西尔弗 :
通过学习模型进行规划,掌握Atari、围棋、国际象棋和shogi。 国家。 588 ( 7839 ) : 604-609 ( 2020 ) 【c5】 Jean-Bastien烧烤 , 佛罗伦特·阿尔奇 , 汤云浩 , 托马斯·休伯特 , 米查尔·瓦尔科 , Ioannis Antonoglou公司 , 雷米·穆诺斯 :
蒙特卡罗树搜索作为正则化策略优化。 ICML公司 2020 : 3769-3778 [i8] 丹尼尔·雷泽德 , 伊沃·达尼埃尔卡 , 乔治·帕帕马卡里奥斯 , 南·罗斯玛丽·科 , 雷·江 , 西奥芬妮·韦伯 , 卡罗尔·格雷戈 , 哈姆扎·梅尔齐克 , 法比奥·维奥拉 , 简·王 , 约瓦娜·米特罗维奇 , 弗雷德里克·贝塞 , Ioannis Antonoglou公司 , 拉尔斯·布兴 :
因果纠正强化学习的部分模型。 CoRR公司 abs/2002.02836 ( 2020 ) [i7] Jean-Bastien烧烤 , 佛罗伦特·阿尔奇 , 汤云浩 , 托马斯·休伯特 , 米查尔·瓦尔科 , Ioannis Antonoglou公司 , 雷米·穆诺斯 :
蒙特卡罗树搜索作为正则化策略优化。 CoRR公司 abs/2007.12509 ( 2020 )
2010 – 2019
2019 [i6] 朱利安·施里特维瑟 , Ioannis Antonoglou公司 , 托马斯·休伯特 , 凯伦·西蒙扬 , 劳伦特·西弗雷 , 西蒙·施密特 , 阿瑟·盖兹 , 爱德华·洛克哈特 , 哈萨比斯 , 格雷佩尔 , 蒂莫西·利利克拉普 , 大卫·西尔弗 :
通过学习模型进行规划,掌握雅达利、围棋、国际象棋和Shogi。 CoRR公司 腹肌/1911.08265 ( 2019 ) 2018 【c4】 阿瑟·盖兹 , 西奥芬妮·韦伯 , Ioannis Antonoglou公司 , 凯伦·西蒙扬 , Oriol葡萄酒 , Daan Wierstra公司 , 雷米·穆诺斯 , 大卫·西尔弗 :
学习使用MCTSnet进行搜索。 ICML公司 2018 : 1817-1826 [i5] 阿瑟·盖兹 , 塞奥帕恩·韦伯(Théophane Weber) , Ioannis Antonoglou公司 , 凯伦·西蒙扬 , Oriol葡萄酒 , Daan Wierstra公司 , 雷米·穆诺斯 , 大卫·西尔弗 :
学习使用MCTSnet进行搜索。 CoRR公司 abs/1802.04697 ( 2018 ) [i4] 陈玉田 , Aja Huang(黄亚佳) , 王子玉 , Ioannis Antonoglou公司 , 朱利安·施里特维瑟 , 大卫·西尔弗 , 南多·德·弗雷塔斯 :
AlphaGo中的贝叶斯优化。 CoRR公司 abs/1812.06855 ( 2018 ) 2017 [j3] 大卫·西尔弗 , 朱利安·施里特维瑟 , 凯伦·西蒙扬 , Ioannis Antonoglou公司 , Aja Huang(黄亚佳) , 阿瑟·盖兹 , 托马斯·休伯特 , 卢卡斯·贝克 , 马修·赖 , 阿德里安·博尔顿 , 陈玉田 , 蒂莫西·利利克拉普 , 范慧 , 劳伦特·西弗雷 , 乔治·范·登·德里斯(George van den Driessche) , 格雷佩尔 , 哈萨比斯 :
在没有人类知识的情况下掌握围棋游戏。 国家。 550 ( 7676 ) : 354-359 ( 2017 ) [i3] 大卫·西尔弗 , 托马斯·休伯特 , 朱利安·施里特维瑟 , Ioannis Antonoglou公司 , 马修·赖 , 阿瑟·盖兹 , 马克·兰科特 , 劳伦特·西弗雷 , 达山库马兰 , 格雷佩尔 , 蒂莫西·利利克拉普 , 凯伦·西蒙扬 , 哈萨比斯 :
使用通用强化学习算法通过自我游戏掌握国际象棋和Shogi。 CoRR公司 abs/1712.01815 ( 2017 ) 2016 [注2] 大卫·西尔弗 , Aja Huang(黄亚佳) , 克里斯·麦迪森 , 阿瑟·盖兹 , 劳伦特·西弗雷 , 乔治·范·登·德里斯(George van den Driessche) , 朱利安·施里特维瑟 , Ioannis Antonoglou公司 , Vedavyas Panneershelvam公司 , 马克·兰科特 , 桑德·迪尔曼 , 多米尼克·格雷 , 约翰·纳姆 , 纳尔·卡尔克布伦纳 , 伊利亚·萨茨克沃 , 蒂莫西·利利克拉普 , 马德琳·利奇 , Koray Kavukcuoglu公司 , 格雷佩尔 , 哈萨比斯 :
通过深度神经网络和树搜索掌握围棋游戏。 国家。 529 ( 7587 ) : 484-489 ( 2016 ) 【c3】 瓦查Bounliphone , 尤金·贝里洛夫斯基 , 马修·布拉施科 , Ioannis Antonoglou公司 , 亚瑟·格雷顿 :
生成模型中模型选择的相对相似性检验。 ICLR(海报) 2016 【c2】 汤姆·绍尔 , 约翰·泉 , Ioannis Antonoglou公司 , 大卫·西尔弗 :
优先体验重播。 ICLR(海报) 2016 [i2] Wacha弹跳电话 , 尤金·贝里洛夫斯基 , 阿瑟·特内豪斯 , Ioannis Antonoglou公司 , 亚瑟·格雷顿 , 马修·布拉施科 :
相对相关性和相似性的快速非参数检验。 CoRR公司 abs/1611.05740 ( 2016 ) 2015 [j1] 沃洛德米尔·姆尼赫 , Koray Kavukcuoglu公司 , 大卫·西尔弗 , 安德烈·鲁苏 , 乔尔·维内斯 , 马克·贝勒马尔 , 亚历克斯·格拉夫斯 , 马丁·里德米勒 , 安德烈亚斯·菲德杰兰 , 乔治·奥斯特罗夫斯基 , 斯蒂格·彼得森 , 查尔斯·比蒂 , 阿米尔·萨迪克 , Ioannis Antonoglou公司 , 海伦·金 , 达山库马兰 , Daan Wierstra公司 , 谢恩·莱格 , 哈萨比斯 :
通过深度强化学习进行人性化控制。 国家。 518 ( 7540 ) : 529-533 ( 2015 ) 2014 【c1】 汤姆·绍尔 , Ioannis Antonoglou公司 , 大卫·西尔弗 :
随机优化的单元测试。 ICLR公司 2014 2013 [i1] 沃洛德米尔·姆尼赫 , Koray Kavukcuoglu公司 , 大卫·西尔弗 , 亚历克斯·格拉夫斯 , Ioannis Antonoglou公司 , Daan Wierstra公司 , 马丁·里德米勒 :
使用深度强化学习玩Atari。 CoRR公司 abs/1312.5602 ( 2013 )