朱利安·施里特维瑟
人员信息
SPARQL查询
优化列表
2020年–今天
2024 [i16] 马谢尔·里德 , 尼古拉·萨维诺夫 , 丹尼斯·特普利亚辛 , 德米特里·勒皮钦 , 蒂莫西·利利克拉普 , Jean-Baptiste Alayrac公司 , 拉杜·索里科特 , 安吉利基·拉扎里杜 , 奥汉·菲拉特 , 朱利安·施里特维瑟 , Ioannis Antonoglou公司 , 罗汉·阿尼尔 , 塞巴斯蒂安·博尔盖乌德 , 安德鲁·M·戴 , 凯蒂·米利肯 , 伊桑·戴尔 , 米娅·格莱斯 , Thibault Sottiaux公司 , 李湛忞 , 法比奥·维奥拉 , 马尔科姆·雷诺兹 , 徐元忠 , 詹姆斯·莫洛伊 , 吉林陈 , 迈克尔·伊萨德 , 保罗·巴勒姆 , 汤姆·亨尼根 , 罗斯·麦克罗伊 , 梅尔文·约翰逊 , 约翰·沙尔克威克 , Eli Collins公司 , 伊丽莎·卢瑟福 , 埃里卡·莫雷拉 , 卡里姆·阿尤布 , 梅加·戈尔 , 克莱门斯·迈尔 , 格雷戈里·桑顿 , 甄扬 , 亨利克·米查勒夫斯基 , 扎赫尔·阿巴斯 , 内森·舒彻 , 安克什·阿南德 , 理查德·艾凡斯 , 詹姆斯·基林 , 卡雷尔·伦克 , Salem Haykal公司 , Siamak Shakeri先生 , 普拉纳夫·希亚姆 , Aakanksha Chowdhery公司 , 罗马戒指 , 史蒂芬·斯宾塞 , 埃伦·塞泽纳 , 等。 :
双子座1.5:在数百万的背景符号中释放多模态理解。 CoRR公司 abs/2403.05530 ( 2024 ) 2023 [j5] 丹尼尔·曼科维茨 , 安德烈亚·米奇 , 安东·哲尔诺夫 , 马可·盖尔米 , 马可·塞尔维 , 科斯敏·帕杜拉鲁 , 爱德华·勒伦特 , 谢里克·伊克巴尔 , Jean-Baptiste Lespiau女士 , 亚历克斯·埃亨 , 托马斯·科普 , 凯文·米利金 , 斯蒂芬·加夫尼 , 索菲·埃尔斯特 , 杰克逊·布洛舍 , 克里斯·甘布尔 , 基兰米兰 , 罗伯特·东 , 黄敏杰 , A.塔兰·杰吉尔 , 穆罕默德·巴雷卡坦 , 李宇佳 , 阿莫尔·曼德哈内 , 托马斯·休伯特 , 朱利安·施里特维瑟 , 哈萨比斯 , Pushmet Kohli公司 , 马丁·里德米勒 , Oriol葡萄酒 , 大卫·西尔弗 :
使用深度强化学习发现的更快的排序算法。 国家。 618 ( 7964 ) : 257-263 ( 2023 ) 【i15】 王鹏明 , 米基塔·萨扎诺维奇 , Berkin Ilbeyi公司 , Phitchaya Mangpo Phothilimthana公司 , 马尼什·普罗希特 , 韩阳泰 , Ngan Vu村 , 王妙森 , 科斯敏·帕杜拉鲁 , 爱德华·勒伦特 , 安东·哲尔诺夫 , 朱利安·施里特维瑟 , 托马斯·休伯特 , 罗伯特·东 , 保拉·库雷洛维奇 , 基兰米兰 , Oriol葡萄酒 , 丹尼尔·曼科维茨 :
使用深度强化学习优化记忆映射。 CoRR公司 abs/2305.07440 ( 2023 ) [第14条] 米歇尔·马修 , 谢尔吉尔·奥扎尔 , 斯利瓦桑·斯里尼瓦桑 , 圣格雷 , 张尚通 , Ray Jiang(蒋雷) , 汤姆·勒佩恩 , 鲍威尔 , 康拉德·佐纳 , 朱利安·施里特维瑟 , 大卫·H·崔 , 佩特科·乔治耶夫 , 丹尼尔·富山 , Aja Huang(黄亚佳) , 罗马戒指 , 伊戈尔·巴布什金 , 蒂莫·埃瓦兹 , Mahyar Bordbar公司 , 萨拉亨德森 , 塞尔吉奥·戈梅斯·科尔梅纳雷霍 , 阿伦·范登·奥尔德 , Wojciech Marian Czarnecki公司 , 南多·德·弗雷塔斯 , Oriol葡萄酒 :
AlphaStar未插塞:大规模离线强化学习。 CoRR公司 abs/2308.03526 ( 2023 ) [i13] 罗汉·阿尼尔 , 塞巴斯蒂安·博尔盖乌德 , 吴永辉 , Jean-Baptiste Alayrac公司 , 余嘉惠 , 拉杜·索里科特 , 约翰·沙尔克威克 , 安德鲁·M·戴 , 安贾·豪斯 , 凯蒂·米利肯 , 大卫·西尔弗 , 斯拉夫·彼得罗夫 , 梅尔文·约翰逊 , Ioannis Antonoglou公司 , 朱利安·施里特维瑟 , 阿米莉亚·格莱斯 , 吉林陈 , 艾米丽·皮特勒 , 蒂莫西·利利克拉普 , 安吉利基·拉扎里杜 , 奥汉·菲拉特 , 詹姆斯·莫洛伊 , 迈克尔·伊萨德 , 保罗·罗纳德·巴勒姆 , 汤姆·亨尼根 , 李湛忞 , 法比奥·维奥拉 , 马尔科姆·雷诺兹 , 徐元忠 , 瑞恩·多尔蒂 , Eli Collins公司 , 克莱门斯·迈尔 , 伊丽莎·卢瑟福 , 埃里卡·莫雷拉 , 卡里姆·阿尤布 , 梅加·戈尔 , 乔治·塔克 , 恩里克·皮奎拉斯 , 马克西姆·克里坤 , 伊恩·巴尔 , 尼古拉·萨维诺夫 , 伊沃·达尼埃尔卡 , 贝卡·罗洛夫斯 , 安娜·怀特 , 安德斯·安德烈亚森 , 塔玛拉·冯·格伦 , 拉克希曼·雅加蒂 , 梅赫兰·卡泽米 , 卢卡斯·冈萨雷斯 , 米沙·卡尔曼 , 雅库布·辛格诺夫斯基 , 等。 :
双子座:一系列功能强大的多模模型。 CoRR公司 abs/2312.11805 ( 2023 ) 2022 【j4】 阿尔侯赛因·法齐 , 马特杰·巴洛格 , Aja Huang(黄阿佳) , 托马斯·休伯特 , 贝纳迪诺·罗梅拉-佩雷斯 , 穆罕默德·巴雷卡坦 , 亚历山大·诺维科夫 , 弗朗西斯科·鲁伊斯 , 朱利安·施里特维瑟 , Grzegorz Swirszcz公司 , 大卫·西尔弗 , 哈萨比斯 , Pushmet Kohli公司 :
通过强化学习发现更快的矩阵乘法算法。 国家。 610 ( 7930 ) : 47-53 ( 2022 ) 【c6】 安克什·阿南德 , 雅各布·C·沃克 , 李亚哲 , Eszter Vértes公司 , 朱利安·施里特维瑟 , 谢尔吉尔·奥扎尔 , 西奥芬妮·韦伯 , 杰西卡·哈姆里克 :
通过使用自我监督的世界模型进行规划进行程序概括。 ICLR公司 2022 【c5】 Ioannis Antonoglou公司 , 朱利安·施里特维瑟 , 谢尔吉尔·奥扎尔 , 托马斯·休伯特 , 大卫·西尔弗 :
使用学习模型在随机环境中进行规划。 ICLR公司 2022 【c4】 伊沃·达尼埃尔卡 , 阿瑟·盖兹 , 朱利安·施里特维瑟 , 大卫·西尔弗 :
通过与Gumbel的规划改进政策。 ICLR公司 2022 【c3】 芬巴尔木材 , 诺兰·巴德 , 爱德华·洛克哈特 , 马克·兰科特 , 马丁·施密德 , 尼尔·伯奇 , 朱利安·施里特维瑟 , 托马斯·休伯特 , 迈克尔·鲍林 :
近似可利用性:学习最佳响应。 国际JCAI 2022 : 3487-3493 [i12] 阿莫尔·曼德哈内 , 安东·哲尔诺夫 , 玛丽贝斯·劳赫 , 顾晨杰 , 王妙森 , 薛花 , 温迪·尚 , 德里克·庞 , 雷内·克劳斯 , 清汉江 , 程晨 , 韩静宁 , 陈安琪 , 丹尼尔·曼科维茨 , 杰克逊·布洛舍 , 朱利安·施里特维瑟 , 托马斯·休伯特 , Oriol葡萄酒 , 蒂莫西·曼恩 :
MuZero与VP9视频压缩中速率控制的自竞争。 CoRR公司 abs/2202.06626 ( 2022 ) [i11] 李宇佳 , 大卫·H·崔 , 钟俊英(Junyoung Chung) , 内特·库什曼 , 朱利安·施里特维瑟 , 雷米·勒布朗德 , 汤姆·埃克尔斯 , 詹姆斯·基林 , 菲利克斯·吉梅诺 , 阿古斯汀·达尔·拉戈 , 托马斯·休伯特 , 主笔蔡承业 , Cyprien de Masson d'Autume公司 , 伊戈尔·巴布什金 , 陈新云 , 黄伯森 , 约翰内斯·韦尔布尔 , 斯文·戈瓦尔 , 阿列克谢·切列帕诺夫 , 詹姆斯·莫洛伊 , 丹尼尔·曼科维茨 , 埃斯梅·萨瑟兰·罗布森 , Pushmet Kohli公司 , 南多·德·弗雷塔斯 , Koray Kavukcuoglu公司 , Oriol葡萄酒 :
使用AlphaCode生成竞争级代码。 CoRR公司 abs/2203.07814 ( 2022 ) 2021 【c2】 托马斯·休伯特 , 朱利安·施里特维瑟 , Ioannis Antonoglou公司 , 穆罕默德·巴雷卡坦 , 西蒙·施密特 , 大卫·西尔弗 :
复杂行动空间中的学习和规划。 ICML公司 2021 : 4476-4486 【c1】 朱利安·施里特维瑟 , 托马斯·休伯特 , 阿莫尔·曼德哈内 , 穆罕默德·巴雷卡坦 , Ioannis Antonoglou公司 , 大卫·西尔弗 :
通过学习模型规划进行在线和离线强化学习。 NeurIPS公司 2021 : 27580-27591 [i10] 朱利安·施里特维瑟 , 托马斯·休伯特 , 阿莫尔·曼德哈内 , 穆罕默德·巴雷卡坦 , Ioannis Antonoglou公司 , 大卫·西尔弗 :
通过学习模型规划进行在线和离线强化学习。 CoRR公司 abs/2104.06294 ( 2021 ) [第九章] 托马斯·休伯特 , 朱利安·施里特维瑟 , Ioannis Antonoglou公司 , 穆罕默德·巴雷卡坦 , 西蒙·施密特 , 大卫·西尔弗 :
复杂行动空间中的学习和规划。 CoRR公司 abs/2104.06303 ( 2021 ) [i8] 安克什·阿南德 , 雅各布·C·沃克 , 李亚哲 , Eszter Vértes公司 , 朱利安·施里特维瑟 , 谢尔吉尔·奥扎尔 , 塞奥帕恩·韦伯(Théophane Weber) , 杰西卡·哈姆里克 :
利用自我监督的世界模型通过规划进行程序概括。 CoRR公司 abs/2111.01587 ( 2021 ) 2020 [j3] 朱利安·施里特维瑟 , Ioannis Antonoglou公司 , 托马斯·休伯特 , 凯伦·西蒙扬 , 劳伦特·西弗雷 , 西蒙·施密特 , 阿瑟·盖兹 , 爱德华·洛克哈特 , 哈萨比斯 , 格雷佩尔 , 蒂莫西·利利克拉普 , 大卫·西尔弗 :
通过学习模型进行规划,掌握Atari、围棋、国际象棋和shogi。 国家。 588 ( 7839 ) : 604-609 ( 2020 ) [i7] 约斯特·托比亚斯·斯普林伯格 , 尼古拉斯·希斯 , 丹尼尔·曼科维茨 , 乔什·梅雷尔 , 阿伦库马尔·拜拉文 , 阿巴斯·阿卜杜勒马利基 , 杰基·凯 , 乔纳斯·迪格雷夫 , 朱利安·施里特维瑟 , 尤瓦尔·塔萨 , 乔纳斯·布赫利 , 丹·贝洛夫 , 马丁·里德米勒 :
连续控制中策略迭代的本地搜索。 CoRR公司 abs/2010.05545 ( 2020 )
2010 – 2019
2019 [i6] 马克·兰科特 , 爱德华·洛克哈特 , Jean-Baptiste Lespiau女士 , 维尼丘斯·弗洛雷斯·赞巴尔迪 , Satyaki Upadhyay公司 , 朱利安·佩罗拉 , 斯里拉姆·斯里尼瓦桑 , 芬巴尔木材 , 卡尔·图尔斯 , 沙耶根·奥米德沙维埃 , 丹尼尔·海恩斯 , 达斯汀·莫里尔 , 保罗·穆勒 , 蒂莫·埃瓦兹 , 瑞恩·福克纳 , 杰诺斯·克拉马尔 , 巴特·德·维尔德 , 布伦南·塞塔 , 詹姆斯·布拉德伯里 , 大卫·丁 , 塞巴斯蒂安·博尔盖乌德 , 马修·赖 , 朱利安·施里特维瑟 , 托马斯·安东尼 , 爱德华·休斯 , 伊沃·达尼埃尔卡 , 乔纳·瑞安·达维斯 :
OpenSpiel:游戏强化学习框架。 CoRR公司 abs/1908.09453 ( 2019 ) [i5] 朱利安·施里特维瑟 , Ioannis Antonoglou公司 , 托马斯·休伯特 , 凯伦·西蒙扬 , 劳伦特·西弗雷 , 西蒙·施密特 , 阿瑟·盖兹 , 爱德华·洛克哈特 , 哈萨比斯 , 格雷佩尔 , 蒂莫西·利利克拉普 , 大卫·西尔弗 :
通过学习模型进行规划,掌握雅达利、围棋、国际象棋和Shogi。 CoRR公司 腹肌/1911.08265 ( 2019 ) 2018 [i4] 陈玉田 , Aja Huang(黄亚佳) , 王子玉 , Ioannis Antonoglou公司 , 朱利安·施里特维瑟 , 大卫·西尔弗 , 南多·德·弗雷塔斯 :
AlphaGo中的贝叶斯优化。 CoRR公司 abs/1812.06855 ( 2018 ) 2017 [注2] 大卫·西尔弗 , 朱利安·施里特维瑟 , 凯伦·西蒙扬 , Ioannis Antonoglou公司 , Aja Huang(黄亚佳) , 阿瑟·盖兹 , 托马斯·休伯特 , 卢卡斯·贝克 , 马修·赖 , 阿德里安·博尔顿 , 陈玉田 , 蒂莫西·利利克拉普 , 范慧 , 劳伦特·西弗雷 , 乔治·范·登·德里斯(George van den Driessche) , 格雷佩尔 , 哈萨比斯 :
在没有人类知识的情况下掌握围棋游戏。 国家。 550 ( 7676 ) : 354-359 ( 2017 ) [i3] Oriol葡萄酒 , 蒂莫·埃瓦兹 , 谢尔盖·巴图诺夫 , 佩特科·乔治耶夫 , 亚历山大·萨沙·维日涅瓦茨 , 杨紫琼(Michelle Yeo) , Alireza Makhzani公司 , 海因里希·库特勒 , 约翰·阿加皮欧 , 朱利安·施里特维瑟 , 约翰·泉 , 斯蒂芬·加夫尼 , 斯蒂格·彼得森 , 凯伦·西蒙扬 , 汤姆·绍尔 , 哈多·范·哈塞尔特 , 大卫·西尔弗 , 蒂莫西·利利克拉普 , 凯文·卡尔德隆 , 保罗·基特 , 安东尼·布鲁纳索 , 大卫·劳伦斯 , 安德斯·埃克莫 , 雅各布·雷普 , Rodney Tsing公司 :
星际争霸II:强化学习的新挑战。 CoRR公司 abs/1708.04782 ( 2017 ) [i2] 大卫·西尔弗 , 托马斯·休伯特 , 朱利安·施里特维瑟 , Ioannis Antonoglou公司 , 马修·赖 , 阿瑟·盖兹 , 马克·兰科特 , 劳伦特·西弗雷 , 达山库马兰 , 格雷佩尔 , 蒂莫西·利利克拉普 , 凯伦·西蒙扬 , 哈萨比斯 :
使用通用强化学习算法通过自我游戏掌握国际象棋和Shogi。 CoRR公司 abs/1712.01815 ( 2017 ) 2016 [j1] 大卫·西尔弗 , Aja Huang(黄亚佳) , 克里斯·麦迪森 , 阿瑟·盖兹 , 劳伦特·西弗雷 , 乔治·范德德里什 , 朱利安·施里特维瑟 , Ioannis Antonoglou公司 , Vedavyas Panneershelvam公司 , 马克·兰科特 , 桑德·迪尔曼 , 多米尼克·格雷 , 约翰·纳姆 , 纳尔·卡尔克布伦纳 , 伊利亚·萨茨克沃 , 蒂莫西·利利克拉普 , 马德琳·利奇 , Koray Kavukcuoglu公司 , 格雷佩尔 , 哈萨比斯 :
通过深度神经网络和树搜索掌握围棋游戏。 国家。 529 ( 7587 ) : 484-489 ( 2016 ) [i1] 查尔斯·比蒂 , 乔尔·雷波 , 丹尼斯·特普利亚辛 , 汤姆·沃德 , 马库斯·温赖特 , 海因里希·库特勒 , 安德鲁·勒弗兰克 , 西蒙·格林 , 维克托·巴尔德斯 , 阿米尔·萨迪克 , 朱利安·施里特维瑟 , 基思·安德森 , 莎拉·约克 , 最大铁路超高 , 亚当·凯恩 , 阿德里安·博尔顿 , 斯蒂芬·加夫尼 , 海伦·金 , 哈萨比斯 , 谢恩·莱格 , 斯蒂格·彼得森 :
DeepMind实验室。 CoRR公司 abs/1612.03801 ( 2016 )