托马斯·休伯特
人员信息
其他同名人员
SPARQL查询
优化列表
2020年–今天
2023 【j4】 丹尼尔·曼科维茨 , 安德烈亚·米奇 , 安东·哲尔诺夫 , 马可·盖尔米 , 马可·塞尔维 , 科斯敏·帕杜拉鲁 , 爱德华·勒伦特 , 谢里克·伊克巴尔 , Jean-Baptiste Lespiau女士 , 亚历克斯·埃亨 , 托马斯·科普 , 凯文·米利金 , 斯蒂芬·加夫尼 , 索菲·埃尔斯特 , 杰克逊·布洛舍 , 克里斯·甘布尔 , 基兰米兰 , 罗伯特·东 , 黄敏杰 , A.塔兰·杰吉尔 , 穆罕默德·巴雷卡坦 , 李宇佳 , 阿莫尔·曼丹 , 托马斯·休伯特 , 朱利安·施里特维泽 , 哈萨比斯 , Pushmet Kohli公司 , 马丁·里德米勒 , Oriol葡萄酒 , 大卫·西尔弗 :
使用深度强化学习发现的更快的排序算法。 国家。 618 ( 7964 ) : 257-263 ( 2023 ) [i8] 王鹏明 , 米基塔·萨扎诺维奇 , 贝尔金·伊尔贝伊 , Phitchaya Mangpo Phothilimthana公司 , Manish Purohit公司 , 汉阳泰 , Ngan Vu村 , 王妙森 , 科斯敏·帕杜拉鲁 , 爱德华·勒伦特 , 安东·哲尔诺夫 , 朱利安·施里特维泽 , 托马斯·休伯特 , 罗伯特·东 , 保拉·库雷洛维奇 , 基兰米兰 , Oriol葡萄酒 , 丹尼尔·曼科维茨 :
使用深度强化学习优化记忆映射。 CoRR公司 abs/2305.07440 ( 2023 ) 2022 [j3] 阿尔胡塞因·法齐 , 马特杰·巴洛格 , Aja Huang(黄亚佳) , 托马斯·休伯特 , 贝纳迪诺·罗梅拉-佩雷斯 , 穆罕默德·巴雷卡坦 , 亚历山大·诺维科夫 , 弗朗西斯科·鲁伊斯 , 朱利安·施里特维泽 , Grzegorz Swirszcz公司 , 大卫·西尔弗 , 哈萨比斯 , Pushmet Kohli公司 :
通过强化学习发现更快的矩阵乘法算法。 国家。 610 ( 7930 ) : 47-53 ( 2022 ) 【c5】 Ioannis Antonoglou公司 , 朱利安·施里特维泽 , 谢尔吉尔·奥扎尔 , 托马斯·休伯特 , 大卫·西尔弗 :
使用学习模型在随机环境中进行规划。 ICLR公司 2022 【c4】 芬巴尔木材 , 诺兰·巴德 , 爱德华·洛克哈特 , 马克·兰科特 , 马丁·施密德 , 尼尔·伯奇 , 朱利安·施里特维泽 , 托马斯·休伯特 , 迈克尔·鲍林 :
近似可利用性:学习最佳响应。 国际JCAI 2022 : 3487-3493 [i7] 阿莫尔·曼德哈内 , 安东·哲尔诺夫 , 玛丽贝斯·劳赫 , 顾晨杰 , 王妙森 , 薛花 , 温迪·尚 , Derek Pang(德里克·庞) , 雷内·克劳斯 , 清汉江 , 程晨 , 韩静宁 , 陈安琪 , 丹尼尔·曼科维茨 , 杰克逊·布洛舍 , 朱利安·施里特维泽 , 托马斯·休伯特 , Oriol葡萄酒 , 蒂莫西·曼恩 :
MuZero与VP9视频压缩中速率控制的自竞争。 CoRR公司 abs/2202.06626 ( 2022 ) [i6] 李宇佳 , 大卫·H·崔 , 钟俊英(Junyoung Chung) , 内特·库什曼 , 朱利安·施里特维泽 , 雷米·勒布朗德 , 汤姆·埃克尔斯 , 詹姆斯·基林 , 菲利克斯·吉梅诺 , 阿古斯汀·达尔·拉戈 , 托马斯·休伯特 , 主笔蔡承业 , Cyprien de Masson d'Autume公司 , 伊戈尔·巴布什金 , 陈新云 , 黄伯森 , 约翰内斯·韦尔布尔 , 斯文·戈瓦尔 , 阿列克谢·切列帕诺夫 , 詹姆斯·莫洛伊 , 丹尼尔·曼科维茨 , 埃斯梅·萨瑟兰·罗布森 , Pushmet Kohli公司 , 南多·德·弗雷塔斯 , 科雷·卡武科格鲁 , Oriol葡萄酒 :
使用AlphaCode生成竞争级代码。 CoRR公司 abs/2203.07814 ( 2022 ) 2021 【c3】 托马斯·休伯特 , 朱利安·施里特维泽 , Ioannis Antonoglou公司 , 穆罕默德·巴雷卡坦 , 西蒙·施密特 , 大卫·西尔弗 :
复杂行动空间中的学习和规划。 ICML公司 2021 : 4476-4486 【c2】 朱利安·施里特维泽 , 托马斯·休伯特 , 阿莫尔·曼德哈内 , 穆罕默德·巴雷卡坦 , Ioannis Antonoglou公司 , 大卫·西尔弗 :
通过学习模型规划进行在线和离线强化学习。 NeurIPS公司 2021 : 27580-27591 [i5] 朱利安·施里特维泽 , 托马斯·休伯特 , 阿莫尔·曼德哈内 , 穆罕默德·巴雷卡坦 , Ioannis Antonoglou公司 , 大卫·西尔弗 :
通过学习模型规划进行在线和离线强化学习。 CoRR公司 abs/2104.06294 ( 2021 ) [i4] 托马斯·休伯特 , 朱利安·施里特维泽 , Ioannis Antonoglou公司 , 穆罕默德·巴雷卡坦 , 西蒙·施密特 , 大卫·西尔弗 :
复杂行动空间中的学习和规划。 CoRR公司 腹肌/2104.06303 ( 2021 ) 2020 [注2] 朱利安·施里特维泽 , Ioannis Antonoglou公司 , 托马斯·休伯特 , 凯伦·西蒙扬 , 劳伦特·西弗雷 , 西蒙·施密特 , 阿瑟·盖兹 , 爱德华·洛克哈特 , 哈萨比斯 , 格雷佩尔 , 蒂莫西·利利克拉普 , 大卫·西尔弗 :
通过学习模型进行规划,掌握Atari、围棋、国际象棋和shogi。 国家。 588 ( 7839 ) : 604-609 ( 2020 ) 【c1】 Jean-Bastien烧烤 , 佛罗伦特·阿尔奇 , 汤云浩 , 托马斯·休伯特 , 米查尔·瓦尔科 , Ioannis Antonoglou公司 , 雷米·穆诺斯 :
蒙特卡罗树搜索作为正则化策略优化。 ICML公司 2020 : 3769-3778 [i3] Jean-Bastien烧烤 , 佛罗伦特·阿尔奇 , 汤云浩 , 托马斯·休伯特 , 米查尔·瓦尔科 , Ioannis Antonoglou公司 , 雷米·穆诺斯 :
蒙特卡罗树搜索作为正则化策略优化。 CoRR公司 abs/2007.12509 ( 2020 )
2010 – 2019
2019 [i2] 朱利安·施里特维泽 , Ioannis Antonoglou公司 , 托马斯·休伯特 , 凯伦·西蒙扬 , 劳伦特·西弗雷 , 西蒙·施密特 , 亚瑟·盖兹 , 爱德华·洛克哈特 , 哈萨比斯 , 格雷佩尔 , 蒂莫西·利利克拉普 , 大卫·西尔弗 :
通过学习模型进行规划,掌握雅达利、围棋、国际象棋和Shogi。 CoRR公司 abs/1911.08265 ( 2019 ) 2017 [j1] 大卫·西尔弗 , 朱利安·施里特维泽 , 凯伦·西蒙扬 , Ioannis Antonoglou公司 , Aja Huang(黄亚佳) , 阿瑟·盖兹 , 托马斯·休伯特 , 卢卡斯·贝克 , 马修·赖 , 阿德里安·博尔顿 , 陈玉田 , 蒂莫西·利利克拉普 , 范慧 , 劳伦特·西弗雷 , 乔治·范·登·德里斯(George van den Driessche) , 格雷佩尔 , 哈萨比斯 :
在没有人类知识的情况下掌握围棋游戏。 国家。 550 ( 7676 ) : 354-359 ( 2017 ) [i1] 大卫·西尔弗 , 托马斯·休伯特 , 朱利安·施里特维泽 , Ioannis Antonoglou公司 , 马修·赖 , 阿瑟·盖兹 , 马克·兰科特 , 劳伦特·西弗雷 , 达山库马兰 , 格雷佩尔 , 蒂莫西·利利克拉普 , 凯伦·西蒙扬 , 哈萨比斯 :
使用通用强化学习算法通过自我游戏掌握国际象棋和Shogi。 CoRR公司 abs/1712.01815 ( 2017 )