丹尼尔·富山
人员信息
优化列表
2020年–今天
2023 [i7] 米歇尔·马修 , 谢尔吉尔·奥扎尔 , 斯利瓦桑·斯里尼瓦桑 , 圣格雷 , 张尚通 , 雷·江 , 汤姆·勒潘恩 , 鲍威尔 , 康拉德·佐纳 , 朱利安·施里特维瑟 , 大卫·H·崔 , 佩特科·乔治耶夫 , 丹尼尔·富山 , Aja Huang(黄亚佳) , 罗马戒指 , 伊戈尔·巴布什金 , 蒂莫·埃瓦兹 , Mahyar Bordbar公司 , 萨拉亨德森 , 塞尔吉奥·戈梅斯·科尔梅纳雷霍 , 阿伦·范登·奥尔德 , Wojciech Marian Czarnecki公司 , 南多·德·弗雷塔斯 , Oriol葡萄酒 :
AlphaStar未插塞:大规模离线强化学习。 CoRR公司 abs/2308.03526 ( 2023 ) [i6] 阿巴斯·梅拉比安(Abbas Mehrabian) , 安基特·阿南德 , Hyunjik Kim先生 , 尼古拉斯·桑纳雷特 , 马特杰·巴洛格 , Gheorghe Comanici公司 , 都铎·贝拉鲁 , 安德鲁李 , 阿尼安·鲁斯 , 安娜·布拉诺娃 , 丹尼尔·富山 , 萨姆·布莱克威尔 , 贝纳迪诺·罗梅拉-佩雷斯 , 彼得·维利科维奇 , 劳伦特·奥尔索 , Joonkyung Lee(李俊京) , Anurag Murty Naredla公司 , Doina Precup公司 , 亚当·兹索尔·瓦格纳 :
使用AlphaZero和Tabu搜索查找越来越大的极值图。 CoRR公司 abs/2311.03583 ( 2023 ) 2022 [i5] Gheorghe Comanici公司 , 阿米莉亚·格莱斯 , 安妮塔·格格利 , 丹尼尔·富山 , 扎法拉利·艾哈迈德 , 泰勒·杰克逊 , 菲利普·哈默尔 , Doina Precup公司 :
学习如何使用分层强化学习与复杂界面交互。 CoRR公司 abs/2204.10374 ( 2022 ) 2021 [i4] 丹尼尔·富山 , 菲利普·哈默尔 , 安妮塔·格格利 , Gheorghe Comanici公司 , 阿米莉亚·格莱斯 , 扎法拉利·艾哈迈德 , 泰勒·杰克逊 , 希布尔·穆拉德 , Doina Precup公司 :
AndroidEnv:Android强化学习平台。 CoRR公司 abs/2105.13231 ( 2021 ) [i3] 安德烈·巴雷托 , 戴安娜·博萨 , 侯少波 , Gheorghe Comanici公司 , 埃塞尔·艾根 , 菲利普·哈默尔 , 丹尼尔·富山 , 乔纳森·亨特 , 希布尔·穆拉德 , 大卫·西尔弗 , Doina Precup公司 :
选项键盘:强化学习中的组合技巧。 CoRR公司 abs/2106.13105 ( 2021 ) [i2] 萨贝拉·拉莫斯 , 塞尔坦·吉尔金 , 莱昂纳德·侯赛诺 , 达米恩·文森特 , 汉娜·雅库波维奇 , 丹尼尔·富山 , 安妮塔·格格利 , 彼得·斯坦奇克 , 拉斐尔·马里尼尔 , 杰里米亚·哈姆森 , 奥利维尔·皮特金 , 尼古拉·蒙切夫 :
RLDS:在强化学习中生成、共享和使用数据集的生态系统。 CoRR公司 abs/2111.02767 ( 2021 ) [i1] 杰克·W·雷 , 塞巴斯蒂安·博尔盖乌德 , 特雷弗·蔡 , 凯蒂·米利坎 , 乔丹·霍夫曼 , H.弗朗西斯·宋 , 约翰·阿斯兰尼德斯 , 萨拉亨德森 , 罗马戒指 , 苏珊娜·杨 , 伊丽莎·卢瑟福 , 汤姆·亨尼根 , 雅各布·梅尼克 , 阿尔宾·卡西尔 , 鲍威尔 , 乔治·范·登·德里斯(George van den Driessche) , 丽莎·安妮·亨德里克斯 , 玛丽贝斯·劳赫 , 黄伯森 , 阿米莉亚·格莱斯 , 约翰内斯·韦尔布尔 , 苏曼特·达塔赫里 , 藏红花黄 , 乔纳森·尤萨托 , 约翰·梅勒 , 伊琳娜·希金斯 , 安东尼娅·克雷斯韦尔 , 纳特·麦克莱塞 , 艾米·吴 , 埃里希·埃尔森 , Siddhant M.Jayakumar先生 , 埃琳娜·布恰茨卡娅 , 大卫·布登 , 埃斯梅·萨瑟兰 , 凯伦·西蒙扬 , 米歇拉·帕格尼尼 , 劳伦特·西弗雷 , 莉娜·马滕斯 , 李向洛林 , Adhiguna Kuncoro公司 , 艾达·内马扎德 , 埃琳娜·格里博夫斯卡娅 , 多梅尼克·多纳托 , 安吉利基·拉扎里杜 , 阿瑟·门施 , Jean-Baptiste Lespiau女士 , 玛丽亚·齐姆波基利 , 尼古拉·格里戈列夫 , 道格·弗里茨 , Thibault Sottiaux公司 , 曼塔斯·帕贾斯卡斯 , 托比·波伦 , 龚志涛 , 丹尼尔·富山 , Cyprien de Masson d'Autume公司 , 李宇佳 , 泰富·特尔齐 , 弗拉基米尔·米库利克 , 伊戈尔·巴布什金 , 艾丹·克拉克 , 迭戈·德拉斯·卡萨斯 , 奥雷莉亚·盖伊 , 克里斯·琼斯 , 詹姆斯·布拉德伯里 , 马修·约翰逊 , 布莱克·赫奇曼 , 劳拉·魏丁格 , 艾森·加布里埃尔 , 艾萨克 , 爱德华·洛克哈特 , 西蒙·奥斯宾多 , 劳拉·里梅尔 , 克里斯·戴尔 , Oriol葡萄酒 , 卡里姆·阿尤布 , 杰夫·斯坦威 , 洛雷恩·贝内特 , 哈萨比斯 , 科雷·卡武科格鲁 , 杰弗里·欧文 :
缩放语言模型:来自训练地鼠的方法、分析和见解。 CoRR公司 abs/2112.11446 ( 2021 )