威廉·H·格斯
人员信息
其他同名人员
SPARQL查询
优化列表
2020年–今天
2021 [i13] 威廉·H·格斯 , 马里奥·伊诺森特·卡斯特罗 , 萨姆·德夫林 , 布兰登·霍顿 , Noboru肖恩·库诺 , 克里斯曼·卢米斯 , 斯蒂芬妮·米拉尼 , 莎拉达·莫汉蒂 , 中田圭介 , 鲁斯兰·萨拉库丁诺夫 , 约翰·舒尔曼 , Shinya Shiroshita先生 , 尼古拉·托宾 , 阿维纳什·乌马迪辛古 , Oriol葡萄酒 :
MineRL 2020利用人类先验进行样本高效强化学习竞赛。 CoRR公司 腹肌/2101.11071 ( 2021 ) [i12] 莎拉达·莫汉蒂 , Jyotish Poonganam(约提什·蓬加南) , 阿德里安·盖登 , 安德烈·科洛波夫 , 布莱克·沃尔夫 , Dipam Chakraborty公司 , Grazvydas Semetulskis公司 , 乔·夏普克 , 乔纳斯·库比利乌斯 , 尤吉斯·帕苏科尼斯 , 利纳斯·克里马斯 , 马修·霍斯克内克 , 帕特里克·麦克阿尔宾 , Quang Nhat Tran公司 , 托马斯·图米埃尔 , 小城汤 , 陈新伟(Xinwei Chen) , 克里斯托弗·黑塞 , 雅各布·希尔顿 , 威廉·赫布根·格斯 , Sahika基因 , 约翰·舒尔曼 , 卡尔·科布 :
测量强化学习基准中的样本效率和泛化:NeurIPS 2020 Procgen基准。 CoRR公司 abs/2103.15332 ( 2021 ) [i11] 威廉·赫布根·格斯 , 斯蒂芬妮·米拉尼 , 尼古拉·托宾 , 布兰登·霍顿 , 莎拉达·莫汉蒂 , 安德鲁·梅尔尼克 , 奥古斯汀·哈特 , Benoit Buschmas公司 , 比亚恩·贾斯特 , 克里斯托夫·贝甘斯基 , 丹尼斯·海特坎普 , 马尔科·亨宁 , 海尔格·J·里特 , 吴成杰 , 郝晓天 , 陆一鸣 , 航宇毛 , 毛一欢 , 王超(Chao Wang) , 米查尔·奥帕诺维奇 , 安西·卡内维斯托 , 亚尼克·施拉纳 , 克里斯蒂安·谢勒 , 周锡仁 , 陆柳 , Daichi Nishio公司 , Toi Tsuneda公司 , 卡洛里斯·拉马诺斯卡斯 , 加比亚·朱塞维尤特 :
走向稳健和领域不可知的强化学习竞赛。 CoRR公司 abs/2106.03748 ( 2021 ) [i10] 英格玛·卡尼切德 , 乔斯特·惠津加 , 大卫·法希 , 威廉·赫布根·格斯 , 布兰登·霍顿 , 劳尔·桑佩德罗 , 彼得·霍霍夫 , 鲍文·贝克 , 阿德里安·埃科菲 , 杰唐 , 奥列格·克里莫夫 , 杰夫·克伦 :
在一个复杂、可视化、硬勘探领域的多任务课程学习:Minecraft。 CoRR公司 abs/2106.14876 ( 2021 ) [第九章] 罗欣·沙阿 , 科迪·威尔德 , 史蒂芬·H·王 , 内尔·亚历克斯 , 布兰登·霍顿 , 威廉·H·格斯 , 莎拉达·莫汉蒂 , 安西·卡内维斯托 , 斯蒂芬妮·米拉尼 , 尼古拉·托宾 , 彼得·阿比尔 , 斯图尔特·罗素 , 安卡·D·德拉甘 :
MineRL BASALT从人类反馈中学习竞赛。 CoRR公司 abs/2107.01969 ( 2021 ) [i8] 马克·陈 , 杰里·特沃雷克 , Heewoo Jun先生 , 袁启明 , 奥利维拉·平托(Henrique Pondéde Oliveira Pinto) , 贾里德·卡普兰 , 哈里·爱德华兹 , 尤里·伯达 , 尼古拉斯·约瑟夫 , 格雷格·布罗克曼 , 亚历克斯·雷 , 劳尔·普里 , 格雷琴·克鲁格 , 迈克尔·彼得罗夫 , 海蒂·赫拉夫 , Girish Sastry女士 , 帕梅拉·米什金 , 布鲁克·陈 , 史考特·葛瑞 , 尼克·赖德 , 米哈伊尔·巴甫洛夫 , 阿莱西亚·鲍尔 , 卢卡斯·凯泽 , 穆罕默德·巴伐利亚 , 克莱门斯·温特 , 菲利普·蒂莱特 , Felipe Petroski如此 , 戴夫·卡明斯 , 马提亚斯·普拉佩特 , Fotios Chantzis公司 , 伊丽莎白·巴恩斯 , 阿里尔·赫伯特·沃斯 , 威廉·赫布根·格斯 , 亚历克斯·尼科尔 , 亚历克斯·佩诺 , 尼古拉斯·特扎克 , 杰唐 , 伊戈尔·巴布什金 , 苏奇尔·巴拉吉 , 山塔努耆那教 , 桑德斯 , 克里斯托弗·黑塞 , 安德鲁·卡尔 , 简·雷克 , 约书亚·阿齐姆 , Vedant Misra公司 , Evan Morikawa先生 , 亚历克·拉德福德 , 马修·奈特 , Miles Brundage公司 , 米拉·穆拉蒂 , 凯蒂·梅尔 , 彼得·韦林德 , 鲍勃·麦克格鲁 , 达里奥·阿莫迪 , 萨姆·麦肯迪什 , 伊利亚·萨茨克沃 , Wojciech Zaremba公司 :
评估经过代码培训的大型语言模型。 CoRR公司 abs/2107.03374 ( 2021 ) 2020 【c4】 威廉·赫布根·格斯 , 斯蒂芬妮·米拉尼 , 尼古拉·托宾 , 布兰登·霍顿 , 莎拉达·莫汉蒂 , 安德鲁·梅尔尼克 , 奥古斯丁·哈特 , Benoit Buschmas公司 , 比亚恩·贾斯特 , 克里斯托夫·贝甘斯基 , 丹尼斯·海特坎普 , 马克·亨宁 , 海尔格·J·里特 , 吴成杰 , 郝晓天 , 陆一鸣 , 航宇毛 , 毛一欢 , 王超(Chao Wang) , 米查尔·奥帕诺维奇 , 安西·卡内维斯托 , 亚尼克·施拉纳 , 克里斯蒂安·谢勒 , 周锡仁 , 刘璐 , Daichi Nishio公司 , Toi Tsuneda公司 , 卡洛里斯·拉马诺斯卡斯 , 朱塞维丘特 :
走向稳健和领域无关的强化学习竞赛:MineRL 2020。 NeurIPS(竞争和演示) 2020 : 233-252 【c3】 莎拉达·莫汉蒂 , Jyotish Poonganam(约提什·蓬加南) , 阿德里安·盖登 , 安德烈·科洛波夫 , 布莱克·沃尔夫 , Dipam Chakraborty公司 , Grazvydas Semetulskis公司 , 乔·夏普克 , 乔纳斯·库比利乌斯 , 尤吉斯·帕苏科尼斯 , 利纳斯·克里马斯 , 马修·霍斯克内克 , 帕特里克·麦克阿尔宾 , Quang Nhat Tran公司 , 托马斯·图米埃尔 , 小城汤 , 陈新伟 , 克里斯托弗·黑塞 , 雅各布·希尔顿 , 威廉·赫布根·格斯 , Sahika基因 , 约翰·舒尔曼 , 卡尔·科布 :
测量强化学习基准中的样本效率和泛化:NeurIPS 2020 Procgen基准。 NeurIPS(竞争和演示) 2020 : 361-395 [i7] 斯蒂芬妮·米拉尼 , 尼古拉·托宾 , 布兰登·霍顿 , 威廉·H·格斯 , 莎拉达·莫汉蒂 , 中田圭介 , Oriol葡萄酒 , Noboru肖恩·库诺 :
2019年MineRL关于样本有效强化学习竞赛的回顾性分析。 CoRR公司 abs/2003.05012 ( 2020 ) [i6] 布兰登·霍顿 , 斯蒂芬妮·米拉尼 , 尼古拉·托宾 , 威廉·H·格斯 , 卡贾·霍夫曼 , 迭戈·佩雷斯·利巴纳 , 曼勒·维罗索 , 鲁斯兰·萨拉库丁诺夫 :
保证深度学习竞赛的再现性。 CoRR公司 abs/2005.06041 ( 2020 )
2010 – 2019
2019 【c2】 威廉·H·格斯 , 布兰登·霍顿 , 尼古拉·托宾 , 菲利普·王 , 凯登·卡德尔 , 曼勒·维罗索 , 鲁斯兰·萨拉库丁诺夫 :
MineRL:一个大型采矿工艺演示数据集。 国际JCAI 2019 : 2442-2448 【c1】 斯蒂芬妮·米拉尼 , 尼古拉·托宾 , 布兰登·霍顿 , 威廉·H·格斯 , 莎拉达·莫汉蒂 , 中田圭介 , Oriol葡萄酒 , Noboru肖恩·库诺 :
2019年MineRL样本高效强化学习竞赛回顾性分析。 NeurIPS(竞争和演示) 2019 : 203-214 [i5] 威廉·H·格斯 , 凯登·卡德尔 , 卡贾·霍夫曼 , 布兰登·霍顿 , 诺布鲁·库诺 , 斯蒂芬妮·米拉尼 , 莎拉达·莫汉蒂 , 迭戈·佩雷斯·利巴纳 , 鲁斯兰·萨拉库丁诺夫 , 尼古拉·托宾 , 曼勒·维罗索 , 菲利普·王 :
利用人类先验知识进行样本高效强化学习的MineRL竞赛。 CoRR公司 abs/1904.10079 ( 2019 ) [i4] 威廉·H·格斯 , 布兰登·霍顿 , 尼古拉·托宾 , 菲利普·王 , 凯登·卡德尔 , 曼勒·维罗索 , 鲁斯兰·萨拉库丁诺夫 :
MineRL:一个大型采矿工艺演示数据集。 CoRR公司 abs/1907.13440 ( 2019 ) [i3] 威廉·H·格斯 , 鲁斯兰·萨拉库丁诺夫 :
关于无限维映射逼近的一致保证神经网络的普适逼近。 CoRR公司 abs/1910.01545 ( 2019 ) 2018 [i2] 威廉·H·格斯 , 鲁斯兰·萨拉库丁诺夫 :
用代数拓扑表征神经网络的容量。 CoRR公司 abs/1802.04443 ( 2018 ) 2016 [i1] 威廉·H·格斯 :
深函数机器:拓扑层表达的广义神经网络。 CoRR公司 abs/1612.04799 ( 2016 )