克里斯托弗·黑塞
人员信息
优化列表
2020年–今天
2021 [i10] 莎拉达·莫汉蒂 , Jyotish Poonganam(约提什·蓬加南) , 阿德里安·盖登 , 安德烈·科洛博夫 , 布莱克·沃尔夫 , Dipam Chakraborty公司 , Grazvydas Semetulskis公司 , 乔·夏普克 , 乔纳斯·库比利乌斯 , 尤吉斯·帕苏科尼斯 , 利纳斯·克里马斯 , 马修·霍斯克内克 , 帕特里克·麦克阿尔宾 , Quang Nhat Tran公司 , 托马斯·图米埃尔 , 小城汤 , 陈新伟(Xinwei Chen) , 克里斯托弗·黑塞 , 雅各布·希尔顿 , 威廉·赫布根·格斯 , Sahika基因 , 约翰·舒尔曼 , 卡尔·科布 :
衡量强化学习基准中的样本效率和泛化:NeurIPS 2020 Procgen基准。 CoRR公司 abs/2103.15332 ( 2021 ) [i9] 马克·陈 , 杰里·特沃雷克 , Heewoo Jun先生 , 袁启明 , 奥利维拉·平托(Henrique Pondéde Oliveira Pinto) , 贾里德·卡普兰 , 哈里森·爱德华兹 , 尤里·伯达 , 尼古拉斯·约瑟夫 , 格雷格·布罗克曼 , 亚历克斯·雷 , 劳尔·普里 , 格雷琴·克鲁格 , 迈克尔·彼得罗夫 , 海蒂·赫拉夫 , Girish Sastry女士 , 帕梅拉·米什金 , 布鲁克·陈 , 史考特·葛瑞 , 尼克·莱德 , 米哈伊尔·巴甫洛夫 , Alethea电源 , 卢卡斯·凯泽 , 穆罕默德·巴伐利亚 , 克莱门斯冬季 , 菲利普·蒂莱特 , Felipe Petroski如此 , 戴夫·卡明斯 , 马提亚斯·普拉佩特 , Fotios Chantzis公司 , 伊丽莎白·巴恩斯 , 阿里尔·赫伯特·沃斯 , 威廉·赫布根·格斯 , 亚历克斯·尼科尔 , 亚历克斯·佩诺 , 尼古拉斯·特扎克 , 杰唐 , 伊戈尔·巴布什金 , 苏奇尔·巴拉吉 , 山塔努耆那教 , 桑德斯 , 克里斯托弗·黑塞 , 安德鲁·卡尔 , 简·雷克 , 约书亚·阿齐姆 , Vedant Misra公司 , Evan Morikawa先生 , 亚历克·拉德福德 , 马修·奈特 , Miles Brundage公司 , 米拉·穆拉蒂 , 凯蒂·梅尔 , 彼得·韦林德 , 鲍勃·麦克格鲁 , 达里奥·阿莫迪 , 萨姆·麦肯迪什 , 伊利亚·萨茨克沃 , Wojciech Zaremba公司 :
评估经过代码培训的大型语言模型。 CoRR公司 abs/2107.03374 ( 2021 ) [i8] 卡尔·科布 , Vineet Kosaraju葡萄园 , 穆罕默德·巴伐利亚 , 马克·陈 , Heewoo Jun先生 , 卢卡斯·凯泽 , 马提亚斯·普拉佩特 , 杰里·特沃雷克 , 雅各布·希尔顿 , 中野惠一郎 , 克里斯托弗·黑塞 , 约翰·舒尔曼 :
培训验证人员解决数学单词问题。 CoRR公司 abs/2110.14168 ( 2021 ) [i7] 中野惠一郎 , 雅各布·希尔顿 , 苏奇尔·巴拉吉 , 吴建福 , 龙欧阳 , 金楚笼 , 克里斯托弗·黑塞 , 尚塔努·贾因 , Vineet Kosaraju葡萄园 , 桑德斯 , 徐江 , 卡尔·科布 , 泰娜·埃卢杜 , 格雷琴·克鲁格 , 凯文·巴顿 , 马修·奈特 , 本杰明国际象棋 , 约翰·舒尔曼 :
WebGPT:浏览器辅助的问题解答和人工反馈。 CoRR公司 abs/2112.09332 ( 2021 ) 2020 【c4】 卡尔·科布 , 克里斯托弗·黑塞 , 雅各布·希尔顿 , 约翰·舒尔曼 :
利用程序生成对强化学习进行基准测试。 ICML公司 2020 : 2048-2056 【c3】 汤姆·B·布朗 , 本杰明·曼 , 尼克·莱德 , 梅兰妮·苏比亚赫 , 贾里德·卡普兰 , 普拉福拉·达里瓦尔 , 阿尔文德·内拉坎坦 , 普拉纳夫·希亚姆 , Girish萨斯特里 , 阿曼达·阿斯克尔 , 桑迪尼·阿加瓦尔 , 阿里尔·赫伯特·沃斯 , 格雷琴·克鲁格 , 汤姆·海尼汉 , 重写子对象 , 阿迪蒂亚·拉梅什 , 丹尼尔·齐格勒 , 杰弗里·吴 , 克莱门斯·温特 , 克里斯托弗·黑塞 , 马克·陈 , 埃里克·西格勒 , 马特乌斯·利特温 , 史考特·葛瑞 , 本杰明国际象棋 , 杰克·克拉克 , 克里斯托弗·伯纳 , 萨姆·麦肯迪什 , 亚历克·拉德福德 , 伊利亚·萨茨克沃 , 达里奥·阿莫迪 :
语言模型是少数射击学习者。 NeurIPS公司 2020 【c2】 莎拉达·莫汉蒂 , Jyotish Poonganam(约提什·蓬加南) , 阿德里安·盖登 , 安德烈·科洛波夫 , 布莱克·沃尔夫 , Dipam Chakraborty公司 , Grazvydas Semetulskis公司 , 乔·夏普克 , 乔纳斯·库比利乌斯 , 尤吉斯·帕苏科尼斯 , 利纳斯·克里马斯 , 马修·霍斯克内克 , 帕特里克·麦克阿尔宾 , Quang Nhat Tran公司 , 托马斯·图米尔 , 小城汤 , 陈新伟(Xinwei Chen) , 克里斯托弗·黑塞 , 雅各布·希尔顿 , 威廉·赫布根·格斯 , Sahika基因 , 约翰·舒尔曼 , 卡尔·科布 :
测量强化学习基准中的样本效率和泛化:NeurIPS 2020 Procgen基准。 NeurIPS(竞争和演示) 2020 : 361-395 [i6] 汤姆·B·布朗 , 本杰明·曼 , 尼克·莱德 , 梅兰妮·苏比亚赫 , 贾里德·卡普兰 , 普拉福拉·达里瓦尔 , 阿尔文德·内拉坎坦 , 普拉纳夫·希亚姆 , Girish Sastry女士 , 阿曼达·阿斯克尔 , 桑迪尼·阿加瓦尔 , 阿里尔·赫伯特·沃斯 , 格雷琴·克鲁格 , 汤姆·海尼汉 , 重写子对象 , 阿迪蒂亚·拉梅什 , 丹尼尔·齐格勒 , 杰弗里·吴 , 克莱门斯·温特 , 克里斯托弗·黑塞 , 马克·陈 , 埃里克·西格勒 , 马特乌斯·利特温 , 史考特·葛瑞 , 本杰明国际象棋 , 杰克·克拉克 , 克里斯托弗·伯纳 , 萨姆·麦肯迪什 , 亚历克·拉德福德 , 伊利亚·萨茨克沃 , 达里奥·阿莫迪 :
语言模型是少数快速学习者。 CoRR公司 abs/2005.14165 ( 2020 ) [i5] 汤姆·海尼汉 , 贾里德·卡普兰 , 莫尔·卡茨 , 马克·陈 , 克里斯托弗·黑塞 , 雅各布·杰克逊 , Heewoo Jun先生 , 汤姆·B·布朗 , 普拉福拉·达里瓦尔 , 史考特·葛瑞 , 克里斯·哈莱西 , 本杰明·曼 , 亚历克·拉德福德 , 阿迪蒂亚·拉梅什 , 尼克·莱德 , 丹尼尔·齐格勒 , 约翰·舒尔曼 , 达里奥·阿莫迪 , 萨姆·麦肯迪什 :
自回归生成模型的缩放律。 CoRR公司 abs/2010.14701 ( 2020 )
2010 – 2019
2019 【c1】 卡尔·科布 , 奥列格·克里莫夫 , 克里斯托弗·黑塞 , Taehoon Kim公司 , 约翰·舒尔曼 :
强化学习中的量化泛化。 ICML公司 2019 : 1282-1289 [i4] 卡尔·科布 , 克里斯托弗·黑塞 , 雅各布·希尔顿 , 约翰·舒尔曼 :
利用程序生成对强化学习进行基准测试。 CoRR公司 abs/1912.01588 ( 2019 ) [i3] 克里斯托弗·伯纳 , 格雷格·布罗克曼 , 布鲁克·陈 , 张维琪(Vicki Cheung) , Przemyslaw Debiak公司 , 克里斯蒂·丹尼森 , 大卫·法希 , 奎林·费舍尔 , Shariq Hashme公司 , 克里斯托弗·黑塞 , 拉斐尔·约泽福维奇 , 史考特·葛瑞 , 凯瑟琳·奥尔森 , 帕科奇 , 迈克尔·彼得罗夫 , 奥利维拉·平托(Henrique Pondéde Oliveira Pinto) , 乔纳森·雷曼 , 蒂姆·萨利曼斯 , 杰里米·施拉特 , 乔纳斯·施耐德 , 西蒙·西多尔 , 伊利亚·萨斯克弗 , 杰唐 , 菲利普·沃尔斯基 , 张山 :
Dota 2与大规模深度强化学习。 CoRR公司 abs/1912.06680 ( 2019 ) 2018 [i2] 亚历克斯·尼科尔 , Vicki Pfau女士 , 克里斯托弗·黑塞 , 奥列格·克里莫夫 , 约翰·舒尔曼 :
必须快速学习:RL推广的新基准。 CoRR公司 abs/1804.03720 ( 2018 ) [i1] 卡尔·科布 , 奥列格·克里莫夫 , 克里斯托弗·黑塞 , Taehoon Kim公司 , 约翰·舒尔曼 :
强化学习中的量化泛化。 CoRR公司 abs/1812.02341 ( 2018 )