卡尔·科布
人员信息
SPARQL查询
优化列表
2020年–今天
2024 【c6】 亨特·莱特曼 , Vineet Kosaraju葡萄园 , 尤里·伯达 , 哈里森·爱德华兹 , 鲍文·贝克 , 泰迪·李 , 简·雷克 , 约翰·舒尔曼 , 伊利亚·萨茨克沃 , 卡尔·科布 :
让我们逐步验证。 ICLR公司 2024 2023 [i8] 亨特·莱特曼 , Vineet Kosaraju葡萄园 , 尤拉·伯达 , 哈里·爱德华兹 , 鲍文·贝克 , 泰迪·李 , 简·雷克 , 约翰·舒尔曼 , 伊利亚·萨茨克沃 , 卡尔·科布 :
让我们逐步验证。 CoRR公司 abs/2305.20050 ( 2023 ) 2022 【c5】 雅各布·希尔顿 , 卡尔·科布 , 约翰·舒尔曼 :
批量大小差异用于策略优化。 NeurIPS公司 2022 2021 【c4】 卡尔·科布 , 雅各布·希尔顿 , 奥列格·克里莫夫 , 约翰·舒尔曼 :
阶段性政策梯度。 ICML公司 2021 : 2020-2027 [i7] 莎拉达·莫汉蒂 , Jyotish Poonganam(约提什·蓬加南) , 阿德里安·盖登 , 安德烈·科洛波夫 , 布莱克·沃尔夫 , Dipam Chakraborty公司 , 格拉兹维达斯·塞梅图尔斯基 , 乔·夏普克 , 乔纳斯·库比利乌斯 , 尤吉斯·帕苏科尼斯 , 利纳斯·克里马斯 , 马修·霍斯克内克 , 帕特里克·麦克阿尔派 , Quang Nhat Tran公司 , 托马斯·图米埃尔 , 小城汤 , 陈新伟(Xinwei Chen) , 克里斯托弗·黑塞 , 雅各布·希尔顿 , 威廉·赫布根·格斯 , Sahika基因 , 约翰·舒尔曼 , 卡尔·科布 :
测量强化学习基准中的样本效率和泛化:NeurIPS 2020 Procgen基准。 CoRR公司 abs/2103.15332 ( 2021 ) [i6] 雅各布·希尔顿 , 卡尔·科布 , 约翰·舒尔曼 :
批量大小差异用于策略优化。 CoRR公司 abs/2110.00641 ( 2021 ) [i5] 卡尔·科布 , Vineet Kosaraju葡萄园 , 穆罕默德·巴伐利亚 , 马克·陈 , Heewoo Jun先生 , 卢卡斯·凯撒 , 马提亚斯·普拉佩特 , 杰里·特沃雷克 , 雅各布·希尔顿 , 中野惠一郎 , 克里斯托弗·黑塞 , 约翰·舒尔曼 :
培训验证人员解决数学单词问题。 CoRR公司 abs/2110.14168 ( 2021 ) [i4] 中野惠一郎 , 雅各布·希尔顿 , 苏奇尔·巴拉吉 , 吴建福 , 龙欧阳 , 金楚笼 , 克里斯托弗·黑塞 , 山塔努耆那教 , Vineet Kosaraju葡萄园 , 桑德斯 , 徐江 , 卡尔·科布 , 泰娜·埃卢杜 , 格雷琴·克鲁格 , 凯文·巴顿 , 马修·奈特 , 本杰明国际象棋 , 约翰·舒尔曼 :
WebGPT:浏览器辅助的问题解答和人工反馈。 CoRR公司 abs/2112.09332 ( 2021 ) 2020 【c3】 卡尔·科布 , 克里斯托弗·黑塞 , 雅各布·希尔顿 , 约翰·舒尔曼 :
利用程序生成对强化学习进行基准测试。 ICML公司 2020 : 2048-2056 【c2】 莎拉达·莫汉蒂 , Jyotish Poonganam(约提什·蓬加南) , 阿德里安·盖登 , 安德烈·科洛波夫 , 布莱克·沃尔夫 , Dipam Chakraborty公司 , Grazvydas Semetulskis公司 , 若昂·沙普克 , 乔纳斯·库比利乌斯 , 尤尔吉斯·帕苏科尼斯 , 利纳斯·克里马斯 , 马修·霍斯克内克 , 帕特里克·麦克阿尔宾 , 广芽庄 , 托马斯·图米埃尔 , 小城汤 , 陈新伟(Xinwei Chen) , 克里斯托弗·黑塞 , 雅各布·希尔顿 , 威廉·赫布根·格斯 , Sahika基因 , 约翰·舒尔曼 , 卡尔·科布 :
测量强化学习基准中的样本效率和泛化:NeurIPS 2020 Procgen基准。 NeurIPS(竞争和演示) 2020 : 361-395 [i3] 卡尔·科布 , 雅各布·希尔顿 , 奥列格·克里莫夫 , 约翰·舒尔曼 :
阶段性政策梯度。 CoRR公司 abs/2009.04416 ( 2020 )
2010 – 2019
2019 【c1】 卡尔·科布 , 奥列格·克里莫夫 , 克里斯托弗·黑塞 , 金泰勋 , 约翰·舒尔曼 :
强化学习中的量化泛化。 ICML公司 2019 : 1282-1289 [i2] 卡尔·科布 , 克里斯托弗·黑塞 , 雅各布·希尔顿 , 约翰·舒尔曼 :
利用程序生成对强化学习进行基准测试。 CoRR公司 abs/1912.01588 ( 2019 ) 2018 [i1] 卡尔·科布 , 奥列格·克里莫夫 , 克里斯托弗·黑塞 , Taehoon Kim公司 , 约翰·舒尔曼 :
强化学习中的量化泛化。 CoRR公司 abs/1812.02341 ( 2018 )