亚历克斯·雷
人员信息
优化列表
![笔记](https://dblp.org/img/note-mark.dark.12x12.png)
2020年–今天
2022 【c4】 龙欧阳 , 杰弗里·吴 , 徐江 , 迪奥戈·阿尔梅达 , 卡罗尔·L·温赖特 , 帕梅拉·米什金 , 张冲(Chong Zhang) , 桑迪尼·阿加瓦尔 , 卡塔琳娜·斯拉玛 , 亚历克斯·雷 , 约翰·舒尔曼 , 雅各布·希尔顿 , 弗雷泽凯尔顿 , 卢克·米勒 , 麦迪·西蒙斯 , 阿曼达·阿斯克尔 , 彼得·韦林德 , 保罗·F·克里斯蒂亚诺 , 简·雷克 , 瑞恩·洛维 :
训练语言模型,使其遵循带有人类反馈的指令。 NeurIPS公司 2022 [i8] 龙欧阳 , 吴建福 , 徐江 , 迪奥戈·阿尔梅达 , 卡罗尔·L·温赖特 , 帕梅拉·米什金 , 张冲(Chong Zhang) , 桑迪尼·阿加瓦尔 , 卡塔琳娜·斯拉玛 , 亚历克斯·雷 , 约翰·舒尔曼 , 雅各布·希尔顿 , 弗雷泽凯尔顿 , 卢克·米勒 , 麦迪·西蒙斯 , 阿曼达·阿斯克尔 , 彼得·韦林德 , 保罗·F·克里斯蒂亚诺 , 简·雷克 , 瑞恩·洛维 :
训练语言模型,使其遵循带有人类反馈的指令。 CoRR公司 abs/2203.02155 ( 2022 ) [i7] 阿罗希·斯利瓦斯塔瓦 , 阿比纳夫·拉斯托吉 , Abhishek Rao公司 , 阿布·阿瓦尔Md Shoeb , 阿布巴卡尔·阿比德 , 亚当·菲什 , 亚当·布朗 , 亚当·桑托罗 , 阿迪蒂亚·古普塔 , 阿德里亚·加里加·阿隆索 , 阿格涅斯卡·克鲁斯卡 , 艾托·卢科维茨 , 阿克沙特·阿加瓦尔 , 阿莱西亚·鲍尔 , 亚历克斯·雷 , 亚历克斯·沃斯塔特 , 亚历山大·科克里克 , 阿里·萨法亚 , 阿里·塔扎尔夫 , 艾丽斯·香 , 艾丽西娅·帕里什 , 阿伦·聂 , 阿曼·胡赛因 , 阿曼达·阿斯克尔 , 阿曼达·苏扎 , 阿梅特·拉哈内 , 阿南塔拉曼·伊耶 , 安德斯·安德烈亚森 , 安德烈亚·桑蒂利 , 安德烈亚斯·斯图尔穆勒 , 安德鲁·M·戴 , 安德鲁·拉 , 安德鲁·兰皮宁 , 安迪·邹 , 安吉拉·蒋 , 安吉莉卡·陈 , Anh Vuong公司 , 阿尼梅斯·古普塔 , 安娜·戈塔迪 , 安东尼奥·诺雷利 , Anu Venkatesh公司 , 阿拉什·戈拉马达武迪 , 阿尔法·塔巴瑟姆 , 阿鲁尔·梅内泽斯 , 阿伦·基鲁巴拉扬 , 阿谢尔·穆洛坎多夫 , 阿什什·萨巴瓦尔 , 奥斯汀·赫里克 , Avia Efrat公司 , 艾库特·埃尔登 , 艾拉·卡拉卡斯 , 等。 :
超越模仿游戏:量化和推断语言模型的能力。 CoRR公司 abs/2206.04615 ( 2022 ) 2021 [i6] 马克·陈 , 杰里·特沃雷克 , Heewoo Jun先生 , 袁启明 , 奥利维拉·平托(Henrique Pondéde Oliveira Pinto) , 贾里德·卡普兰 , 哈里森·爱德华兹 , 尤里·伯达 , 尼古拉斯·约瑟夫 , 格雷格·布罗克曼 , 亚历克斯·雷 , 劳尔·普里 , 格雷琴·克鲁格 , 迈克尔·彼得罗夫 , 海蒂·赫拉夫 , Girish Sastry女士 , 帕梅拉·米什金 , 布鲁克·陈 , 史考特·葛瑞 , 尼克·莱德 , 米哈伊尔·巴甫洛夫 , 阿莱西亚·鲍尔 , 卢卡斯·凯泽 , 穆罕默德·巴伐利亚 , 克莱门斯·温特 , 菲利普·蒂莱特 , Felipe Petroski如此 , 戴夫·卡明斯 , 马提亚斯·普拉佩特 , Fotios Chantzis公司 , 伊丽莎白·巴恩斯 , 阿里尔·赫伯特·沃斯 , 威廉·赫布根·格斯 , 亚历克斯·尼科尔 , 亚历克斯·潘诺 , 尼古拉斯·特扎克 , 杰唐 , 伊戈尔·巴布什金 , 苏奇尔·巴拉吉 , 山塔努耆那教 , 桑德斯 , 克里斯托弗·黑塞 , 安德鲁·卡尔 , 简·雷克 , 约书亚·阿齐姆 , Vedant Misra公司 , Evan Morikawa先生 , 亚历克·拉德福德 , 马修·奈特 , Miles Brundage公司 , 米拉·穆拉蒂 , 凯蒂·梅尔 , 彼得·韦林德 , 鲍勃·麦克格鲁 , 达里奥·阿莫迪 , 萨姆·麦肯迪什 , 伊利亚·萨茨克沃 , Wojciech Zaremba公司 :
评估经过代码培训的大型语言模型。 CoRR公司 腹肌/2107.03374 ( 2021 ) [i5] 杰西·迈克尔·韩 , 伊戈尔·巴布什金 , 哈里森·爱德华兹 , 阿尔文德·内拉坎坦 , 陶旭 , 斯坦尼斯拉斯·波罗 , 亚历克斯·雷 , 普拉纳夫·希亚姆 , 阿迪蒂亚·拉梅什 , 亚历克·拉德福德 , 伊利亚·萨茨克沃 :
仅使用生成语言模型的无监督神经机器翻译。 CoRR公司 腹肌/2110.05448 ( 2021 ) 2020 [j1] 马钦·安德里乔维奇 , 鲍文·贝克 , Maciek Chociej公司 , 拉斐尔·约泽福维奇 , 鲍勃·麦克格鲁 , 帕科奇 , 阿瑟·彼得龙 , 马提亚斯·普拉佩特 , 格伦·鲍威尔 , 亚历克斯·雷 , 乔纳斯·施耐德 , 西蒙·西多尔 , 乔什·托宾 , 彼得·韦林德 , 翁丽莲(Lilian Weng) , Wojciech Zaremba公司 :
学习灵巧的手操作。 国际机器人研究杂志。 39 ( 1 ) ( 2020 )
2010 – 2019
2018 【c3】 乔什·托宾 , 行官卢卡斯·波威德 , 段岩 , 马金·安德里霍维奇 , 安库尔·汉达 , 维卡什库马 , 鲍勃·麦克格鲁 , 亚历克斯·雷 , 乔纳斯·施耐德 , 彼得·韦林德 , Wojciech Zaremba公司 , 彼得·阿比尔 :
机器人抓取的领域随机化和生成模型。 IROS公司 2018 : 3482-3489 [i4] 马提亚斯·普拉佩特 , 马金·安德里霍维奇 , 亚历克斯·雷 , 鲍勃·麦克格鲁 , 鲍文·贝克 , 格伦·鲍威尔 , 乔纳斯·施耐德 , 乔什·托宾 , Maciek Chociej公司 , 彼得·韦林德 , 维卡什库马 , Wojciech Zaremba公司 :
多目标强化学习:挑战机器人环境和研究要求。 CoRR公司 abs/1802.09464 ( 2018 ) [i3] 开放人工智能 , 马钦·安德里乔维奇 , 鲍文·贝克 , Maciek Chociej公司 , 拉斐尔·约泽福维奇 , 鲍勃·麦克格鲁 , 帕科奇 , 阿瑟·彼得龙 , 马提亚斯·普拉佩特 , 格伦·鲍威尔 , 亚历克斯·雷 , 乔纳斯·施耐德 , 西蒙·西多尔 , 乔什·托宾 , 彼得·韦林德 , 翁丽莲(Lilian Weng) , Wojciech Zaremba公司 :
学习灵巧的双手操作。 CoRR公司 abs/1808.00177 ( 2018 ) 2017 【c2】 乔什·托宾 , 雷切尔·方 , 亚历克斯·雷 , 乔纳斯·施耐德 , Wojciech Zaremba公司 , 彼得·阿比尔 :
将深度神经网络从模拟传输到现实世界的域随机化。 IROS公司 2017 : 23-30 【c1】 马金·安德里霍维奇 , 德怀特·克劳 , 亚历克斯·雷 , 乔纳斯·施耐德 , 雷切尔·方 , 彼得·韦林德 , 鲍勃·麦克格鲁 , 乔什·托宾 , 彼得·阿比尔 , Wojciech Zaremba公司 :
后视体验重播。 NIPS公司 2017 : 5048-5058 [i2] 约书亚·托宾 , 雷切尔·方 , 亚历克斯·雷 , 乔纳斯·施耐德 , Wojciech Zaremba公司 , 彼得·阿比尔 :
将深度神经网络从模拟传输到真实世界的域随机化。 CoRR公司 abs/1703.06907 ( 2017 ) [i1] 马金·安德里霍维奇 , 菲利普·沃尔斯基 , 亚历克斯·雷 , 乔纳斯·施耐德 , 雷切尔·方 , 彼得·韦林德 , 鲍勃·麦克格鲁 , 乔什·托宾 , 彼得·阿比尔 , Wojciech Zaremba公司 :
事后体验回放。 CoRR公司 abs/1707.01495 ( 2017 )
合著者索引
![](https://dblp.org/img/cog.dark.24x24.png)