龙欧阳
人员信息
其他同名人员
SPARQL查询
优化列表
2020年–今天
2022 【c5】 龙欧阳 , 杰弗里·吴 , 徐江 , 迪奥戈·阿尔梅达 , 卡罗尔·L·温赖特 , 帕梅拉·米什金 , 张冲(Chong Zhang) , 桑迪尼·阿加瓦尔 , 卡塔琳娜·斯拉玛 , 亚历克斯·雷 , 约翰·舒尔曼 , 雅各布·希尔顿 , 弗雷泽凯尔顿 , 卢克·米勒 , 麦迪·西蒙斯 , 阿曼达·阿斯克尔 , 彼得·韦林德 , 保罗·F·克里斯蒂亚诺 , 简·雷克 , 瑞恩·洛维 :
训练语言模型,使其遵循带有人类反馈的指令。 NeurIPS公司 2022 [i8] 龙欧阳 , 吴建福 , 徐江 , 迪奥戈·阿尔梅达 , 卡罗尔·L·温赖特 , 帕梅拉·米什金 , 张冲(Chong Zhang) , 桑迪尼·阿加瓦尔 , 卡塔琳娜·斯拉玛 , 亚历克斯·雷 , 约翰·舒尔曼 , 雅各布·希尔顿 , 弗雷泽凯尔顿 , 卢克·米勒 , 麦迪·西蒙斯 , 阿曼达·阿斯克尔 , 彼得·韦林德 , 保罗·F·克里斯蒂亚诺 , 简·雷克 , 瑞恩·洛维 :
训练语言模型,使其遵循带有人类反馈的指令。 CoRR公司 abs/2203.02155 ( 2022 ) [i7] 桑德斯 , 凯瑟琳·叶 , 吴建福 , 史蒂文·比尔 , 龙欧阳 , 乔纳森·沃德 , 简·雷克 :
帮助人类评估者的自我批评模型。 CoRR公司 腹肌/2206.05802 ( 2022 ) 2021 [i6] 吴建福 , 龙欧阳 , 丹尼尔·齐格勒 , 尼桑·斯汀农 , 瑞恩·洛维 , 简·雷克 , 保罗·F·克里斯蒂亚诺 :
用人类反馈递归总结书籍。 CoRR公司 abs/2109.10862 ( 2021 ) [i5] 中野惠一郎 , 雅各布·希尔顿 , 苏奇尔·巴拉吉 , 吴建福 , 龙欧阳 , 金楚笼 , 克里斯托弗·黑塞 , 山塔努耆那教 , Vineet Kosaraju葡萄园 , 桑德斯 , 徐江 , 卡尔·科布 , 泰娜·埃卢杜 , 格雷琴·克鲁格 , 凯文·巴顿 , 马修·奈特 , 本杰明国际象棋 , 约翰·舒尔曼 :
WebGPT:浏览器辅助的问题解答和人工反馈。 CoRR公司 abs/2112.09332 ( 2021 ) 2020 【c4】 尼桑·斯汀农 , 龙欧阳 , 杰弗里·吴 , 丹尼尔·齐格勒 , 瑞恩·洛维 , 切尔西·沃斯 , 亚历克·拉德福德 , 达里奥·阿莫迪 , 保罗·F·克里斯蒂亚诺 :
学习用人的反馈进行总结。 NeurIPS公司 2020 [i4] 尼桑·斯汀农 , 龙欧阳 , 吴建福 , 丹尼尔·齐格勒 , 瑞恩·洛维 , 切尔西·沃斯 , 亚历克·拉德福德 , 达里奥·阿莫迪 , 保罗·F·克里斯蒂亚诺 :
学习从人的反馈中总结。 CoRR公司 abs/2009.01325 ( 2020 )
2010 – 2019
2018 【c3】 龙欧阳 , 迈克尔·亨利·特斯勒 , 丹尼尔·李 , 诺亚·D·古德曼 :
webppl-oed:一个实用的优化实验设计系统。 CogSci公司 2018 [i3] 龙欧阳 :
从人类生成的示例字符串中对正则表达式进行贝叶斯推断。 CoRR公司 abs/1805.08427 ( 2018 ) 2017 [i2] 龙欧阳 , 迈克尔·C·弗兰克 :
教育学。 CoRR公司 abs/1711.09401 ( 2017 ) 2016 【c2】 约翰内斯·伯格斯特伦 , 安德鲁·戈登 , 龙欧阳 , 克劳迪奥·拉索 , 亚当·西比奥 , 马钦·西姆扎克(Marcin Szymczak) :
寓言:回归公式作为概率规划。 POPL公司 2016 : 271-283 [i1] 龙欧阳 , 迈克尔·亨利·特斯勒 , 丹尼尔·李 , 诺亚·D·古德曼 :
概率程序的实用优化实验设计。 CoRR公司 腹肌/1608.05046 ( 2016 ) 2012 【c1】 龙欧阳 , 莱拉·博格迪特斯基 , 迈克尔·C·弗兰克 :
语义连贯促进词义的分布学习。 CogSci公司 2012