尼桑·斯汀农
人员信息
SPARQL查询
优化列表
2020年–今天
2021 [i3] 吴建福 , 龙欧阳 , 丹尼尔·齐格勒 , 尼桑·斯汀农 , 瑞恩·洛维 , 简·雷克 , 保罗·F·克里斯蒂亚诺 :
用人类反馈递归总结书籍。 CoRR公司 abs/2109.10862 ( 2021 ) 2020 【c1】 尼桑·斯汀农 , 龙欧阳 , 杰弗里·吴 , 丹尼尔·齐格勒 , 瑞恩·洛维 , 切尔西·沃斯 , 亚历克·拉德福德 , 达里奥·阿莫迪 , 保罗·F·克里斯蒂亚诺 :
学会用人的反馈进行总结。 NeurIPS公司 2020 [i2] 尼桑·斯汀农 , 龙欧阳 , 吴建福 , 丹尼尔·齐格勒 , 瑞恩·洛维 , 切尔西·沃斯 , 亚历克·拉德福德 , 达里奥·阿莫迪 , 保罗·F·克里斯蒂亚诺 :
学习从人的反馈中总结。 CoRR公司 腹肌/2009.01325 ( 2020 )
2010 – 2019
2019 [i1] 丹尼尔·齐格勒 , 尼桑·斯汀农 , 杰弗里·吴 , 汤姆·B·布朗 , 亚历克·拉德福德 , 达里奥·阿莫迪 , 保罗·F·克里斯蒂亚诺 , 杰弗里·欧文 :
人类偏好的微调语言模型。 CoRR公司 abs/1909.08593 ( 2019 )