吴建福 0003
SPARQL查询
优化列表
2020年–今天
2024 [c5] 科林·伯恩斯 , 帕维尔·伊兹迈洛夫 , 简·亨德里克·基什内尔 , 鲍文·贝克 , 高里奥 , 利奥波德·阿舍布伦纳 , 陈怡宁 , 阿德里安·埃科菲 , 玛纳斯·约格勒卡尔 , 简·雷克 , 伊利亚·萨茨克沃 , 杰弗里·吴 :
弱到强泛化:在监管薄弱的情况下激发强大的能力。 ICML公司 2024 [i11] 高里奥 , Tom Dupréla巡回赛 , 亨克·蒂尔曼 , 加布里埃尔·高 , 拉詹·特罗尔 , 亚历克·拉德福德 , 伊利亚·萨茨克沃 , 简·雷克 , 杰弗里·吴 :
缩放和评估稀疏自动编码器。 CoRR公司 abs/2406.04093 ( 2024 ) 2023 [i10] 科林·伯恩斯 , 帕维尔·伊兹迈洛夫 , 简·亨德里克·基什内尔 , 鲍文·贝克 , 高里奥 , 利奥波德·阿舍布伦纳 , 陈一宁 , 阿德里安·埃科菲 , 玛纳斯·约格勒卡尔 , 简·雷克 , 伊利亚·萨茨克沃 , 吴建福 :
弱到强泛化:在监管薄弱的情况下激发强大的能力。 CoRR公司 abs/2312.09390 ( 2023 ) 2022 【c4】 龙欧阳 , 杰弗里·吴 , 徐江 , 迪奥戈·阿尔梅达 , 卡罗尔·L·温赖特 , 帕梅拉·米什金 , 张冲(Chong Zhang) , 桑迪尼·阿加瓦尔 , 卡塔琳娜·斯拉玛 , 亚历克斯·雷 , 约翰·舒尔曼 , 雅各布·希尔顿 , 弗雷泽凯尔顿 , 卢克·米勒 , 麦迪·西蒙斯 , 阿曼达·阿斯克尔 , 彼得·韦林德 , 保罗·F·克里斯蒂亚诺 , 简·雷克 , 瑞恩·洛维 :
训练语言模型,使其遵循带有人类反馈的指令。 NeurIPS公司 2022 [第九章] 龙欧阳 , 吴建福 , 徐江 , 迪奥戈·阿尔梅达 , 卡罗尔·L·温赖特 , 帕梅拉·米什金 , 张冲(Chong Zhang) , 桑迪尼·阿加瓦尔 , 卡塔琳娜·斯拉玛 , 亚历克斯·雷 , 约翰·舒尔曼 , 雅各布·希尔顿 , 弗雷泽凯尔顿 , 卢克·米勒 , 麦迪·西蒙斯 , 阿曼达·阿斯克尔 , 彼得·韦林德 , 保罗·F·克里斯蒂亚诺 , 简·雷克 , 瑞恩·洛维 :
训练语言模型,使其遵循带有人类反馈的指令。 CoRR公司 abs/2203.02155 ( 2022 ) [i8] 桑德斯 , 凯瑟琳·叶 , 吴建福 , 史蒂文·比尔 , 龙欧阳 , 乔纳森·沃德 , 简·莱克 :
帮助人类评估者的自我批评模型。 CoRR公司 腹肌/2206.05802 ( 2022 ) 2021 [i7] 吴建福 , 龙欧阳 , 丹尼尔·齐格勒 , 尼桑·斯汀农 , 瑞恩·洛维 , 简·雷克 , 保罗·F·克里斯蒂亚诺 :
用人类反馈递归总结书籍。 CoRR公司 abs/2109.10862 ( 2021 ) [i6] 中野惠一郎 , 雅各布·希尔顿 , 苏奇尔·巴拉吉 , 吴建福 , 龙欧阳 , 金楚笼 , 克里斯托弗·黑塞 , 尚塔努·贾因 , 葡萄园Kosaraju , 桑德斯 , 徐江 , 卡尔·科布 , 泰娜·埃卢杜 , 格雷琴·克鲁格 , 凯文·巴顿 , 马修·奈特 , 本杰明国际象棋 , 约翰·舒尔曼 :
WebGPT:浏览器辅助的问题解答和人工反馈。 CoRR公司 abs/2112.09332 ( 2021 ) 2020 【c3】 马克·陈 , 亚历克·拉德福德 , 重写子对象 , 杰弗里·吴 , Heewoo Jun先生 , 大卫·卢安 , 伊利亚·萨茨克沃 :
基于像素的生成性预训练。 ICML公司 2020 : 1691-1703 【c2】 汤姆·B·布朗 , 本杰明·曼 , 尼克·莱德 , 梅兰妮·苏比亚 , 贾里德·卡普兰 , 普拉福拉·达里瓦尔 , 阿尔文德·内拉坎坦 , 普拉纳夫·希亚姆 , Girish Sastry女士 , 阿曼达·阿斯克尔 , 桑迪尼·阿加瓦尔 , 阿里尔·赫伯特·沃斯 , 格雷琴·克鲁格 , 汤姆·海尼汉 , 重写子对象 , 阿迪蒂亚·拉梅什 , 丹尼尔·齐格勒 , 杰弗里·吴 , 克莱门斯·温特 , 克里斯托弗·黑塞 , 马克·陈 , 埃里克·西格勒 , 马特乌斯·利特温 , 史考特·葛瑞 , 本杰明国际象棋 , 杰克·克拉克 , 克里斯托弗·伯纳 , 萨姆·麦坎德里什 , 亚历克·拉德福 , 伊利亚·萨茨克沃 , 达里奥·阿莫迪 :
语言模型是少数射击学习者。 NeurIPS公司 2020 【c1】 尼桑·斯汀农 , 龙欧阳 , 杰弗里·吴 , 丹尼尔·齐格勒 , 瑞恩·洛维 , 切尔西·沃斯 , 亚历克·拉德福德 , 达里奥·阿莫迪 , 保罗·F·克里斯蒂亚诺 :
学习用人的反馈进行总结。 NeurIPS公司 2020 [i5] 贾里德·卡普兰 , 萨姆·麦肯迪什 , 汤姆·海尼汉 , 汤姆·B·布朗 , 本杰明国际象棋 , 重写子对象 , 史考特·葛瑞 , 亚历克·拉德福 , 杰弗里·吴 , 达里奥·阿莫迪 :
神经语言模型的缩放律。 CoRR公司 abs/2001.08361 ( 2020 ) [i4] 汤姆·B·布朗 , 本杰明·曼 , 尼克·莱德 , 梅兰妮·苏比亚赫 , 贾里德·卡普兰 , 普拉福拉·达里瓦尔 , 阿尔文德·内拉坎坦 , 普拉纳夫·希亚姆 , Girish Sastry女士 , 阿曼达·阿斯克尔 , 桑迪尼·阿加瓦尔 , 阿里尔·赫伯特·沃斯 , 格雷琴·克鲁格 , 汤姆·海尼汉 , 重写子对象 , 阿迪蒂亚·拉梅什 , 丹尼尔·齐格勒 , 杰弗里·吴 , 克莱门斯·温特 , 克里斯托弗·黑塞 , 马克·陈 , 埃里克·西格勒 , 马特乌斯·利特温 , 史考特·葛瑞 , 本杰明国际象棋 , 杰克·克拉克 , 克里斯托弗·伯纳 , 萨姆·麦肯迪什 , 亚历克·拉德福德 , 伊利亚·萨茨克沃 , 达里奥·阿莫迪 :
语言模型是少数快速学习者。 CoRR公司 abs/2005.14165 ( 2020 ) [i3] 尼桑·斯汀农 , 龙欧阳 , 吴建福 , 丹尼尔·齐格勒 , 瑞恩·洛维 , 切尔西·沃斯 , 亚历克·拉德福德 , 达里奥·阿莫迪 , 保罗·F·克里斯蒂亚诺 :
学习从人的反馈中总结。 CoRR公司 abs/2009.01325 ( 2020 )
2010 – 2019
2019 [i2] 艾琳·索拉曼 , Miles Brundage公司 , 杰克·克拉克 , 阿曼达·阿斯克尔 , 阿里尔·赫伯特·沃斯 , 吴建福 , 亚历克·拉德福德 , 茉莉花王 :
语言模型的发布策略和社会影响。 CoRR公司 abs/1908.09203 ( 2019 ) [i1] 丹尼尔·齐格勒 , 尼桑·斯汀农 , 杰弗里·吴 , 汤姆·B·布朗 , 亚历克·拉德福德 , 达里奥·阿莫迪 , 保罗·F·克里斯蒂亚诺 , 杰弗里·欧文 :
人类偏好的微调语言模型。 CoRR公司 abs/1909.08593 ( 2019 )