丹尼尔·齐格勒
人员信息
附属: 美国加州伯克利Redwood Research 隶属关系(以前): OpenAI,美国加利福尼亚州旧金山
其他同名人员
丹尼尔·齐格勒 0001 -德国斯图加特Fraunhofer工业工程协会 丹尼尔·齐格勒 0002 -美国马萨诸塞州剑桥市CSAIL麻省理工学院 丹尼尔·齐格勒 0003 -杜伊斯堡-埃森大学,管理科学和能源经济学主席,德国埃森 丹尼尔·齐格勒 0004 -美国宾夕法尼亚州葛底斯堡学院 丹尼尔·齐格勒 0005 -德国埃尔兰根-纽伦堡大学
SPARQL查询
优化列表
2020年–今天
2024 [i7] 埃文·胡宾格 , 卡森·丹尼森 , 杰西·穆 , 迈克·兰伯特 , 梅格·唐 , 蒙特·麦克迪尔米德 , 塔梅拉·拉纳姆 , 丹尼尔·齐格勒 , 蒂姆·麦克斯韦 , 牛顿·程 , 亚当·杰明 , 阿曼达·阿斯克尔 , 安什·拉德哈克里希南 , 水泥茴香 , 大卫·杜维诺 , 深神经节 , 法兹尔·巴雷斯 , 杰克·克拉克 , 卡迈勒·恩杜塞 , Kshitij Sachan公司 , 迈克尔·塞利托 , 姆里南克·夏尔马 , 新达萨玛 , 罗杰·格罗斯 , 肖娜·克拉维克 , 白云涛 , 扎卡里·维滕 , 玛丽娜·法瓦罗 , 简·布劳纳 , 霍尔登·卡诺夫斯基 , 保罗·F·克里斯蒂亚诺 , 塞缪尔·鲍曼 , 洛根·格雷厄姆 , 贾里德·卡普兰 , 索伦·明德曼 , 瑞恩·格林布拉特 , 巴克·施莱格里斯 , 尼古拉斯·希弗 , 伊桑·佩雷斯 :
卧铺特工:通过安全培训培训坚持的欺骗性LLM。 CoRR公司 abs/2401.05566 ( 2024 ) 2022 【c3】 丹尼尔·齐格勒 , Seraphina Nix公司 , 陈源翰 , 蒂姆·鲍曼 , 彼得·施密特·尼尔森 , 陶林 , 亚当·谢利斯 , 诺亚·纳贝希玛 , 本·温斯坦·劳恩 , 丹尼尔·德·哈斯 , 巴克·施莱格里斯 , 内特·托马斯 :
高风险可靠性的对抗性训练。 NeurIPS公司 2022 [i6] 丹尼尔·齐格勒 , Seraphina Nix公司 , 陈源翰 , 蒂姆·鲍曼 , 彼得·施密特·尼尔森 , 陶林 , 亚当·谢利斯 , 诺亚·纳贝希玛 , 本·温斯坦·劳恩 , 丹尼尔·德·哈斯 , 巴克·施莱格里斯 , 内特·托马斯 :
对抗训练,实现高可靠性。 CoRR公司 abs/2205.01663 ( 2022 ) 2021 [i5] 吴建福 , 龙欧阳 , 丹尼尔·齐格勒 , 尼桑·斯汀农 , 瑞恩·洛维 , 简·雷克 , 保罗·F·克里斯蒂亚诺 :
用人类反馈递归总结书籍。 CoRR公司 abs/2109.10862 ( 2021 ) 2020 【c2】 汤姆·B·布朗 , 本杰明·曼 , 尼克·赖德 , 梅兰妮·苏比亚赫 , 贾里德·卡普兰 , 普拉福拉·达里瓦尔 , 阿尔文德·内拉坎坦 , 普拉纳夫·希亚姆 , Girish Sastry女士 , 阿曼达·阿斯克尔 , 桑迪尼·阿加瓦尔 , 阿里尔·赫伯特·沃斯 , 格雷琴·克鲁格 , 汤姆·海尼汉 , 重写子对象 , 阿迪蒂亚·拉梅什 , 丹尼尔·齐格勒 , 杰弗里·吴 , 克莱门斯·温特 , 克里斯托弗·黑塞 , 马克·陈 , 埃里克·西格勒 , 马特乌什·利特温 , 史考特·葛瑞 , 本杰明国际象棋 , 杰克·克拉克 , 克里斯托弗·伯纳 , 萨姆·麦肯迪什 , 亚历克·拉德福德 , 伊利亚·萨茨克沃 , 达里奥·阿莫迪 :
语言模型是少数快速学习者。 NeurIPS公司 2020 【c1】 尼桑·斯汀农 , 龙欧阳 , 杰弗里·吴 , 丹尼尔·齐格勒 , 瑞恩·洛维 , 切尔西·沃斯 , 亚历克·拉德福德 , 达里奥·阿莫迪 , 保罗·F·克里斯蒂亚诺 :
学习用人的反馈进行总结。 NeurIPS公司 2020 [i4] 汤姆·B·布朗 , 本杰明·曼 , 尼克·赖德 , 梅兰妮·苏比亚赫 , 贾里德·卡普兰 , 普拉福拉·达里瓦尔 , 阿尔文德·内拉坎坦 , 普拉纳夫·希亚姆 , Girish Sastry女士 , 阿曼达·阿斯克尔 , 桑迪尼·阿加瓦尔 , 阿里尔·赫伯特·沃斯 , 格雷琴·克鲁格 , 汤姆·海尼汉 , 重写子对象 , 阿迪蒂亚·拉梅什 , 丹尼尔·齐格勒 , 杰弗里·吴 , 克莱门斯·温特 , 克里斯托弗·黑塞 , 马克·陈 , 埃里克·西格勒 , 马特乌什·利特温 , 史考特·葛瑞 , 本杰明国际象棋 , 杰克·克拉克 , 克里斯托弗·伯纳 , 萨姆·麦肯迪什 , 亚历克·拉德福德 , 伊利亚·萨茨克沃 , 达里奥·阿莫迪 :
语言模型是少数快速学习者。 CoRR公司 abs/2005.14165 ( 2020 ) [i3] 尼桑·斯汀农 , 龙欧阳 , 吴建福 , 丹尼尔·齐格勒 , 瑞恩·洛维 , 切尔西·沃斯 , 亚历克·拉德福德 , 达里奥·阿莫迪 , 保罗·F·克里斯蒂亚诺 :
学习从人的反馈中总结。 CoRR公司 abs/2009.01325 ( 2020 ) [i2] 汤姆·海尼汉 , 贾里德·卡普兰 , 莫尔·卡茨 , 马克·陈 , 克里斯托弗·黑塞 , 雅各布·杰克逊 , Heewoo Jun先生 , 汤姆·B·布朗 , 普拉福拉·达里瓦尔 , 史考特·葛瑞 , 克里斯·哈莱西 , 本杰明·曼 , 亚历克·拉德福德 , 阿迪蒂亚·拉梅什 , 尼克·赖德 , 丹尼尔·齐格勒 , 约翰·舒尔曼 , 达里奥·阿莫迪 , 萨姆·麦肯迪什 :
自回归生成模型的缩放律。 CoRR公司 abs/2010.14701 ( 2020 )
2010 – 2019
2019 [i1] 丹尼尔·齐格勒 , 尼桑·斯汀农 , 杰弗里·吴 , 汤姆·B·布朗 , 亚历克·拉德福德 , 达里奥·阿莫迪 , 保罗·F·克里斯蒂亚诺 , 杰弗里·欧文 :
人类偏好的微调语言模型。 CoRR公司 abs/1909.08593 ( 2019 )