保罗·F·克里斯蒂亚诺
人员信息
附属: OpenAI,美国 从属关系(2017年博士): 加利福尼亚大学伯克利分校,加利福尼亚州,美国
其他同名人员
SPARQL查询
优化列表
2020年–今天
2024 [i25] 埃文·胡宾格 , 卡森-丹尼森 , 杰西·穆 , 迈克·兰伯特 , 梅格·唐 , 蒙特·麦克迪尔米德 , 塔梅拉·拉纳姆 , 丹尼尔·齐格勒 , 蒂姆·麦克斯韦 , 牛顿·程 , 亚当·杰明 , 阿曼达·阿斯克尔 , 安什·拉德哈克里希南 , 水泥茴香 , 大卫·杜维纳德 , 深神经节 , 法兹尔·巴雷斯 , 杰克·克拉克 , 卡迈勒·恩杜塞 , Kshitij Sachan公司 , 迈克尔·塞利托 , Mrinak Sharma先生 , 新达萨玛 , 罗杰·格罗斯 , 肖娜·克拉维克 , 白云涛 , 扎卡里·维滕 , 玛丽娜·法瓦罗 , 简·布劳纳 , 霍尔登·卡诺夫斯基 , 保罗·F·克里斯蒂亚诺 , 塞缪尔·鲍曼 , 洛根·格雷厄姆 , 贾里德·卡普兰 , 索伦·明德曼 , 瑞恩·格林布拉特 , 巴克·施莱格里斯 , 尼古拉斯·谢弗 , 伊桑·佩雷斯 :
卧铺特工:通过安全培训培训坚持的欺骗性LLM。 CoRR公司 abs/2401.05566 ( 2024 ) 2023 【i24】 托比·谢夫兰 , 塞巴斯蒂安·法夸尔 , 本·加芬克尔 , 玛丽·冯 , 杰斯·惠特尔斯通 , 梁琤 , 丹尼尔·科科塔基洛 , 纳赫玛·马查尔 , 马库斯·安德荣格 , 诺姆·科尔特 , 何小黑 , 迪维亚·西达斯 , 沙哈尔·阿文 , 威尔·霍金斯 , Been Kim(金) , 艾森·加布里埃尔 , 维杰·博利纳 , 杰克·克拉克 , 本吉奥 , 保罗·F·克里斯蒂亚诺 , 阿兰·达福 :
极端风险的模型评估。 CoRR公司 abs/2305.15324 ( 2023 ) 2022 [第11条] 龙欧阳 , 杰弗里·吴 , 徐江 , 迪奥戈·阿尔梅达 , 卡罗尔·L·温赖特 , 帕梅拉·米什金 , 张冲(Chong Zhang) , 桑迪尼·阿加瓦尔 , 卡塔琳娜·斯拉玛 , 亚历克斯·雷 , 约翰·舒尔曼 , 雅各布·希尔顿 , 弗雷泽凯尔顿 , 卢克·米勒 , 麦迪·西蒙斯 , 阿曼达·阿斯克尔 , 彼得·韦林德 , 保罗·F·克里斯蒂亚诺 , 简·雷克 , 瑞恩·洛维 :
训练语言模型,使其遵循人类反馈的指示。 NeurIPS公司 2022 [第23条] 龙欧阳 , 吴建福 , 徐江 , 迪奥戈·阿尔梅达 , 卡罗尔·L·温赖特 , 帕梅拉·米什金 , 张冲(Chong Zhang) , 桑迪尼·阿加瓦尔 , 卡塔琳娜·斯拉玛 , 亚历克斯·雷 , 约翰·舒尔曼 , 雅各布·希尔顿 , 弗雷泽凯尔顿 , 卢克·米勒 , 麦迪·西蒙斯 , 阿曼达·阿斯克尔 , 彼得·韦林德 , 保罗·F·克里斯蒂亚诺 , 简·雷克 , 瑞恩·洛维 :
训练语言模型,使其遵循带有人类反馈的指令。 CoRR公司 腹肌/2203.02155 ( 2022 ) [i22] 保罗·F·克里斯蒂亚诺 , 埃里克·内曼 , 马克·徐 :
将独立性假设正式化。 CoRR公司 abs/2211.06738 ( 2022 ) 2021 [注2] 兹维卡·布拉克斯基 , 保罗·F·克里斯蒂亚诺 , 乌米拉·马哈德夫 , 乌梅什·V·瓦齐拉尼 , 托马斯·维迪克 :
单个量子设备的量子性和可证明随机性的密码测试。 美国临床医学杂志 68 ( 5 ) : 31:1-31:47 ( 2021 ) 【i21】 吴建福 , 龙欧阳 , 丹尼尔·齐格勒 , 尼桑·斯汀农 , 瑞恩·洛维 , 简·雷克 , 保罗·F·克里斯蒂亚诺 :
用人类反馈递归总结书籍。 CoRR公司 abs/2109.10862 ( 2021 ) 2020 [第10条] 尼桑·斯汀农 , 龙欧阳 , 杰弗里·吴 , 丹尼尔·齐格勒 , 瑞恩·洛维 , 切尔西·沃斯 , 亚历克·拉德福德 , 达里奥·阿莫迪 , 保罗·F·克里斯蒂亚诺 :
学习用人的反馈进行总结。 NeurIPS公司 2020 [i20] 尼桑·斯汀农 , 龙欧阳 , 吴建福 , 丹尼尔·齐格勒 , 瑞恩·洛维 , 切尔西·沃斯 , 亚历克·拉德福德 , 达里奥·阿莫迪 , 保罗·F·克里斯蒂亚诺 :
学习从人的反馈中总结。 CoRR公司 腹肌/2009.01325 ( 2020 )
2010 – 2019
2019 [i19] 丹尼尔·齐格勒 , 尼桑·斯汀农 , 杰弗里·吴 , 汤姆·B·布朗 , 亚历克·拉德福 , 达里奥·阿莫迪 , 保罗·F·克里斯蒂亚诺 , 杰弗里·欧文 :
人类偏好的微调语言模型。 CoRR公司 abs/1909.08593 ( 2019 ) 2018 【c9】 兹维卡·布拉克斯基 , 保罗·F·克里斯蒂亚诺 , 乌米拉·马哈德夫 , 乌梅什·V·瓦齐拉尼 , 托马斯·维迪克 :
单个量子设备的量子性和可证明随机性的密码测试。 光纤通信系统 2018 : 320-331 [i18] 兹维卡·布拉克斯基 , 保罗·F·克里斯蒂亚诺 , 乌米拉·马哈德夫 , 乌梅什·V·瓦齐拉尼 , 托马斯·维迪克 :
来自单个量子设备的可证明随机性。 CoRR公司 abs/1804.00640 ( 2018 ) [i17] 杰弗里·欧文 , 保罗·F·克里斯蒂亚诺 , 达里奥·阿莫迪 :
人工智能安全通过辩论。 CoRR公司 abs/1805.00899 ( 2018 ) [i16] 汤姆·B·布朗 , 尼古拉斯·卡里尼 , 张志远(Chiyuan Zhang) , 凯瑟琳·奥尔森 , 保罗·F·克里斯蒂亚诺 , 伊恩·古德费罗 :
无限制对手示例。 CoRR公司 abs/1809.08352 ( 2018 ) 【i15】 保罗·F·克里斯蒂亚诺 , 巴克·施莱格里斯 , 达里奥·阿莫迪 :
通过强化薄弱的专家来监督优秀的学习者。 CoRR公司 abs/1810.08575 ( 2018 ) 2017 【b1】 保罗·弗朗西斯·克里斯蒂亚诺 :
抗操纵在线学习。 美国加州大学伯克利分校, 2017 【c8】 保罗·F·克里斯蒂亚诺 , 简·雷克 , 汤姆·B·布朗 , Miljan Martic公司 , 谢恩·莱格 , 达里奥·阿莫迪 :
从人类偏好中深度强化学习。 NIPS公司 2017 : 4299-4307 [第14条] 保罗·F·克里斯蒂亚诺 , 简·雷克 , 汤姆·B·布朗 , Miljan Martic公司 , 谢恩·莱格 , 达里奥·阿莫迪 :
从人类偏好中进行深度强化学习。 CoRR公司 abs/1706.03741 ( 2017 ) 2016 【c7】 保罗·F·克里斯蒂亚诺 :
经得起考验的防操纵声誉系统。 COLT公司 2016 : 670-697 [i13] 保罗·F·克里斯蒂亚诺 :
强大的协作式在线学习。 CoRR公司 abs/1603.06265 ( 2016 ) [i12] 拉米·阿勒福 , 纪尧姆·阿兰 , 阿姆贾德·阿尔马海里 , 克里斯托夫·安格穆勒 , Dzmitry Bahdanau公司 , 尼古拉斯·巴拉斯 , 弗雷德里克·巴斯蒂安 , 贾斯汀·拜尔 , 安纳托利·贝里科夫 , 亚历山大·贝洛波斯基 , 本吉奥 , 阿尔诺·贝杰隆 , 詹姆斯·伯格斯特拉 , 瓦伦汀·比森 , 乔什·布莱切尔·斯奈德 , 尼古拉斯·布沙德 , 尼古拉·博拉根·勒万多夫斯基(Nicolas Boulanger-Lewandowski) , 泽维尔·布瑟利尔 , 亚历山大·德·布雷比松 , 奥利维尔·布鲁鲁 , Pierre Luc Carrier公司 , Kyunghyun Cho(赵京贤) , 扬·乔洛夫斯基 , 保罗·F·克里斯蒂亚诺 , 蒂姆·库伊曼斯 , 马克·阿莱克安德烈·科特 , Myriam Cotté , 亚伦·C·库维尔 , Yann N.多芬 , 奥利维尔·德拉略 , 朱利安·德莫斯 , 纪尧姆·德斯贾丁斯 , 桑德·迪尔曼 , 劳伦特·丁 , 梅兰妮·杜卡夫 , 文森特·杜穆林 , 萨米拉·埃布拉希米·卡胡 , 杜米特鲁·尔汗 , 子叶扇 , 奥汉·菲拉特 , 马修·日尔曼 , 泽维尔·格洛洛特 , 伊恩·古德费罗 , 麦克费登 , 圣格雷 , 菲利普·哈默尔 , 伊本·哈洛切特 , 让-菲利普·恒 , 巴拉斯·希达西 , 新浪荷纳里 , 阿尔琼·贾恩 , 塞巴斯蒂安·让 , Kai Jia(凯佳) , 米哈伊尔·科洛波夫 , 维维克·库尔卡尼 , 亚历克斯·兰姆 , 帕斯卡·兰姆林 , 埃里克拉森 , 塞萨尔·洛朗 , 肖恩·李 , 西蒙·勒弗兰索瓦 , 西蒙·勒米厄 , 尼古拉斯·莱昂纳德 , 周汉林 , 杰西·利弗泽伊 , 科里·洛伦茨 , 耶利米亚·洛文 , 千里马 , 皮埃尔·安托万·曼扎戈尔 , 奥利维尔·马斯托皮雷托 , 罗伯特·麦吉本 , 罗兰·梅米舍维奇 , 巴特·范梅里恩博尔 , 文森特·米查尔斯基 , 梅赫迪·米尔扎 , 阿尔贝托·奥兰迪 , 克里斯托弗·约瑟夫·帕尔 , 拉兹万·帕斯卡努 , 穆罕默德·佩泽什基 , 科林·拉斐尔 , 丹尼尔·伦肖 , 马修·罗克林 , 阿德里亚娜·罗梅罗 , 马库斯·罗斯 , 彼得·萨多夫斯基 , 约翰·萨尔瓦蒂尔 , 弗朗索瓦·萨瓦德 , 扬·施吕特 , 约翰·舒尔曼 , 加布里埃尔·施瓦茨 , 尤利安·弗拉德塞尔维亚人 , 德米特里·谢尔杜克 , 萨米拉·沙巴尼安 , 艾蒂安·西蒙 , 西格德·斯皮克曼 , S.Ramana Subramanyam公司 , 雅库布·辛格诺夫斯基 , 杰雷米·坦圭 , 吉杰斯·范·图尔德(Gijs van Tulder) , 约瑟夫·图里亚 , 塞巴斯蒂安·厄本 , 帕斯卡·文森特 , 弗朗西斯科·维辛 , 哈姆德·弗里斯 , 大卫·沃德·法利 , 达斯汀·J·韦伯 , 马修·威尔森 , Kelvin Xu(徐开尔文) , 薛丽君 , 李瑶 , 张赛正 , 张颖(音) :
Theano:用于快速计算数学表达式的Python框架。 CoRR公司 abs/1605.02688 ( 2016 ) [i11] 达里奥·阿莫迪 , 克里斯·欧拉 , 雅各布·斯坦哈特 , 保罗·F·克里斯蒂亚诺 , 约翰·舒尔曼 , 丹·马内 :
人工智能安全中的具体问题。 CoRR公司 abs/1606.06565 ( 2016 ) [i10] 保罗·F·克里斯蒂亚诺 , 扎恩·沙阿 , 伊戈尔·莫达奇 , 乔纳斯·施耐德 , 特雷弗·布莱克威尔 , 约书亚·托宾 , 彼得·阿比尔 , Wojciech Zaremba公司 :
通过学习深度逆动力学模型从模拟到真实世界的转换。 CoRR公司 abs/1610.03518 ( 2016 ) [第九章] 切尔西-芬兰人 , 保罗·F·克里斯蒂亚诺 , 彼得·阿比尔 , 谢尔盖·莱文 :
生成性对抗网络、反向强化学习和基于能量的模型之间的联系。 CoRR公司 abs/1611.03852 ( 2016 ) 2015 【c6】 本雅·法伦斯坦 , 杰西卡泰勒 , 保罗·F·克里斯蒂亚诺 :
反思神谕:人工智能博弈论的基础。 LORI公司 2015 : 411-415 [i8] 本杰·法伦斯坦 , 杰西卡泰勒 , 保罗·F·克里斯蒂亚诺 :
反思神谕:经典博弈论的基础。 CoRR公司 abs/1508.04145 ( 2015 ) 2014 【c5】 保罗·F·克里斯蒂亚诺 :
开放问题:在线本地学习。 COLT公司 2014 : 1290-1294 【c4】 保罗·F·克里斯蒂亚诺 :
通过半定规划进行在线本地学习。 STOC公司 2014 : 468-474 [i7] 米哈利·巴拉什 , 保罗·F·克里斯蒂亚诺 , 本杰·法伦斯坦 , 马塞洛·赫雷肖夫 , 帕特里克·拉维托瓦 , 埃利泽 :
囚犯困境中的稳健合作:通过可证明逻辑实现程序均衡。 CoRR公司 abs/1401.5577 ( 2014 ) [i6] 保罗·F·克里斯蒂亚诺 :
通过半定规划进行在线本地学习。 CoRR公司 abs/1403.5287 ( 2014 ) [i5] 保罗·F·克里斯蒂亚诺 :
经得起考验的防操纵声誉系统。 CoRR公司 abs/1411.1127 ( 2014 ) 2013 [j1] 斯科特·阿伦森 , 保罗·F·克里斯蒂亚诺 :
来自隐藏子空间的量子货币。 理论计算。 9 : 349-401 ( 2013 ) 2012 【c3】 斯科特·阿伦森 , 保罗·F·克里斯蒂亚诺 :
来自隐藏子空间的量子资金。 STOC公司 2012 : 41-60 [i4] 斯科特·阿伦森 , 保罗·F·克里斯蒂亚诺 :
来自隐藏子空间的量子货币。 CoRR公司 腹肌/1203.4740 ( 2012 ) [i3] 斯科特·阿伦森 , 保罗·F·克里斯蒂亚诺 :
来自隐藏子空间的量子货币。 电子。 计算机学术讨论会。 复杂。 12号机房 ( 2012 ) [i2] 斯科特·阿伦森 , 保罗·F·克里斯蒂亚诺 :
来自隐藏子空间的量子货币。 IACR加密。 电子打印架构。 2012 : 171 ( 2012 ) 2011 【c2】 保罗·F·克里斯蒂亚诺 , 乔纳森·凯尔纳 , 亚历山大·马德里 , 丹尼尔·斯皮尔曼 , 上华腾 :
电流、拉普拉斯系统和无向图中最大流的快速近似。 STOC公司 2011 : 273-282 【c1】 保罗·F·克里斯蒂亚诺 , 埃里克·D·德曼 , 肖纳克·基肖尔 :
具有附加开销的无损容错数据结构。 WADS公司 2011 : 243-254 2010 [i1] 保罗·F·克里斯蒂亚诺 , 乔纳森·凯尔纳 , 亚历山大·马德里 , 丹尼尔·斯皮尔曼 , 尚华腾 :
电气流,拉普拉斯系统,无向图中最大流的快速近似。 CoRR公司 abs/1010.2921 ( 2010 )