达里奥·阿莫迪
人员信息
附属: 人类
优化列表
2020年–今天
2023 【c8】 伊桑·佩雷斯 , 萨姆·林格 , 卡米尔·卢科苏特 , 卡琳娜·阮 , 埃德温·陈 , 斯科特·海纳 , 克雷格·佩蒂特 , 凯瑟琳·奥尔森 , 桑迪潘·昆都 , 索拉夫·卡达瓦特 , 安迪·琼斯 , 安娜·陈 , 本杰明·曼 , 布莱恩·伊斯雷尔 , 布莱恩·西索尔 , 卡梅隆·麦金农 , 克里斯托弗·奥拉 , 大雁 , 丹妮拉·阿莫迪 , 达里奥·阿莫迪 , 黎明排水沟 , 达斯汀·李 , 埃利·特兰·约翰逊 , 古罗·昆达泽 , 杰克逊·科尼翁 , 詹姆斯·兰迪斯 , 杰米·克尔 , 贾里德·米勒 , Jeeyoon Hyun先生 , 约书亚·兰道 , 卡迈勒·恩杜塞 , 兰登·戈德堡 , 莉安·洛维特 , 马丁·卢卡斯 , 迈克尔·塞利托 , 米兰达·张 , 内拉夫·金斯兰 , 纳尔逊·埃尔哈吉 , 尼古拉斯·约瑟夫 , 诺米·梅尔卡多 , 新达萨玛 , 奥利弗·劳什 , 罗宾·拉尔森 , 萨姆·麦肯迪什 , 斯科特·约翰斯顿 , 肖娜·克拉维克 , Sheer El Showk公司 , 塔梅拉·拉纳姆 , 蒂莫西·特利恩·劳顿 , 汤姆·布朗 , 汤姆·海尼汉 , 特里斯坦·休姆 , 白云涛 , 扎克·哈特菲尔德-道奇 , 杰克·克拉克 , 塞缪尔·鲍曼 , 阿曼达·阿斯克尔 , 罗杰·格罗斯 , 丹尼·埃尔南德斯 , 深神经节 , 埃文·胡宾格 , 尼古拉斯·希弗 , 贾里德·卡普兰 :
使用模型编写的求值发现语言模型行为。 ACL(调查结果) 2023 : 13387-13434 [第28条] 深神经节 , 阿曼达·阿斯克尔 , 尼古拉斯·希弗 , 托马斯·I·廖 , 卡米尔·卢科苏特 , 安娜·陈 , 安娜·戈迪 , 阿扎利亚·米罗塞尼 , 凯瑟琳·奥尔森 , 丹尼·埃尔南德斯 , 黎明排水沟 , 达斯汀·李 , 埃利·特兰·约翰逊 , 伊桑·佩雷斯 , 杰克逊·科尼翁 , 杰米·克尔 , 贾里德·米勒 , 约书亚·兰道 , 卡迈勒·恩杜塞 , 卡琳娜·阮 , 莉安·洛维特 , 迈克尔·塞利托 , 纳尔逊·埃尔哈吉 , 诺米·梅尔卡多 , 新达萨玛 , 奥利弗·劳什 , 罗伯特·拉森比 , 罗宾·拉尔森 , 萨姆·林格 , 桑迪潘·昆都 , 索拉夫·卡达瓦特 , 斯科特·约翰斯顿 , 肖娜·克拉维克 , Sheer El Showk公司 , 塔梅拉·拉纳姆 , 蒂莫西·特利恩·劳顿 , 汤姆·海尼汉 , 特里斯坦·休姆 , 白云涛 , 扎克·哈特菲尔德-道奇 , 本·曼 , 达里奥·阿莫迪 , 尼古拉斯·约瑟夫 , 萨姆·麦肯迪什 , 汤姆·布朗 , 克里斯托弗·奥拉 , 杰克·克拉克 , 塞缪尔·鲍曼 , 贾里德·卡普兰 :
大型语言模型中的道德自我纠正能力。 CoRR公司 abs/2302.07459 ( 2023 ) 2022 【c7】 深神经节 , 丹尼·埃尔南德斯 , 莉安·洛维特 , 阿曼达·阿斯克尔 , 白云涛 , 安娜·陈 , 汤姆·科纳利 , 新达萨玛 , 黎明排水沟 , 纳尔逊·埃尔哈吉 , Sheer El Showk公司 , 斯坦尼斯拉夫堡 , 扎克·哈特菲尔德-道奇 , 汤姆·海尼汉 , 斯科特·约翰斯顿 , 安迪·琼斯 , 尼古拉斯·约瑟夫 , 杰克逊·克尼安 , 肖娜·克拉维克 , 本·曼 , 内尔·南达 , 卡迈勒·恩杜塞 , 凯瑟琳·奥尔森 , 丹妮拉·阿莫迪 , 汤姆·B·布朗 , 贾里德·卡普兰 , 萨姆·麦肯迪什 , 克里斯托弗·奥拉 , 达里奥·阿莫迪 , 杰克·克拉克 :
大型生成模型中的可预测性和惊喜。 FAccT公司 2022 : 1747-1764 [i27] 深神经节 , 丹尼·埃尔南德斯 , 莉安·洛维特 , 新达萨玛 , 汤姆·海尼汉 , 安迪·琼斯 , 尼古拉斯·约瑟夫 , 杰克逊·科尼翁 , 本杰明·曼 , 阿曼达·阿斯克尔 , 白云涛 , 安娜·陈 , 汤姆·科纳利 , 黎明排水沟 , 纳尔逊·埃尔哈吉 , Sheer El Showk公司 , 斯坦尼斯拉夫堡 , 扎克·哈特菲尔德-道奇 , 斯科特·约翰斯顿 , 肖娜·克拉维克 , 内尔·南达 , 卡迈勒·恩杜塞 , 凯瑟琳·奥尔森 , 丹妮拉·阿莫迪 , 达里奥·阿莫迪 , 汤姆·B·布朗 , 贾里德·卡普兰 , 萨姆·麦肯迪什 , 克里斯·欧拉 , 杰克·克拉克 :
大型生成模型中的可预测性和惊喜。 CoRR公司 腹肌/2202.07785 ( 2022 ) [i26] 白云涛 , 安迪·琼斯 , 卡迈勒·恩杜塞 , 阿曼达·阿斯克尔 , 安娜·陈 , 新达萨玛 , 黎明排水沟 , 斯坦尼斯拉夫堡 , 深神经节 , 汤姆·海尼汉 , 尼古拉斯·约瑟夫 , 索拉夫·卡达瓦特 , 杰克逊·科尼翁 , 汤姆·科纳利 , Sheer El Showk公司 , 纳尔逊·埃尔哈吉 , 扎克·哈特菲尔德-道奇 , 丹尼·埃尔南德斯 , 特里斯坦·休姆 , 斯科特·约翰斯顿 , 肖娜·克拉维克 , 莉安·洛维特 , 内尔·南达 , 凯瑟琳·奥尔森 , 达里奥·阿莫迪 , 汤姆·B·布朗 , 杰克·克拉克 , 萨姆·麦肯迪什 , 克里斯·欧拉 , 本杰明·曼 , 贾里德·卡普兰 :
通过从人的反馈中强化学习,培训一名有益无害的助手。 CoRR公司 腹肌/2204.05862 ( 2022 ) [i25] 丹尼·埃尔南德斯 , 汤姆·B·布朗 , 汤姆·科纳利 , 新达萨玛 , 黎明排水沟 , Sheer El Showk公司 , 纳尔逊·埃尔哈吉 , 扎克·哈特菲尔德-道奇 , 汤姆·海尼汉 , 特里斯坦·休姆 , 斯科特·约翰斯顿 , 本杰明·曼 , 克里斯·欧拉 , 凯瑟琳·奥尔森 , 达里奥·阿莫迪 , 尼古拉斯·约瑟夫 , 贾里德·卡普兰 , 萨姆·麦肯迪什 :
重复数据学习的标度律和可解释性。 CoRR公司 abs/2205.10487 ( 2022 ) 【i24】 索拉夫·卡达瓦特 , 汤姆·科纳利 , 阿曼达·阿斯克尔 , 汤姆·海尼汉 , 黎明排水沟 , 伊桑·佩雷斯 , 尼古拉斯·希弗 , 扎克·哈特菲尔德-道奇 , 新达萨玛 , 埃利·特兰·约翰逊 , 斯科特·约翰斯顿 , Sheer El Showk公司 , 安迪·琼斯 , 纳尔逊·埃尔哈吉 , 特里斯坦·休姆 , 安娜·陈 , 白云涛 , 萨姆·鲍曼 , 斯坦尼斯拉夫堡 , 深神经节 , 丹尼·埃尔南德斯 , 乔什·雅各布森 , 杰克逊·科尼翁 , 肖娜·克拉维克 , 莉安·洛维特 , 卡迈勒·恩杜塞 , 凯瑟琳·奥尔森 , 萨姆·林格 , 达里奥·阿莫迪 , 汤姆·布朗 , 杰克·克拉克 , 尼古拉斯·约瑟夫 , 本·曼 , 萨姆·麦肯迪什 , 克里斯·欧拉 , 贾里德·卡普兰 :
语言模型(大多数)知道他们知道什么。 CoRR公司 abs/2207.05221 ( 2022 ) [第23条] 深神经节 , 莉安·洛维特 , 杰克逊·科尼翁 , 阿曼达·阿斯克尔 , 白云涛 , 索拉夫·卡达瓦特 , 本·曼 , 伊桑·佩雷斯 , 尼古拉斯·希弗 , 卡迈勒·恩杜塞 , 安迪·琼斯 , 萨姆·鲍曼 , 安娜·陈 , 汤姆·科纳利 , 新达萨玛 , 黎明排水沟 , 纳尔逊·埃尔哈吉 , Sheer El Showk公司 , 斯坦尼斯拉夫堡 , 扎克·哈特菲尔德-道奇 , 汤姆·海尼汉 , 丹尼·埃尔南德斯 , 特里斯坦·休姆 , 乔什·雅各布森 , 斯科特·约翰斯顿 , 肖娜·克拉维克 , 凯瑟琳·奥尔森 , 萨姆·林格 , 埃利·特兰·约翰逊 , 达里奥·阿莫迪 , 汤姆·布朗 , 尼古拉斯·约瑟夫 , 萨姆·麦肯迪什 , 克里斯·欧拉 , 贾里德·卡普兰 , 杰克·克拉克 :
减少危害的红色团队语言模型:方法、衡量行为和经验教训。 CoRR公司 abs/2209.07858 ( 2022 ) [i22] 纳尔逊·埃尔哈吉 , 特里斯坦·休姆 , 凯瑟琳·奥尔森 , 尼古拉斯·希弗 , 汤姆·海尼汉 , 肖娜·克拉维克 , 扎克·哈特菲尔德-道奇 , 罗伯特·拉森比 , 黎明排水沟 , 陈盈琏 , 罗杰·格罗斯 , 萨姆·麦肯迪什 , 贾里德·卡普兰 , 达里奥·阿莫迪 , 瓦滕伯格 , 克里斯托弗·奥拉 :
叠加玩具模型。 CoRR公司 abs/2209.10652 ( 2022 ) 【i21】 凯瑟琳·奥尔森 , 纳尔逊·埃尔哈吉 , 内尔·南达 , 尼古拉斯·约瑟夫 , 新达萨玛 , 汤姆·海尼汉 , 本·曼 , 阿曼达·阿斯克尔 , 白云涛 , 安娜·陈 , 汤姆·科纳利 , 黎明排水沟 , 深神经节 , 扎克·哈特菲尔德-道奇 , 丹尼·埃尔南德斯 , 斯科特·约翰斯顿 , 安迪·琼斯 , 杰克逊·科尼翁 , 莉安·洛维特 , 卡迈勒·恩杜塞 , 达里奥·阿莫迪 , 汤姆·布朗 , 杰克·克拉克 , 贾里德·卡普兰 , 萨姆·麦肯迪什 , 克里斯·欧拉 :
在线学习和入职指导。 CoRR公司 abs/2209.11895 ( 2022 ) [i20] 塞缪尔·鲍曼 , Jeeyoon Hyun先生 , 伊桑·佩雷斯 , 埃德温·陈 , 克雷格·佩蒂特 , 斯科特·海纳 , 卡米尔·卢科苏特 , 阿曼达·阿斯克尔 , 安迪·琼斯 , 安娜·陈 , 安娜·戈迪 , 阿扎利亚·米罗塞尼 , 卡梅隆·麦金农 , 克里斯托弗·奥拉 , 丹妮拉·阿莫迪 , 达里奥·阿莫迪 , 黎明排水沟 , 达斯汀·李 , 埃利·特兰·约翰逊 , 杰克逊·科尼翁 , 杰米·克尔 , 贾里德·米勒 , 杰弗里·拉迪什 , 约书亚·兰道 , 卡迈勒·恩杜塞 , 莉安·洛维特 , 纳尔逊·埃尔哈吉 , 尼古拉斯·希弗 , 尼古拉斯·约瑟夫 , 诺米·梅尔卡多 , 新达萨玛 , 罗宾·拉尔森 , 萨姆·麦肯迪什 , 桑迪潘·昆都 , 斯科特·约翰斯顿 , 肖娜·克拉维克 , Sheer El Showk公司 , 斯坦尼斯拉夫堡 , 蒂莫西·特利恩·劳顿 , 汤姆·布朗 , 汤姆·海尼汉 , 特里斯坦·休姆 , 白云涛 , 扎克·哈特菲尔德-道奇 , 本·曼 , 贾里德·卡普兰 :
衡量大型语言模型可扩展监督的进展。 CoRR公司 abs/2211.03540 ( 2022 ) [i19] 白云涛 , 索拉夫·卡达瓦特 , 桑迪潘·昆都 , 阿曼达·阿斯克尔 , 杰克逊·科尼翁 , 安迪·琼斯 , 安娜·陈 , 安娜·戈迪 , 阿扎利亚·米罗塞尼 , 卡梅隆·麦金农 , 陈盈琏 , 凯瑟琳·奥尔森 , 克里斯托弗·奥拉 , 丹尼·埃尔南德斯 , 黎明排水沟 , 深神经节 , 达斯汀·李 , 埃利·特兰·约翰逊 , 伊桑·佩雷斯 , 杰米·克尔 , 贾里德·米勒 , 杰弗里·拉迪什 , 约书亚·兰道 , 卡迈勒·恩杜塞 , 卡米尔·卢科苏特 , 莉安·洛维特 , 迈克尔·塞利托 , 纳尔逊·埃尔哈吉 , 尼古拉斯·希弗 , 诺米·梅尔卡多 , 新达萨玛 , 罗伯特·拉森比 , 罗宾·拉尔森 , 萨姆·林格 , 斯科特·约翰斯顿 , 肖娜·克拉维克 , Sheer El Showk公司 , 斯坦尼斯拉夫堡 , 塔梅拉·拉纳姆 , 蒂莫西·特利恩·劳顿 , 汤姆·科纳利 , 汤姆·海尼汉 , 特里斯坦·休姆 , 塞缪尔·鲍曼 , 扎克·哈特菲尔德-道奇 , 本·曼 , 达里奥·阿莫迪 , 尼古拉斯·约瑟夫 , 萨姆·麦肯迪什 , 汤姆·布朗 , 贾里德·卡普兰 :
宪法AI:来自AI反馈的无害性。 CoRR公司 腹肌/2212.08073 ( 2022 ) [i18] 伊桑·佩雷斯 , 萨姆·林格 , 卡米尔·卢科苏特 , 卡琳娜·阮 , 埃德温·陈 , 斯科特·海纳 , 克雷格·佩蒂特 , 凯瑟琳·奥尔森 , 桑迪潘·昆都 , 索拉夫·卡达瓦特 , 安迪·琼斯 , 安娜·陈 , 本·曼 , 布莱恩·伊斯雷尔 , 布莱恩·西索尔 , 卡梅隆·麦金农 , 克里斯托弗·奥拉 , 大雁 , 丹妮拉·阿莫迪 , 达里奥·阿莫迪 , 黎明排水沟 , 达斯汀·李 , 埃利·特兰·约翰逊 , 古罗·昆达泽 , 杰克逊·科尼翁 , 詹姆斯·兰迪斯 , 杰米·克尔 , 贾里德·米勒 , Jeeyoon Hyun先生 , 约书亚·兰道 , 卡迈勒·恩杜塞 , 兰登·戈德堡 , 莉安·洛维特 , 马丁·卢卡斯 , 迈克尔·塞利托 , 米兰达·张 , 内拉夫·金斯兰 , 纳尔逊·埃尔哈吉 , 尼古拉斯·约瑟夫 , 诺米·梅尔卡多 , 新达萨玛 , 奥利弗·劳什 , 罗宾·拉尔森 , 萨姆·麦肯迪什 , 斯科特·约翰斯顿 , 肖娜·克拉维克 , Sheer El Showk公司 , 塔梅拉·拉纳姆 , 蒂莫西·特利恩·劳顿 , 汤姆·布朗 , 汤姆·海尼汉 , 特里斯坦·休姆 , 白云涛 , 扎克·哈特菲尔德-道奇 , 杰克·克拉克 , 塞缪尔·鲍曼 , 阿曼达·阿斯克尔 , 罗杰·格罗斯 , 丹尼·埃尔南德斯 , 深神经节 , 埃文·胡宾格 , 尼古拉斯·希弗 , 贾里德·卡普兰 :
使用模型编写的求值发现语言模型行为。 CoRR公司 abs/2212.09251 ( 2022 ) 2021 [i17] 马克·陈 , 杰里·特沃雷克 , Heewoo Jun先生 , 袁启明 , 奥利维拉·平托(Henrique Pondéde Oliveira Pinto) , 贾里德·卡普兰 , 哈里森·爱德华兹 , 尤里·伯达 , 尼古拉斯·约瑟夫 , 格雷格·布罗克曼 , 亚历克斯·雷 , 劳尔·普里 , 格雷琴·克鲁格 , 迈克尔·彼得罗夫 , 海蒂·赫拉夫 , Girish Sastry女士 , 帕梅拉·米什金 , 布鲁克·陈 , 史考特·葛瑞 , 尼克·莱德 , 米哈伊尔·巴甫洛夫 , 阿莱西亚·鲍尔 , 卢卡斯·凯泽 , 穆罕默德·巴伐利亚 , 克莱门斯·温特 , 菲利普·蒂莱特 , Felipe Petroski如此 , 戴夫·卡明斯 , 马提亚斯·普拉佩特 , Fotios Chantzis公司 , 伊丽莎白·巴恩斯 , 阿里尔·赫伯特·沃斯 , 威廉·赫布根·格斯 , 亚历克斯·尼科尔 , 亚历克斯·潘诺 , 尼古拉斯·特扎克 , 杰唐 , 伊戈尔·巴布什金 , 苏奇尔·巴拉吉 , 山塔努耆那教 , 桑德斯 , 克里斯托弗·黑塞 , 安德鲁·卡尔 , 简·雷克 , 约书亚·阿齐姆 , Vedant Misra公司 , Evan Morikawa先生 , 亚历克·拉德福德 , 马修·奈特 , Miles Brundage公司 , 米拉·穆拉蒂 , 凯蒂·梅尔 , 彼得·韦林德 , 鲍勃·麦克格鲁 , 达里奥·阿莫迪 , 萨姆·麦肯迪什 , 伊利亚·萨茨克沃 , Wojciech Zaremba公司 :
评估经过代码培训的大型语言模型。 CoRR公司 腹肌/2107.03374 ( 2021 ) [i16] 阿曼达·阿斯克尔 , 白云涛 , 安娜·陈 , 黎明排水沟 , 深神经节 , 汤姆·海尼汉 , 安迪·琼斯 , 尼古拉斯·约瑟夫 , 本杰明·曼 , 新达萨玛 , 纳尔逊·埃尔哈吉 , 扎克·哈特菲尔德-道奇 , 丹尼·埃尔南德斯 , 杰克逊·科尼翁 , 卡迈勒·恩杜塞 , 凯瑟琳·奥尔森 , 达里奥·阿莫迪 , 汤姆·B·布朗 , 杰克·克拉克 , 萨姆·麦肯迪什 , 克里斯·欧拉 , 贾里德·卡普兰 :
作为校准实验室的通用语言助理。 CoRR公司 abs/2112.00861 ( 2021 ) 2020 【c6】 汤姆·B·布朗 , 本杰明·曼 , 尼克·莱德 , 梅兰妮·苏比亚赫 , 贾里德·卡普兰 , 普拉福拉·达里瓦尔 , 阿尔文德·内拉坎坦 , 普拉纳夫·希亚姆 , Girish Sastry女士 , 阿曼达·阿斯克尔 , 桑迪尼·阿加瓦尔 , 阿里尔·赫伯特·沃斯 , 格雷琴·克鲁格 , 汤姆·海尼汉 , 重写子对象 , 阿迪蒂亚·拉梅什 , 丹尼尔·齐格勒 , 杰弗里·吴 , 克莱门斯·温特 , 克里斯托弗·黑塞 , 马克·陈 , 埃里克·西格勒 , 马特乌斯·利特温 , 史考特·葛瑞 , 本杰明国际象棋 , 杰克·克拉克 , 克里斯托弗·伯纳 , 萨姆·麦肯迪什 , 亚历克·拉德福德 , 伊利亚·萨茨克沃 , 达里奥·阿莫迪 :
语言模型是少数快速学习者。 NeurIPS公司 2020 【c5】 尼桑·斯汀农 , 龙欧阳 , 杰弗里·吴 , 丹尼尔·齐格勒 , 瑞恩·洛维 , 切尔西·沃斯 , 亚历克·拉德福德 , 达里奥·阿莫迪 , 保罗·F·克里斯蒂亚诺 :
学习用人的反馈进行总结。 NeurIPS公司 2020 【i15】 贾里德·卡普兰 , 萨姆·麦肯迪什 , 汤姆·海尼汉 , 汤姆·B·布朗 , 本杰明国际象棋 , 重写子对象 , 史考特·葛瑞 , 亚历克·拉德福德 , 杰弗里·吴 , 达里奥·阿莫迪 :
神经语言模型的缩放律。 CoRR公司 abs/2001.08361 ( 2020 ) [第14条] 汤姆·B·布朗 , 本杰明·曼 , 尼克·莱德 , 梅兰妮·苏比亚赫 , 贾里德·卡普兰 , 普拉福拉·达里瓦尔 , 阿尔文德·内拉坎坦 , 普拉纳夫·希亚姆 , Girish Sastry女士 , 阿曼达·阿斯克尔 , 桑迪尼·阿加瓦尔 , 阿里尔·赫伯特·沃斯 , 格雷琴·克鲁格 , 汤姆·海尼汉 , 重写子对象 , 阿迪蒂亚·拉梅什 , 丹尼尔·齐格勒 , 杰弗里·吴 , 克莱门斯·温特 , 克里斯托弗·黑塞 , 马克·陈 , 埃里克·西格勒 , 马特乌斯·利特温 , 史考特·葛瑞 , 本杰明国际象棋 , 杰克·克拉克 , 克里斯托弗·伯纳 , 萨姆·麦肯迪什 , 亚历克·拉德福德 , 伊利亚·萨茨克沃 , 达里奥·阿莫迪 :
语言模型是少数快速学习者。 CoRR公司 abs/2005.14165 ( 2020 ) [i13] 尼桑·斯汀农 , 龙欧阳 , 吴建福 , 丹尼尔·齐格勒 , 瑞恩·洛维 , 切尔西·沃斯 , 亚历克·拉德福德 , 达里奥·阿莫迪 , 保罗·F·克里斯蒂亚诺 :
学习从人的反馈中总结。 CoRR公司 abs/2009.01325 ( 2020 ) [i12] 汤姆·海尼汉 , 贾里德·卡普兰 , 莫尔·卡茨 , 马克·陈 , 克里斯托弗·黑塞 , 雅各布·杰克逊 , Heewoo Jun先生 , 汤姆·B·布朗 , 普拉福拉·达里瓦尔 , 史考特·葛瑞 , 克里斯·哈莱西 , 本杰明·曼 , 亚历克·拉德福德 , 阿迪蒂亚·拉梅什 , 尼克·莱德 , 丹尼尔·齐格勒 , 约翰·舒尔曼 , 达里奥·阿莫迪 , 萨姆·麦肯迪什 :
自回归生成模型的缩放律。 CoRR公司 abs/2010.14701 ( 2020 )
2010 – 2019
2019 [i11] 丹尼尔·齐格勒 , 尼桑·斯汀农 , 杰弗里·吴 , 汤姆·B·布朗 , 亚历克·拉德福德 , 达里奥·阿莫迪 , 保罗·F·克里斯蒂亚诺 , 杰弗里·欧文 :
人类偏好的微调语言模型。 CoRR公司 abs/1909.08593 ( 2019 ) 2018 【c4】 博尔贾·伊巴兹 , 简·雷克 , 托比亚斯·波伦 , 杰弗里·欧文 , 谢恩·莱格 , 达里奥·阿莫迪 :
奖励从人类偏好和Atari演示中学习。 NeurIPS公司 2018 : 8022-8034 [i10] Miles Brundage公司 , 沙哈尔·阿文 , 杰克·克拉克 , 海伦·托纳 , 埃克斯利 , 本·加芬克尔 , 阿兰·达福 , 保罗·沙雷 , 托马斯·泽托夫 , 鲍比·菲拉 , 海勒姆·S·安德森 , 希瑟·罗夫 , 格雷戈里·艾伦 , 雅各布·斯坦哈特 , 卡里克·弗林 , Seán Ohéigeartaigh先生 , 西蒙·比尔德 , 海顿·贝尔菲尔德 , 塞巴斯蒂安·法夸尔 , 克莱尔·莱尔 , 丽贝卡·克罗托夫 , 欧文·埃文斯 , 米高蒲志 , 乔安娜·布莱森 , 罗曼·扬波尔斯基 , 达里奥·阿莫迪 :
人工智能的恶意使用:预测、预防和缓解。 CoRR公司 abs/1802.07228 ( 2018 ) [第九章] 杰弗里·欧文 , 保罗·F·克里斯蒂亚诺 , 达里奥·阿莫迪 :
通过辩论实现AI安全。 CoRR公司 abs/1805.00899 ( 2018 ) [i8] 约书亚·阿齐姆 , 哈里森·爱德华兹 , 达里奥·阿莫迪 , 彼得·阿比尔 :
变分期权发现算法。 CoRR公司 abs/1807.10299 ( 2018 ) [i7] 保罗·F·克里斯蒂亚诺 , 巴克·施莱格里斯 , 达里奥·阿莫迪 :
通过强化薄弱的专家来监督优秀的学习者。 CoRR公司 abs/1810.08575 ( 2018 ) [i6] 博尔贾·伊巴兹 , 简·雷克 , 托比亚斯·波伦 , 杰弗里·欧文 , 谢恩·莱格 , 达里奥·阿莫迪 :
奖励从人类偏好和Atari演示中学习。 CoRR公司 abs/1811.06521 ( 2018 ) [i5] 萨姆·麦肯迪什 , 贾里德·卡普兰 , 达里奥·阿莫迪 , OpenAI Dota团队 :
大批量训练的经验模型。 CoRR公司 abs/1812.06162 ( 2018 ) 2017 【c3】 阿尔文德·内拉坎坦 , Quoc V.乐 , 马丁·阿巴迪 , 安德鲁·麦克拉姆 , 达里奥·阿莫迪 :
用神经程序员学习自然语言界面。 ICLR(海报) 2017 【c2】 保罗·F·克里斯蒂亚诺 , 简·雷克 , 汤姆·B·布朗 , Miljan Martic公司 , 谢恩·莱格 , 达里奥·阿莫迪 :
从人类偏好中深度强化学习。 钳口 2017 : 4299-4307 [i4] 保罗·F·克里斯蒂亚诺 , 简·雷克 , 汤姆·B·布朗 , Miljan Martic公司 , 谢恩·莱格 , 达里奥·阿莫迪 :
从人类偏好中进行深度强化学习。 CoRR公司 abs/1706.03741 ( 2017 ) 2016 【c1】 达里奥·阿莫迪 , Sundaram Ananthanaarayanan公司 , 里希塔·阿努拜 , 白景亮 , 埃里克·巴滕伯格 , 卡尔·凯斯 , 贾里德·卡斯珀 , 布莱恩·卡坦扎罗 , 陈京东 , 迈克·克扎诺夫斯基 , 亚当·考特斯 , 格雷格·迪亚莫斯 , 埃里希·埃尔森 , 杰西·恩格尔 , 林西风扇 , 克里斯托弗·福格纳 , Awni Y.Hannun先生 , 比利·俊 , 托尼·韩 , 帕特里克·勒格雷斯利 , 李向刚 , 利比·林 , 沙兰·纳朗 , 恩吉 , 谢尔吉尔·奥扎尔 , 瑞恩·普伦格 , 盛倩 , 乔纳森·雷曼 , 桑吉夫·萨蒂什 , 大卫·西塔彭 , Shubho Sengupta公司 , 王冲(Chong Wang) , 王毅(Yi Wang) , 王志谦 , 薄晓 , 闫邪 , Dani Yogatama公司 , Jun Zhan先生 , 朱振耀 :
深度演讲2:英语和普通话中的端到端语音识别。 ICML公司 2016 : 173-182 [i3] 达里奥·阿莫迪 , 克里斯·欧拉 , 雅各布·斯坦哈特 , 保罗·F·克里斯蒂亚诺 , 约翰·舒尔曼 , 丹·马内 :
人工智能安全中的具体问题。 CoRR公司 abs/1606.06565 ( 2016 ) [i2] 阿尔文德·内拉坎坦 , Quoc V.乐 , 马丁·阿巴迪 , 安德鲁·麦克拉姆 , 达里奥·阿莫迪 :
用神经程序员学习自然语言界面。 CoRR公司 abs/1611.08945 ( 2016 ) 2015 [i1] 达里奥·阿莫迪 , 里希塔·阿努拜 , 埃里克·巴滕伯格 , 卡尔·凯斯 , 贾里德·卡斯珀 , 布莱恩·卡坦扎罗 , 陈京东 , 迈克·克扎诺夫斯基 , 亚当·考特斯 , 格雷格·迪亚莫斯 , 埃里希·埃尔森 , 杰西·恩格尔 , 林西风扇 , 克里斯托弗·福格纳 , 托尼·韩 , Awni Y.Hannun先生 , 比利·俊 , 帕特里克·勒格雷斯利 , 利比·林 , 沙兰·纳朗 , 恩吉 , 谢尔吉尔·奥扎尔 , 瑞恩·普伦格 , 乔纳森·雷曼 , 桑吉夫·萨蒂什 , 大卫·西塔彭 , Shubho Sengupta公司 , 王毅(Yi Wang) , 王志谦 , 王冲(Chong Wang) , 薄晓 , Dani Yogatama公司 , Jun Zhan先生 , 朱振耀 :
深度演讲2:英语和普通话中的端到端语音识别。 CoRR公司 abs/1512.02595 ( 2015 ) 2014 [注2] Gasper Tkacik公司 , 奥利维尔·玛丽 , 达里奥·阿莫迪 , 埃拉·施奈德曼 , 威廉·比亚莱克 , 迈克尔·贝里二世 :
在大型感觉神经元网络中寻找集体行为。 公共科学图书馆计算。 生物。 10 ( 1 ) ( 2014 ) 2013 [j1] 亚当·H·大理石 , 布拉德利·赞夫特 , 亚尔·马奎尔 , 米哈伊尔·沙皮罗 , 塞迪斯·西布尔斯基 , 约书亚·I·格拉泽 , 达里奥·阿莫迪 , P.本杰明·斯特兰克斯 , 雷扎·卡霍尔 , 大卫·达尔林普尔 , 东进Seo , Elad Alon公司 , 米歇尔·马哈尔比兹 , 何塞·M·卡梅纳 , 简·M·拉比 , 爱德华·博伊登三世 , 乔治·M·丘奇 , 康拉德·P·科林 :
可扩展神经记录的物理原理。 前沿计算。 神经科学。 7 : 137 ( 2013 )