艾森·加布里埃尔
人员信息
优化列表
2020年–今天
2024 【c6】 阿里安娜·曼奇尼 , 杰夫·基林 , 纳赫玛·马查尔 , 凯文·麦基 , 维伦娜·里瑟 , 艾森·加布里埃尔 :
用户应该信任高级人工智能助理吗? 正当信托作为能力和一致性的函数。 FAccT公司 2024 : 1174-1186 [i17] 劳拉·魏丁格 , 乔斯琳·巴恩哈特 , 珍妮·布伦南 , 克里斯蒂娜·巴特菲尔德 , 苏西·杨 , 威尔·霍金斯 , 丽莎·安妮·亨德里克斯 , 雷蒙娜·科马内斯库 , 张伟钦 , 米凯尔·罗德里格斯 , 詹妮弗·贝罗西 , 道恩·布洛克斯威奇 , 列夫·普罗列夫 , 吉林陈 , 塞巴斯蒂安·法夸尔 , 何小黑 , 艾森·加布里埃尔 , 阿兰·达福 , 艾萨克 :
先进人工智能模型的整体安全和责任评估。 CoRR公司 abs/2404.14068 ( 2024 ) [i16] 艾森·加布里埃尔 , 阿里安娜·曼奇尼 , 杰夫·基林 , 丽莎·安妮·亨德里克斯 , 维伦娜·里瑟 , 哈桑·伊克巴尔 , 内纳德·托马塞夫 , 伊拉·克特纳 , 扎卡里·肯顿 , 米凯尔·罗德里格斯 , 塞利姆·埃尔·萨耶德 , 萨沙·布朗 , 坎弗·阿克布鲁特 , 安德鲁·特拉斯克 , 爱德华·休斯 , A.史蒂夫·伯格曼 , 蕾妮·谢尔比 , 纳赫玛·马查尔 , 康纳·格里芬 , 胡安·马特奥斯·加西亚 , 劳拉·魏丁格 , 温妮街 , 本杰明·兰格 , 亚历克斯·英格曼 , 艾莉森·伦茨 , 里德·恩格尔 , 安德鲁·巴拉卡特 , 维多利亚·克拉科夫纳 , 约翰·奥利弗·西伊 , 泽布·库尔斯·纳尔逊 , 阿曼达·麦克罗斯克里 , 维杰·博利纳 , 哈里·劳 , 默里·沙纳汉 , 莉斯·阿尔伯茨 , 博尔贾·巴利 , 萨拉·德·哈斯 , 叶通德·伊比托耶 , 阿兰·达福 , 贝斯·戈德堡 , 塞巴斯蒂安·克里尔 , 亚历山大·里斯 , 西姆斯·威瑟斯彭 , 威尔·霍金斯 , 玛丽贝斯·劳赫 , 唐·华莱士 , 马蒂亚·富兰克林 , 乔什·A·戈尔茨坦 , 乔尔·雷曼 , 迈克尔·克伦克 , 香农·瓦勒 , 考特尼·比尔斯 , 梅雷迪思·林格尔·莫里斯 , 海伦·金 , 布莱斯·阿圭拉(Blaise Agüera y Arcas) , 艾萨克 , 詹姆斯·曼伊卡 :
高级人工智能助理的道德规范。 CoRR公司 腹肌/240416244 ( 2024 ) 2023 【c5】 A.史蒂夫·伯格曼 , 丽莎·安妮·亨德里克斯 , 玛丽贝斯·劳赫 , 吴伯西 , 威廉·阿格纽 , 马库斯·库内什 , 伊莎贝拉·段 , 艾森·加布里埃尔 , 艾萨克 :
AI评估代表。 FAccT公司 2023 : 519-533 【i15】 托比·谢夫兰 , 塞巴斯蒂安·法夸尔 , 本·加芬克尔 , 玛丽·冯 , 杰斯·惠特尔斯通 , 梁琤 , 丹尼尔·科科塔基洛 , 纳赫玛·马查尔 , 马库斯·安德荣格 , 诺姆·科尔特 , 何小黑 , 迪维亚·西达斯 , 沙哈尔·阿文 , 威尔·霍金斯 , Been Kim(金) , 艾森·加布里埃尔 , 维杰·博利纳 , 杰克·克拉克 , 本吉奥 , 保罗·F·克里斯蒂亚诺 , 阿兰·达福 :
极端风险的模型评估。 CoRR公司 abs/2305.15324 ( 2023 ) [第14条] 劳拉·魏丁格 , 玛丽贝斯·劳赫 , 纳赫玛·马查尔 , 阿里安娜·曼奇尼 , 丽莎·安妮·亨德里克斯 , 胡安·马特奥斯·加西亚 , A.史蒂夫·伯格曼 , 杰基·凯 , 康纳·格里芬 , 本·巴里亚奇 , 艾森·加布里埃尔 , 维伦娜·里瑟 , 艾萨克 :
生成性人工智能系统的社会技术安全评估。 CoRR公司 abs/2310.11986 ( 2023 ) 2022 【c4】 阿贝巴·比哈内 , 艾萨克 , 维诺德库马尔·普拉巴卡兰 , 马克·迪亚兹 , 马德琳·克莱尔·埃利什 , 艾森·加布里埃尔 , 夏基尔·穆罕默德 :
人民的权力? 参与式人工智能的机遇与挑战。 EAAMO公司 2022 : 6:1-6:8 【c3】 劳拉·魏丁格 , 乔纳森·尤萨托 , 玛丽贝斯·劳赫 , 康纳·格里芬 , 黄宝森 , 约翰·梅勒 , 阿米莉亚·格莱斯 , 迈拉·程 , 博尔贾·巴利 , 阿图萨·卡西尔扎德 , 考特尼·比尔斯 , 萨沙·布朗 , 扎克·肯顿 , 威尔·霍金斯 , 汤姆·斯特普顿 , 阿贝巴·比哈内 , 丽莎·安妮·亨德里克斯 , 劳拉·里梅尔 , 艾萨克 , 朱莉娅·哈斯 , 肖恩·莱加西克 , 杰弗里·欧文 , 艾森·加布里埃尔 :
语言模型构成的风险分类。 FAccT公司 2022 : 214-229 【c2】 玛丽贝斯·劳赫 , 约翰·梅勒 , 乔纳森·尤萨托 , 黄伯森 , 约翰内斯·韦尔布尔 , 劳拉·魏丁格 , 苏曼特·达塔赫里 , 阿米莉亚·格莱斯 , 杰弗里·欧文 , 艾森·加布里埃尔 , 艾萨克 , 丽莎·安妮·亨德里克斯 :
有害文本的特征:朝向严格的语言模型基准。 NeurIPS公司 2022 [i13] 玛丽贝斯·劳赫 , 约翰·梅勒 , 乔纳森·尤萨托 , 黄伯森 , 约翰内斯·韦尔布尔 , 劳拉·魏丁格 , 苏曼特·达塔赫里 , 阿米莉亚·格莱斯 , 杰弗里·欧文 , 艾森·加布里埃尔 , 艾萨克 , 丽莎·安妮·亨德里克斯 :
有害文本的特征:朝向严格的语言模型基准。 CoRR公司 abs/2206.08325 ( 2022 ) [i12] 阿图萨·卡西尔扎德 , 艾森·加布里埃尔 :
在与人工智能的对话中:将语言模型与人类价值观结合起来。 CoRR公司 abs/2209.00731 ( 2022 ) [i11] 阿贝巴·比哈内 , 艾萨克 , 维诺德库马尔·普拉巴卡兰 , 马克·迪亚斯 , 马德琳·克莱尔·埃利什 , 艾森·加布里埃尔 , 夏基尔·穆罕默德 :
人民的权力? 参与式人工智能的机遇与挑战。 CoRR公司 abs/2209.07572 ( 2022 ) [i10] 阿米莉亚·格莱斯 , 纳特·麦克莱塞 , 马贾·特雷巴茨 , 约翰·阿斯兰尼德斯 , 弗拉德·菲鲁 , 蒂莫·埃瓦兹 , 玛丽贝斯·劳赫 , 劳拉·魏丁格 , 马丁·查德威克 , 菲比·萨克 , 露西·坎贝尔(Lucy Campbell-Gillingham) , 乔纳森·尤萨托 , 黄伯森 , 雷蒙娜·科马内斯库 , 范扬 , 阿比盖尔·西奥 , 苏曼特·达塔赫里 , 罗里·格雷格 , 赵开方 , 道格·弗里茨 , 杰姆·桑切斯·埃利亚斯 , 理查德·格林 , Sona Mokrá , 尼古拉斯·费尔南多 , 吴伯西 , 雷切尔·福利 , 苏珊娜·杨 , 艾森·加布里埃尔 , 艾萨克 , 约翰·梅勒 , 哈萨比斯 , 科雷·卡武科格鲁 , 丽莎·安妮·亨德里克斯 , 杰弗里·欧文 :
通过有针对性的人类判断改善对话主体的一致性。 CoRR公司 abs/2209.14375 ( 2022 ) [第九章] 维诺德库马尔·普拉巴卡兰 , 玛格丽特·米切尔 , 蒂姆尼特·格布鲁 , 艾森·加布里埃尔 :
基于人权的负责任人工智能方法。 CoRR公司 abs/2210.02667 ( 2022 ) [i8] 内纳德·托马塞夫 , 乔纳森·利德·梅纳德 , 艾森·加布里埃尔 :
人工智能系统中仇外心理的表现。 CoRR公司 腹肌/2212.07877 ( 2022 ) 2021 【c1】 米歇尔·巴克尔 , 理查德·埃弗雷特 , 劳拉·魏丁格 , 艾森·加布里埃尔 , 威廉·艾萨克 , 乔尔·雷波 , 爱德华·休斯 :
具有时空复杂性的网络游戏合作建模。 美国原子能机构 2021 : 1455-1457 [i7] 艾森·加布里埃尔 , 瓦法·加扎维 :
价值校准的挑战:从公平算法到人工智能安全。 CoRR公司 abs/2101.06060 ( 2021 ) [i6] 米歇尔·巴克尔 , 理查德·埃弗雷特 , 劳拉·魏丁格 , 艾森·加布里埃尔 , 威廉·艾萨克 , 乔尔·雷波 , 爱德华·休斯 :
具有时空复杂性的网络游戏合作建模。 CoRR公司 abs/2102.06911 ( 2021 ) [i5] 扎卡里·肯顿 , 汤姆·艾唯瑞特 , 劳拉·魏丁格 , 艾森·加布里埃尔 , 弗拉基米尔·米库利克 , 杰弗里·欧文 :
语言代理的对齐。 CoRR公司 abs/2103.14659 ( 2021 ) [i4] 艾森·加布里埃尔 :
走向人工智能的正义理论。 CoRR公司 abs/2110.14419 ( 2021 ) [i3] 劳拉·魏丁格 , 约翰·梅勒 , 玛丽贝斯·劳赫 , 康纳·格里芬 , 乔纳森·尤萨托 , 黄伯森 , Myra Cheng女士 , 米娅·格莱斯 , 博尔贾·巴利 , 阿图萨·卡西尔扎德 , 扎克·肯顿 , 萨沙·布朗 , 威尔·霍金斯 , 汤姆·斯特普顿 , 考特尼·比尔斯 , 阿贝巴·比哈内 , 朱莉娅·哈斯 , 劳拉·里梅尔 , 丽莎·安妮·亨德里克斯 , 艾萨克 , 肖恩·莱加西克 , 杰弗里·欧文 , 艾森·加布里埃尔 :
语言模式带来的道德和社会危害风险。 CoRR公司 abs/2112.04359 ( 2021 ) [i2] 杰克·W·雷 , 塞巴斯蒂安·博尔戈 , 特雷弗·蔡 , 凯蒂·米利肯 , 乔丹·霍夫曼 , H.弗朗西斯·宋 , 约翰·阿斯兰尼德斯 , 萨拉亨德森 , 罗马戒指 , 苏珊娜·杨 , 伊丽莎·卢瑟福 , 汤姆·亨尼根 , 雅各布·梅尼克 , 阿尔宾·卡西尔 , 鲍威尔 , 乔治·范·登·德里斯(George van den Driessche) , 丽莎·安妮·亨德里克斯 , 玛丽贝斯·劳赫 , 黄伯森 , 艾米莉亚·格拉泽 , 约翰内斯·韦尔布尔 , 苏曼特·达塔赫里 , 藏红花黄 , 乔纳森·尤萨托 , 约翰·梅勒 , 伊琳娜·希金斯 , 安东尼娅·克雷斯韦尔 , 纳特·麦克莱塞 , 艾米·吴 , 埃里希·埃尔森 , Siddhant M.Jayakumar先生 , 埃琳娜·布恰茨卡娅 , 大卫·布登 , 埃斯梅·萨瑟兰 , 凯伦·西蒙扬 , 米歇尔·帕格尼尼 , 劳伦特·西弗雷 , 莉娜·马滕斯 , 李向洛林 , Adhiguna Kuncoro公司 , 艾达·内马扎德 , 埃琳娜·格里博夫斯卡娅 , Domenic多纳托 , 安吉利基·拉扎里杜 , 阿瑟·门施 , Jean-Baptiste Lespiau女士 , 玛丽亚·齐姆波基利 , 尼古拉·格里戈列夫 , 道格·弗里茨 , Thibault Sottiaux公司 , 曼塔斯·帕贾斯卡斯 , 托比·波伦 , 龚志涛 , 丹尼尔·富山 , Cyprien de Masson d'Autume公司 , 李宇佳 , 泰富·特尔齐 , 弗拉基米尔·米库利克 , 伊戈尔·巴布什金 , 艾丹·克拉克 , 迭戈·德·拉斯·卡斯 , 奥雷莉亚·盖伊 , 克里斯·琼斯 , 詹姆斯·布拉德伯里 , 马修·J·约翰逊 , 布莱克·赫奇曼 , 劳拉·魏丁格 , 艾森·加布里埃尔 , 艾萨克 , 爱德华·洛克哈特 , 西蒙·奥斯宾多 , 劳拉·里梅尔 , 克里斯·戴尔 , Oriol葡萄酒 , 卡里姆·阿尤布 , 杰夫·斯坦威 , 洛雷恩·贝内特 , 哈萨比斯 , 科雷·卡武科格鲁 , 杰弗里·欧文 :
缩放语言模型:来自训练地鼠的方法、分析和见解。 CoRR公司 abs/2112.11446 ( 2021 ) 2020 [j1] 艾森·加布里埃尔 :
人工智能、价值观和一致性。 思维马赫。 30 ( 三 ) : 411-437 ( 2020 ) [i1] 艾森·加布里埃尔 :
人工智能、价值观和一致性。 CoRR公司 abs/2001.09768 ( 2020 )