维多利亚·克拉科夫纳
人员信息
SPARQL查询
优化列表
2020年–今天
2024 [i13] 埃文·瑞安·冈特 , 叶夫根尼·利奥库莫维奇 , 维多利亚·克拉科夫纳 :
量化人工制剂中非权力寻求的稳定性。 CoRR公司 abs/2401.03529 ( 2024 ) [i12] 雷蒙德·道格拉斯 , 杰克·卡沃夫斯基 , 陈贝(Chan Bae) , 安迪斯·德拉贡 , 维多利亚·克拉科夫纳 :
预测模型模拟的代理的局限性。 CoRR公司 abs/2402.05829 ( 2024 ) [i11] 玛丽·冯 , 马修·艾奇森 , 埃利奥特·卡特 , 莎拉·科根 , 亚历山大·卡斯卡索利 , 维多利亚·克拉科夫纳 , 大卫·林德纳 , 马修·拉赫茨 , 亚尼斯·阿萨尔 , 莎拉·霍德金森 , 海蒂·霍华德 , 汤姆·利伯伦 , 拉马纳·库马尔 , 玛丽亚·阿比·拉德 , 阿尔伯特·韦伯森 , 何小黑 , 莎伦·林 , 塞巴斯蒂安·法夸尔 , 马库斯·赫特 , 格雷戈伊尔·德雷唐(Grégoire Delétang) , 阿尼安·鲁斯 , 塞利姆·埃尔·萨耶德 , 萨沙·布朗 , 安卡·D·德拉甘 , 罗欣·沙阿 , 阿兰·达福 , 托比·谢夫兰 :
评估危险能力的前沿模型。 CoRR公司 abs/2403.13793 ( 2024 ) [i10] 艾森·加布里埃尔 , 阿里安娜·曼奇尼 , 杰夫·基林 , 丽莎·安妮·亨德里克斯 , 维伦娜·里瑟 , 哈桑·伊克巴尔 , 内纳德·托马塞夫 , 伊拉·克特纳 , 扎卡里·肯顿 , 米凯尔·罗德里格斯 , 塞利姆·埃尔·萨耶德 , 萨沙·布朗 , 坎弗·阿克布卢特 , 安德鲁·特拉斯克 , 爱德华·休斯 , A.史蒂夫·伯格曼 , 蕾妮·谢尔比 , 纳赫玛·马查尔 , 科诺·格里芬 , 胡安·马特奥斯·加西亚 , 劳拉·魏丁格 , 温妮街 , 本杰明·兰格 , 亚历克斯·英格曼 , 艾莉森·伦茨 , 里德·恩格尔 , 安德鲁·巴拉卡特 , 维多利亚·克拉科夫纳 , 约翰·奥利弗·西伊 , 泽布·库思·内尔森 , 阿曼达·麦克罗斯克里 , 维杰·博利纳 , 哈里·劳 , 默里·沙纳汉 , 莉斯·阿尔伯茨 , 博尔贾·巴利 , 萨拉·德·哈斯 , Yetune Ibitoye公司 , 阿兰·达福 , 贝斯·戈德堡 , 塞巴斯蒂安·克里尔 , 亚历山大·里斯 , Sims威瑟斯彭 , 威尔·霍金斯 , 玛丽贝斯·劳赫 , 唐·华莱士 , 马蒂亚·富兰克林 , 乔什·A·戈尔茨坦 , 乔尔·雷曼 , 迈克尔·克伦克 , 香农·瓦勒 , 考特尼·比尔斯 , 梅雷迪思·林格尔·莫里斯 , 海伦·金 , Blaise Agüera y商场 , 艾萨克 , 詹姆斯·曼伊卡 :
高级人工智能助理的道德规范。 CoRR公司 abs/2404.16244 ( 2024 ) 2023 [第九章] 维多利亚·克拉科夫纳 , 杰诺斯·克拉马尔 :
对于训练有素的特工来说,寻求权力是可能的,也是可以预测的。 CoRR公司 abs/2304.06528 ( 2023 ) 2022 [i8] 罗欣·沙阿 , 维克兰·瓦尔马 , 拉马纳·库马尔 , 玛丽·冯 , 维多利亚·克拉科夫纳 , 乔纳森·尤萨托 , 扎克·肯顿 :
目标泛化错误:为什么正确的规范不足以实现正确的目标。 CoRR公司 abs/2210.01790 ( 2022 ) 2021 [j1] 汤姆·艾唯瑞特 , 马库斯·赫特 , 拉马纳·库马尔 , 维多利亚·克拉科夫纳 :
强化学习中的奖励篡改问题和解决方案:因果影响图视角。 合成。 198 ( 27 ) : 6435-6467 ( 2021 ) 2020 【c6】 维多利亚·克拉科夫纳 , 劳伦特·奥尔索 , 理查德·恩戈(Richard Ngo) , Miljan Martic公司 , 谢恩·莱格 :
通过考虑未来任务避免副作用。 NeurIPS公司 2020 [i7] 维多利亚·克拉科夫纳 , 劳伦特·奥尔索 , 理查德·恩戈(Richard Ngo) , Miljan Martic公司 , 谢恩·莱格 :
通过考虑未来任务避免副作用。 CoRR公司 abs/2010.07877 ( 2020 ) [i6] 拉马纳·库马尔 , 乔纳森·尤萨托 , 理查德·恩戈(Richard Ngo) , 汤姆·艾唯瑞特 , 维多利亚·克拉科夫纳 , 谢恩·莱格 :
REALab:关于篡改的嵌入式视角。 CoRR公司 abs/2011.08820 ( 2020 ) [i5] 乔纳森·尤萨托 , 拉马纳·库马尔 , 维多利亚·克拉科夫纳 , 汤姆·艾唯瑞特 , 理查德·恩戈(Richard Ngo) , 谢恩·莱格 :
通过解耦批准避免在Deep RL中篡改激励。 CoRR公司 abs/2011.08827 ( 2020 )
2010 – 2019
2019 【c5】 汤姆·艾唯瑞特 , 拉马纳·库马尔 , 维多利亚·克拉科夫纳 , 谢恩·莱格 :
使用因果影响图对AGI安全框架进行建模。 AIS安全@IJCAI 2019 【c4】 维多利亚·克拉科夫纳 , 劳伦特·奥尔索 , Miljan Martic公司 , 谢恩·莱格 :
使用逐步相对可达性惩罚副作用。 AIS安全@IJCAI 2019 [i4] 汤姆·艾唯瑞特 , 拉马纳·库马尔 , 维多利亚·克拉科夫纳 , 谢恩·莱格 :
使用因果影响图对AGI安全框架进行建模。 CoRR公司 腹肌/1906.08663 ( 2019 ) 2018 [i3] 维多利亚·克拉科夫纳 , 劳伦特·奥尔索 , Miljan Martic公司 , 谢恩·莱格 :
使用相对可达性测量和避免副作用。 CoRR公司 abs/1806.01186 ( 2018 ) 2017 【c3】 汤姆·艾唯瑞特 , 维多利亚·克拉科夫纳 , 劳伦特·奥尔索 , 谢恩·莱格 :
使用损坏的奖励渠道进行强化学习。 国际JCAI 2017 : 4705-4713 [i2] 汤姆·艾唯瑞特 , 维多利亚·克拉科夫纳 , 劳伦特·奥尔索 , 马库斯·赫特 , 谢恩·莱格 :
使用损坏的奖励渠道进行强化学习。 CoRR公司 abs/1705.08417 ( 2017 ) [i1] 简·雷克 , Miljan Martic公司 , 维多利亚·克拉科夫纳 , 佩德罗·奥尔特加 , 汤姆·艾唯瑞特 , 安德鲁·勒弗朗克 , 劳伦特·奥尔索 , 谢恩·莱格 :
AI安全网格世界。 CoRR公司 abs/1711.09883 ( 2017 ) 2016 【c2】 科里·沙因 , 威廉·布莱斯 , 李凤珍(Lifeng Jin) , 维多利亚·克拉科夫纳 , 最终Doshi-Velez , 蒂莫西·米勒 , 威廉·舒勒 , 莱恩·施瓦茨 :
基于儿童定向输入的记忆型左角无监督语法归纳。 冷却 2016 : 964-975 2010 【c1】 马修·斯卡拉 , 维多利亚·克拉科夫纳 , 杰诺斯·克拉马尔 , 杰拉尔德·佩恩 :
概念格压缩编码的广义保零方法。 国际计算语言学协会 2010 : 1512-1521