马克斯·纳多
人员信息
优化列表
2020年–今天
2023 [i5] 桑德·戴维斯 , 马克斯·纳多 , 尼基尔·普拉卡什 , 塔玛尔·罗特·沙哈姆 , 大卫·鲍 :
发现具有欲望的可变绑定电路。 CoRR公司 abs/2307.03637 ( 2023 ) [i4] 斯蒂芬·卡斯珀 , 桑德·戴维斯 , 克劳迪娅·施 , 托马斯·克伦德·吉尔伯特 , 杰雷米·舍勒 , 哈维尔·兰多 , 雷切尔·弗里德曼 , 托马斯·科巴克 , 大卫·林德纳 , 佩德罗·弗雷尔 , 王伟康 , 萨缪尔·马克斯 , 夏贝尔·拉法·塞格里 , 米卡·卡罗尔 , 彭安迪(Andi Peng) , 菲利普·J·K·克里斯托弗森 , 梅胡尔·达马尼 , 斯图尔特·斯洛克姆 , 安瓦尔 , 阿南德·西塔哈兰詹(Anand Sittharanjan) , 马克斯·纳多 , 埃里克·米绍德 , 雅各布·普法 , 德米特里·克拉申尼科夫 , Xin Chen(新晨) , 劳罗·兰戈斯科 , 彼得·哈斯 , 埃尔登·比伊克 , 安卡·D·德拉甘 , 大卫·克鲁格 , 多尔萨·萨迪格 , 迪伦·哈德菲尔德-梅内尔 :
从人类反馈中强化学习的开放性问题和基本局限性。 CoRR公司 abs/2307.15217 ( 2023 ) [i3] 法比安·罗杰 , 瑞恩·格林布拉特 , 马克斯·纳多 , 巴克·施莱格里斯 , 内特·托马斯 :
测量篡改检测基准。 CoRR公司 abs/2308.15605 ( 2023 ) [i2] 马克西米利安·李 , 桑德·戴维斯 , 马克斯·纳多 :
电路中断:使用目标烧蚀移除模型行为。 CoRR公司 腹肌/2309.05973 ( 2023 ) 2022 【c1】 斯蒂芬·卡斯珀 , 马克斯·纳多 , 迪伦·哈德菲尔德-梅内尔 , 加布里埃尔·克里曼 :
强大的特征级对手是可解释性工具。 NeurIPS公司 2022 2021 [i1] 斯蒂芬·卡斯珀 , 马克斯·纳多 , 加布里埃尔·克里曼 :
愚弄所有人的一件事:生成可解释的、通用的和物理上可实现的对手特征。 CoRR公司 腹肌/2110.03605 ( 2021 )