汤姆·利伯伦
人员信息
优化列表
2020年–今天
2024 [i8] 杰诺斯·克拉马尔 , 汤姆·利伯伦 , 罗欣·沙阿 , 内尔·南达 :
AtP*:一种有效且可扩展的方法,用于将LLM行为本地化到组件。 CoRR公司 abs/2403.00745 ( 2024 ) [i7] 玛丽·冯 , 马修·艾奇森 , 埃利奥特·卡特 , 莎拉·科根 , 亚历山大·卡斯卡索利 , 维多利亚·克拉科夫纳 , 大卫·林德纳 , 马修·拉赫茨 , 亚尼斯·阿萨尔 , 莎拉·霍德金森 , 海蒂·霍华德 , 汤姆·利伯伦 , 拉马纳·库马尔 , 玛丽亚·阿比·拉德 , 阿尔伯特·韦伯森 , 何小黑 , 莎伦·林 , 塞巴斯蒂安·法夸尔 , 马库斯·赫特 , 格雷戈伊尔·德雷唐(Grégoire Delétang) , 阿尼安·鲁斯 , 塞利姆·埃尔·萨耶德 , 萨沙·布朗 , 安卡·D·德拉甘 , 罗欣·沙阿 , 阿兰·达福 , 托比·谢夫兰 :
评估危险能力的前沿模型。 CoRR公司 abs/2403.13793 ( 2024 ) [i6] Senthooran Rajamanoharan公司 , 亚瑟·康米 , 刘易斯史密斯 , 汤姆·利伯伦 , 维克兰·瓦尔马 , 杰诺斯·克拉马尔 , 罗欣·沙阿 , 尼尔·南达 :
使用门控稀疏自动编码器改进字典学习。 CoRR公司 abs/2404.16014 ( 2024 ) [i5] Senthooran Rajamanoharan公司 , 汤姆·利伯伦 , 尼古拉斯·桑纳雷特 , 亚瑟·康米 , 维克兰·瓦尔马 , 杰诺斯·克拉马尔 , 内尔·南达 :
向前跳:使用JumpReLU稀疏自动编码器提高重建保真度。 CoRR公司 abs/2407.14435 ( 2024 ) [i4] 汤姆·利伯伦 , Senthooran Rajamanoharan公司 , 亚瑟·康米 , 刘易斯史密斯 , 尼古拉斯·桑纳雷特 , 维克兰·瓦尔马 , 杰诺斯·克拉马尔 , 安卡·D·德拉甘 , 罗欣·沙阿 , 内尔·南达 :
Gemma Scope:在Gemma 2上随时随地打开稀疏自动编码器。 CoRR公司 abs/2408.05147 ( 2024 ) 2023 【c2】 内尔·南达 , 陈源翰 , 汤姆·利伯伦 , 杰斯·史密斯 , 雅各布·斯坦哈特 :
通过机械可解释性探索的进度措施。 ICLR公司 2023 [i3] 内尔·南达 , 陈源翰 , 汤姆·利伯伦 , 杰斯·史密斯 , 雅各布·斯坦哈特 :
通过机械可解释性探索的进度措施。 CoRR公司 腹肌/2301.05217 ( 2023 ) [i2] 汤姆·利伯伦 , 马修·拉赫茨 , 杰诺斯·克拉马尔 , 内尔·南达 , 杰弗里·欧文 , 罗欣·沙阿 , 弗拉基米尔·米库利克 :
电路分析是否具有可解释性? Chinchilla多项选择能力的证据。 CoRR公司 abs/2307.09458 ( 2023 ) 2022 [i1] 罗欣·沙阿 , 史蒂芬·H·王 , 科迪·威尔德 , 斯蒂芬妮·米拉尼 , Anssi Kanervisto公司 , 多汁的G.Goecks , 尼古拉斯·韦托维奇(Nicholas R.Waytowich) , 大卫·沃特金斯·沃尔斯 , 巴拉特·普拉卡什 , 埃德蒙·米尔斯 , 迪维安什·加格 , 亚历山大·弗里斯 , 亚历山大·索利 , 陈俊勋 , 丹尼尔·德尔·卡斯蒂略 , 汤姆·利伯伦 :
2021年BASALT人类反馈学习竞赛回顾。 CoRR公司 abs/2204.07123 ( 2022 ) 2021 【c1】 罗欣·沙阿 , 史蒂芬·H·王 , 科迪·威尔德 , 斯蒂芬妮·米拉尼 , Anssi Kanervisto公司 , 多汁的G.Goecks , 尼古拉斯·韦托维奇(Nicholas R.Waytowich) , 大卫·沃特金斯·沃尔斯 , 巴拉特·普拉卡什 , 埃德蒙·米尔斯 , 迪维安什·加格 , 亚历山大·弗里斯 , 亚历山大·索利 , 陈俊勋 , 丹尼尔·德尔·卡斯蒂略 , 汤姆·利伯伦 :
回顾2021年MineRL玄武岩竞赛“从人类反馈中学习”。 NeurIPS(竞争和演示) 2021 : 259-272