第六 黑匣子NLP@EMNLP 2023年:新加坡
约纳坦·贝林科夫 , 苏菲·郝 , 贾普·朱梅莱 , Najoung Kim公司 , 艾丽娅·麦卡锡 , 霍森·莫赫比 :
第六届BlackboxNLP研讨会论文集:分析和解释NLP的神经网络, 黑匣子NLP@EMNLP 2023年,新加坡,2023年12月7日。 计算语言学协会 2023 ,国际标准图书编号 979-8-89176-052-3 安东尼·科拉斯 , 荒木君 , 周征宇(音) , 王炳清(音) , 哲峰 :
知识全面的自然语言推荐说明。 1-15 内尔·南达 , 安德鲁李 , 瓦滕伯格 :
自监督序列模型世界模型中的紧急线性表示。 16-30 钱丹·辛格 , 约翰·莫里斯 , 乔蒂·阿内亚 , 亚历山大·拉什 , 高剑锋 :
用语言模型解释自然语言中的数据模式。 31-55 阿克沙特·古普塔 :
探索大型语言模型中的量词理解:反标度法的另一个例子。 56-64 斯特凡·阿诺德 , 尼尔斯·凯默泽尔 , 安妮卡·施莱纳 :
解开隐私保护BERT的语言能力。 65-75 安托万·查芬 , 朱利安·德劳奈 :
“亲爱的,告诉我怎么了”,通过合作生成对文本歧视模型的全球解释。 76-88 亨宁·巴茨 , 奥列·约根森 , Domenic Rosati公司 , 杰森·霍尔舍尔·贝马耶 , 雅各布·普法 :
歧义下大型语言模型的自一致性。 89-105 郝孙 , 约翰·休伊特 :
角色级中文背包语言模型。 106-119 苏尼特·巴塔查里亚 , Ondrej Bojar公司 :
揭示变压器模型中的多语言性:探索前馈网络中的语言特异性。 120-126 蒂莫西·米库斯 , 劳尔·瓦茨奎兹 :
为什么要学习几何? 变压器嵌入线性分解的相关性。 127-141 德米特里·尼古拉耶夫 , 塞巴斯蒂安·帕多 :
通过线性结构探测研究变压器句子嵌入的语义子空间。 142-154 娟河(TJ)Tan :
算术单词问题中思维链推理的因果抽象。 155-168 娜塔莉亚·弗莱查斯·曼里克 , 万千包 , 奥雷利·赫布洛特 , 乌里·哈森 :
使用人类相似性判断来减少单词嵌入,提高可解释性。 169-179 朱迪思·西克 , 新浪Zarieß :
当你的语言模型甚至不能正确处理决定因素时:探索反预设和最大化预设! 原则。 180-198 乔纳斯·格罗斯维茨 :
介绍VULCAN:通过示例了解我们的模型和数据的可视化工具。 199-211 大卫·克莱茨 , 帕斯卡·阿姆西利 , 玛丽·坎迪托 :
自包含否定测试集。 212-221 燕聪 , 埃马纽埃勒·切尔索尼 , 徐玉音 , 菲利普·布莱切 :
语篇连接词对变形金刚的影响研究:语言模型理解连接词,即使他们感到惊讶。 222-232 周宜春 , 维韦克·斯里库马尔 :
METAPROBE:一个表征和任务认知的探索。 233-249 雅各布·K·约翰逊 , 安娜·马拉索维奇 :
你的准确性值多少一致性? 250-260 Tanja Baeumel公司 , 索尼娅·维贾亚库玛 , 约瑟夫·范·贾纳比特 , Guenter Neumann公司 , 西蒙·奥斯特曼 :
使用特征文本化研究BERT神经元中单词的编码。 261-270 王顺杰 , 谢恩·斯坦内特·特雷克尔德 :
评估Transformer学习轻度上下文敏感语言的能力。 271-283 尼尔马伦杜·普拉卡什 , 罗伊·卡韦·李 :
分层偏见:解释预训练大型语言模型中的偏见。 284-295 伊莎贝尔·洛奇 , 珍妮特·比尔·皮尔雷哈姆伯特(Janet B.Pierrehumbert) :
非古怪与绝对古怪:预训练语言模型中标量副词的研究。 296-316 Jing Huang(黄晶) , 阿提库斯·盖革 , 卡雷尔·德奥斯特林克 , 吴正轩 , 克里斯托弗·波茨 :
严格评估神经元的自然语言解释。 317-331 迪安娜·德卡洛 , 威廉·帕尔默 , 米高·威尔逊 , 鲍勃·弗兰克 :
NPI并非一帆风顺:大型语言模型中的许可变化。 332-341 曼西·萨卡瓦迪亚 , Aswathy Ajith公司 , 阿哈姆·汗 , 丹尼尔·格曾达 , 纳撒尼尔·哈德森 , 安德烈·鲍尔 , 凯尔·查德 , 伊恩·T·福斯特 :
记忆注入:纠正基于变换的语言模型中推理过程中的多顶推理失败。 342-356 Aishik Chakraborty公司 , 成龙·C·K·张 , 蒂莫西·奥唐纳 :
Finetuning的系统泛化? 使用成分测试分析预训练语言模型。 357-366 刘晨欣 , 埃马纽埃勒·切尔索尼 :
快速接吻及其计数:BERT轻量级动词结构中事件结构的研究。 367-378 Abhijith Chintam公司 , 拉赫尔·贝洛赫 , 威廉·H·祖伊特拉 , 迈克尔·汉纳 , 奥斯卡·范德沃尔 :
识别和调整英语语言模型中导致性别偏见的转换成分。 379-394