What does the Failure to Reason with "Respectively" in Zero/Few-Shot Settings Tell Us about Language Models?

Cui, Ruixiang; Lee, Seolhwa; Hershcovich, Daniel; Søgaard, Anders

计算机科学>计算与语言

arXiv:2305.19597（cs）

【于2023年5月31日提交】

职务：在零/极少数快照设置中，“分别进行推理”的失败告诉了我们关于语言模型的什么？

作者：崔瑞香,Seolhwa Lee先生,丹尼尔·赫什科维奇,安德斯·索加德

查看PDF

摘要：人类可以毫不费力地理解句子的并列结构，例如“尼尔斯·玻尔和科特·科本分别出生于哥本哈根和西雅图”。在自然语言推理（NLI）的背景下，我们从句法语义知识和常识世界知识两个角度考察了语言模型（LM）如何与各自的阅读进行推理（Gawron和Kehler，2004）。我们提出了一个受控的合成数据集WikiResNLI和一个自然发生的数据集NatResNLI，以包含“分别”的各种显式和隐式实现。我们表明，在没有明确监督的情况下，微调NLI模型难以理解此类读数。虽然在有明确线索的情况下很容易进行快速学习，但当阅读被隐式激发时，需要更长的训练，让模型依赖常识推理。此外，我们的细粒度分析表明，模型无法在不同的结构中进行概括。总之，我们证明LM在概括语言结构的长尾方面仍然落后于人类。

评论：	出现在ACL 2023
学科：	计算与语言（cs.CL）; 人工智能（cs.AI）
引用为：	arXiv:2305.19597【cs.CL】
	（或 arXiv:2305.19597v1【cs.CL】对于此版本）
	https://doi.org/10.48550/arXiv.2305.19597

提交历史记录

发件人：崔瑞祥[查看电子邮件]
[第1版]2023年5月31日星期三06:45:09 UTC（6930 KB）

全文链接：

访问纸张：

查看许可证

当前浏览上下文：

反恐精英。氯

<上一版本 | 下一个>

新的 | 最近的 |2023-05

更改为浏览方式：

反恐精英
反恐精英。人工智能

参考文献和引文

导出BibTeX引文

计算机科学>计算与语言

职务：在零/极少数快照设置中，“分别进行推理”的失败告诉了我们关于语言模型的什么？

提交历史记录

访问纸张：

参考文献和引文

书签

书目和引文工具

与本文相关的代码、数据和媒体

演示

推荐和搜索工具

arXivLabs：与社区合作者合作的实验项目

计算机科学>计算与语言

职务：在零/极少数快照设置中，“分别进行推理”的失败告诉了我们关于语言模型的什么？

提交历史记录

访问纸张：

参考文献和引文

BibTeX格式的引文

书签

书目和引文工具

与本文相关的代码、数据和媒体

演示

推荐和搜索工具

arXivLabs：与社区合作者合作的实验项目