Structural generalization is hard for sequence-to-sequence models

Yao, Yuekun; Koller, Alexander

计算机科学>计算与语言

arXiv公司：2210.13050（cs）

【于2022年10月24日提交】

标题：序列到序列模型很难进行结构泛化

作者：姚月坤,亚历山大·科勒

查看PDF

摘要：序列对序列（seq2seq）模型在许多NLP任务中都取得了成功，包括那些需要预测语言结构的任务。然而，最近关于成分泛化的研究表明，seq2seq模型在泛化到训练中没有看到的语言结构时，精确度很低。我们提供了新的证据，证明这是seq2seq模型的一个普遍局限性，它不仅存在于语义分析中，也存在于句法分析和文本到文本任务中，并且这种局限性通常可以通过内置语言知识的神经符号模型来克服。我们进一步报道了一些实验，这些实验对这些限制的原因给出了初步答案。

评论：	EMNLP 2022中接受
学科：	计算与语言（cs.CL）
引用为：	arXiv:2210.13050【cs.CL】
	（或 arXiv:2210.13050v1【cs.CL】对于此版本）
	https://doi.org/10.48550/arXiv.2210.13050

提交历史记录

发件人：姚月坤[查看电子邮件]
[v1]2022年10月24日星期一09:03:03 UTC（504 KB）

全文链接：

访问纸张：

查看许可证

当前浏览上下文：

反恐精英。氯

<上一版本 | 下一个>

新的 | 最近的 |2022-10

更改为浏览方式：

反恐精英

参考文献和引文

导出BibTeX引文

计算机科学>计算与语言

标题：序列到序列模型很难进行结构泛化

提交历史记录

访问纸张：

参考文献和引文

书签

书目和引文工具

与本文相关的代码、数据和媒体

演示

推荐和搜索工具

arXivLabs：与社区合作者合作的实验项目

计算机科学>计算与语言

标题：序列到序列模型很难进行结构泛化

提交历史记录

访问纸张：

参考文献和引文

BibTeX格式的引文

书签

书目和引文工具

与本文相关的代码、数据和媒体

演示

推荐和搜索工具

arXivLabs：与社区合作者合作的实验项目