Language-Family Adapters for Low-Resource Multilingual Neural Machine Translation

Chronopoulou, Alexandra; Stojanovski, Dario; Fraser, Alexander

计算机科学>计算与语言

arXiv:2209.15236（cs）

【2022年9月30日提交(第1版)，最后修订日期：2023年3月29日（本版本，v3）]

标题：低资源多语言神经机器翻译的语言家族适配器

作者：亚历山德拉·克洛诺普鲁（Alexandra Chronopoulou）,达里奥·斯托亚诺夫斯基,亚历山大·弗雷泽

查看PDF

摘要：经过自我监督训练的大型多语言模型在广泛的自然语言处理任务中取得了最先进的结果。对于机器翻译，自我监督预处理模型通常对来自一个或多个语言对的并行数据进行微调。多语言微调可以提高低资源语言的性能，但需要修改整个模型，而且成本可能高得令人望而却步。在每个语言对上训练一个新的适配器，或者在所有语言对上只训练一个适配器，而不更新预处理模型，这是一种高效的参数选择。然而，前者不允许语言之间的任何共享，而后者共享所有语言的参数，并且容易受到负面干扰。在本文中，我们建议在mBART-50之上训练语言家族适配器，以促进跨语言迁移。我们的方法优于相关基线，从英语翻译到17种不同的低资源语言时，平均翻译分数较高。我们还表明，语言家族适配器提供了一种有效的方法，可以将其翻译为预训练期间看不到的语言。

评论：	LoResMT（@EACL 2023）摄像头-现成版本
学科：	计算与语言（cs.CL）
引用为：	arXiv:2209.15236【cs.CL】
	（或 arXiv:2209.15236v3【cs.CL】对于此版本）
	https://doi.org/10.48550/arXiv.2209.15236

提交历史记录

发件人：Alexandra Chronopoulou[查看电子邮件]
[第1版]2022年9月30日星期五05:02:42 UTC（6421 KB）
[版本2]2022年10月13日星期四04:31:52 UTC（6421 KB）
[第3版]2023年3月29日星期三18:37:22 UTC（6466 KB）

计算机科学>计算与语言

标题：低资源多语言神经机器翻译的语言家族适配器

提交历史记录

访问纸张：

参考文献和引文

书签

书目和引文工具

与本文相关的代码、数据和媒体

演示

推荐和搜索工具

arXivLabs：与社区合作者合作的实验项目

计算机科学>计算与语言

标题：低资源多语言神经机器翻译的语言家族适配器

提交历史记录

访问纸张：

参考文献和引文

BibTeX格式的引文

书签

书目和引文工具

与本文相关的代码、数据和媒体

演示

推荐和搜索工具

arXivLabs：与社区合作者合作的实验项目