A preference-driven paradigm for enhanced translation with large language models

Dawei Zhu; Sony Trenous; Xiaoyu Shen; Dietrich Klakow; Bill Byrne; Eva Hasler

出版物

使用大型语言模型增强翻译的偏好驱动范式

由朱大伟,索尼Trenous,沈晓宇,迪特里希·克拉科夫,比尔·伯恩,伊娃·哈斯勒

2024

下载复制BibTeX

下载

复制BibTeX

<trans data-src="@Inproceedings{Zhu2024,">@诉讼中{朱2024，</trans><trans data-src="author = {Dawei Zhu and Sony Trenous and Xiaoyu Shen and Dietrich Klakow and Bill Byrne and Eva Hasler},">author={朱大伟（Dawei Zhu）、索尼趋势（Sony Trenous）、沈晓宇（Xiaoyu Shen）、克拉科夫（Dietrich Klakow）、拜恩（Bill Byrne）和伊娃哈斯勒（Eva Hasler）}，</trans><trans data-src="title = {A preference-driven paradigm for enhanced translation with large language models},">title={使用大型语言模型增强翻译的首选项驱动范式}，</trans><trans data-src="year = {2024},">年份＝{2024}，</trans><trans data-src="url = {">url={</trans><trans data-src="https://www.amazon.science/publications/a-preference-driven-paradigm-for-enhanced-translation-with-large-language-models">https://www.amazon.science/publications/a-preference-driven-paradigm-for-enhanced-translation-with-large-language-models（https://www.amazon.science/publications/a-preference-driven-paradigm-for-enhanced-translation-with-large-language-models）</trans><trans data-src="},">},</trans><trans data-src="booktitle = {NAACL 2024},">booktitle={NAACL 2024}，</trans><trans data-src="}">}</trans>

最近的研究表明，大型语言模型（LLM）通过只使用少量并行数据的监督微调（SFT）可以获得显著的翻译性能。然而，SFT只是指示模型在标记级别模拟引用翻译，使其容易受到引用中存在的噪声的影响。因此，一旦LLM达到一定水平的翻译能力，来自SFT的援助往往会达到一个稳定阶段，进一步增加并行数据的大小并不会带来额外的好处。为了克服与基于模仿的SFT相关的平台，我们提出了一种建立在Plackett-Luce模型基础上的基于偏好的方法。其目的是引导LLM从整体角度对翻译偏好进行更细致的理解，同时在缺少黄金翻译的情况下更具弹性。我们进一步构建了一个名为MAPLE的数据集来验证我们的方法的有效性，其中包括每个源句子的多个不同质量的翻译。大量实验表明，我们的方法在不同的LLM和测试环境中“打破平台”方面具有优势。我们的深入分析强调了多样化翻译和准确的偏好评分在我们的方法成功中的关键作用。

使用大型语言模型增强翻译的偏好驱动范式

最新消息

与我们合作