最大-ISI公司系统位于WMT公司23语篇级文学翻译任务

李安,金凌浩,马学哲


摘要
本文描述了WMT23共享任务的翻译系统。我们参与了语篇层面的文学翻译任务约束轨道。在我们的方法中,我们对传统变压器模型和最近引入的MEGA模型进行了比较分析,与传统变压器相比,MEGA模型在建模远程序列方面表现出更强的能力。为了探讨语言模型是否可以使用段落级数据更有效地利用文档级上下文,我们采用了从组织者提供的原始文学数据集中句子到段落的方法。变压器和MEGA模型都使用了该段落级数据。为了确保在所有系统中进行公平的比较,我们采用了句子对齐策略,将翻译结果从段落级转换回句子级对齐。最后,我们的评估过程包括句子级指标,如BLEU,以及两个文档级指标:d-BLEU和BlonD。
选集ID:
2023.wmt-1.29年
体积:
第八届机器翻译会议记录
月份:
十二月
年份:
2023
地址:
新加坡
编辑:
菲利普·科恩,巴里·哈多,汤姆·科米,克里斯托夫·蒙兹
地点:
WMT公司
SIG公司:
SIGMT公司
出版商:
计算语言学协会
注:
页:
282–286
语言:
网址:
https://aclantology.org/2023.wmt-1.29
内政部:
10.18653/v1/2023.wmt-1.29
比比键:
引用(ACL):
2023年,李安、金凌浩、马学哲。WMT23语篇级文学翻译任务中的MAX-ISI系统.英寸第八届机器翻译会议记录,第282-286页,新加坡。计算语言学协会。
引用(非正式):
WMT23语篇级文学翻译任务中的MAX-ISI系统(An等人,WMT 2023)
复制引文:
PDF格式:
https://aclantology.org/2023.wmt-1.29.pdf