S公司安盛R(右)&D类研究所P(P)WMT公司2023

简·克里斯蒂安·布莱斯·克鲁兹


摘要
本文针对WMT 2023通用翻译任务的两个方向:en->he和he->en,描述了三星菲律宾研发院的受限提交系统。我们的系统由基于Transformer的序列到序列模型组成,这些模型采用多种最佳实践进行训练:综合数据预处理管道、合成回译数据以及在线解码期间使用噪声信道重新排序。尽管FLORES-200和NTREX-128这两个公共基准的参数明显较少,但我们的模型的性能与mBART50 M2M和NLLB 200 MoE等强基线无约束系统相当,有时甚至优于后者。
选集ID:
2023年wmt-1.6
体积:
第八届机器翻译会议记录
月份:
十二月
年份:
2023
地址:
新加坡
编辑:
菲利普·科恩,巴里·哈多,汤姆·科米,克里斯托夫·蒙兹
地点:
WMT公司
SIG公司:
SIGMT公司
出版商:
计算语言学协会
注:
页码:
103–109
语言:
网址:
https://aclantology.org/2023.wmt-1.6
内政部:
10.18653/v1/2023.wmt-1.6
比比键:
引用(ACL):
简·克里斯蒂安·布莱斯·克鲁兹(Jan Christian Blaise Cruz)。2023WMT 2023菲律宾三星研发院.英寸第八届机器翻译会议记录,第103–109页,新加坡。计算语言学协会。
引用(非正式):
WMT 2023菲律宾三星研发院(克鲁兹,WMT 2023)
复制引文:
PDF格式:
https://aclantology.org/2023.wmt-1.6.pdf