Samsung R&D Institute Philippines at WMT 2023

Jan Christian Blaise Cruz

doi:10.18653/v1/2023.wmt-1.6

S公司安盛R（右）&D类研究所P（P）在WMT公司2023

摘要

本文针对WMT 2023通用翻译任务的两个方向：en->he和he->en，描述了三星菲律宾研发院的受限提交系统。我们的系统由基于Transformer的序列到序列模型组成，这些模型采用多种最佳实践进行训练：综合数据预处理管道、合成回译数据以及在线解码期间使用噪声信道重新排序。尽管FLORES-200和NTREX-128这两个公共基准的参数明显较少，但我们的模型的性能与mBART50 M2M和NLLB 200 MoE等强基线无约束系统相当，有时甚至优于后者。

选集ID：: 2023年wmt-1.6
体积：: 第八届机器翻译会议记录
月份：: 十二月
年份：: 2023
地址：: 新加坡
编辑：: 菲利普·科恩,巴里·哈多,汤姆·科米,克里斯托夫·蒙兹
地点：: WMT公司
SIG公司：: SIGMT公司
出版商：: 计算语言学协会
注：
页码：: 103–109
语言：
网址：: https://aclantology.org/2023.wmt-1.6
内政部：: 10.18653/v1/2023.wmt-1.6
比比键：
引用（ACL）：: 简·克里斯蒂安·布莱斯·克鲁兹（Jan Christian Blaise Cruz）。2023WMT 2023菲律宾三星研发院.英寸第八届机器翻译会议记录，第103–109页，新加坡。计算语言学协会。
引用（非正式）：: WMT 2023菲律宾三星研发院（克鲁兹，WMT 2023）
复制引文：
PDF格式：: https://aclantology.org/2023.wmt-1.6.pdf

PDF格式引用搜索