HW-TSC’s Participation in the WMT 2021 Large-Scale Multilingual Translation Task

Zhengzhe Yu; Daimeng Wei; Zongyao Li; Hengchao Shang; Xiaoyu Chen; Zhanglin Wu; Jiaxin Guo; Minghan Wang; Lizhi Lei; Min Zhang; Hao Yang; Ying Qin

硬件-TSC公司的参与WMT公司2021年大规模多语翻译任务

余正哲,戴梦伟,李宗耀,亨朝商,陈晓宇（Xiaoyu Chen）,吴章林,郭嘉欣,王明翰,李志磊,张敏,郝阳,应钦

摘要

本文介绍了华为翻译服务中心（HW-TSC）提交给WMT 2021大型多语言翻译任务的情况。我们参加了Samll Track#2，包括6种语言：爪哇语（Jv）、印尼语（Id）、马来语（Ms）、塔加路语（Tl）、泰米尔语（Ta）和英语（En），在受限条件下有30个方向。我们使用Transformer架构，并通过具有较大参数的多个变量获得最佳性能。我们训练一个单一的多语言模型来翻译所有30个方向。我们对提供的大规模双语和单语数据集进行详细的预处理和过滤。我们使用了几种常用的策略来训练模型，例如反向翻译、正向翻译、集成知识提取、适配器微调。我们的模型最终取得了具有竞争力的结果。

选集ID：: 2021.wmt-1.55年
体积：: 第六届机器翻译会议记录
月份：: 十一月
年份：: 2021
地址：: 在线
编辑：: 洛伊克·巴罗,Ondrej Bojar公司,费提·布加雷斯,拉金·查特吉,玛尔塔·科斯塔·朱萨,克里斯蒂安·费德曼,马克·费舍尔,亚历山大·弗雷泽,马库斯·弗雷塔格,伊维特·格雷厄姆,罗曼·格兰基维奇,帕科·古兹曼,巴里·哈多,马蒂亚斯·哈克,安东尼奥·吉梅诺·耶佩斯,菲利普·科恩,汤姆·科米,安德烈·马丁斯,森田真本,克里斯托夫·蒙兹
地点：: WMT公司
SIG公司：: SIGMT公司
出版商：: 计算语言学协会
注：
页：: 456–463
语言：
网址：: https://aclantology.org/2021.wmt-1.55
内政部：
比比键：
引用（ACL）：: 俞正哲、魏代萌、李宗耀、尚恒超、陈晓宇、吴章林、郭嘉欣、王明翰、雷立志、张敏、杨浩和秦颖。2021HW-TSC参与WMT 2021大型多语言翻译任务.英寸第六届机器翻译会议记录，第456–463页，在线。计算语言学协会。
引用（非正式）：: HW-TSC参与WMT 2021大型多语言翻译任务（Yu等人，WMT 2021）
复制引文：
PDF格式：: https://aclcollectory.org/2021.wmt-1.55.pdf

PDF格式引用搜索