HW-TSC’s Participation at WMT 2020 Automatic Post Editing Shared Task

Hao Yang; Minghan Wang; Daimeng Wei; Hengchao Shang; Jiaxin Guo; Zongyao Li; Lizhi Lei; Ying Qin; Shimin Tao; Shiliang Sun; Yimeng Chen

硬件-TSC公司的参与时间WMT公司2020自动后期编辑共享任务

郝阳,王明翰,戴梦伟,亨朝商,郭嘉欣,李宗耀,李志磊,应钦,石明涛,孙十良,陈一萌

摘要

本文介绍了HW-TSC在WMT 2020自动后期编辑共享任务中提交的文件。我们参加了英语-德语和英语-汉语配对。我们的系统是基于在WMT 2019和WMT 2020新闻翻译语料库上预先训练的Transformer构建的，并在APE语料库上进行了微调。瓶颈适配器层集成到模型中以防止过度拟合。我们进一步收集外部翻译作为增强MT候选，以提高性能。实验表明，当使用有限大小的APE语料库进行微调时，预训练NMT模型是有效的，并且通过外部MT增强可以进一步提高性能。我们的系统在最终评估中在两个方向上都取得了具有竞争力的结果。

选集ID：: 2020.wmt-1.85年
体积：: 第五届机器翻译会议记录
月份：: 十一月
年份：: 2020
地址：: 在线的
编辑：: 洛伊克兵营,Ondřej Bojar公司,费提·布加雷斯,拉简·查特吉,Marta R.Costa-jussá,克里斯蒂安·费德曼,马克·费舍尔,亚历山大·弗雷泽,伊维特·格雷厄姆,帕科·古兹曼,巴里·哈多,马蒂亚斯·哈克,安东尼奥·吉梅诺·耶佩斯,菲利普·科恩,安德烈·马丁斯,森田真本,克里斯托夫·蒙兹,长田正树,中泽俊一（Toshiaki Nakazawa）,马泰奥·内格里
地点：: WMT公司
SIG公司：: SIGMT公司
出版商：: 计算语言学协会
注：
页：: 797–802
语言：
网址：: https://aclantology.org/2020.wmt-1.85
内政部：
比比键：
引用（ACL）：: 郝阳、王明翰、魏代萌、尚恒超、郭嘉欣、李宗耀、雷立芝、秦颖、陶世民、孙世良和陈一萌。2020HW-TSC参与WMT 2020自动后期编辑共享任务.英寸第五届机器翻译会议记录，第797–802页，在线。计算语言学协会。
引用（非正式）：: HW-TSC参与WMT 2020自动后期编辑共享任务（Yang等人，WMT 2020）
复制引文：
PDF格式：: https://aclantology.org/2020.wmt-1.85.pdf
视频：: https://slideslive.com/38939570
数据: 电子扫描

PDF格式引用搜索视频