硬件-TSC公司的参与时间WMT公司2020自动后期编辑共享任务

郝阳,王明翰,戴梦伟,亨朝商,郭嘉欣,李宗耀,李志磊,应钦,石明涛,孙十良,陈一萌


摘要
本文介绍了HW-TSC在WMT 2020自动后期编辑共享任务中提交的文件。我们参加了英语-德语和英语-汉语配对。我们的系统是基于在WMT 2019和WMT 2020新闻翻译语料库上预先训练的Transformer构建的,并在APE语料库上进行了微调。瓶颈适配器层集成到模型中以防止过度拟合。我们进一步收集外部翻译作为增强MT候选,以提高性能。实验表明,当使用有限大小的APE语料库进行微调时,预训练NMT模型是有效的,并且通过外部MT增强可以进一步提高性能。我们的系统在最终评估中在两个方向上都取得了具有竞争力的结果。
选集ID:
2020.wmt-1.85年
体积:
第五届机器翻译会议记录
月份:
十一月
年份:
2020
地址:
在线的
编辑:
洛伊克兵营,Ondřej Bojar公司,费提·布加雷斯,拉简·查特吉,Marta R.Costa-jussá,克里斯蒂安·费德曼,马克·费舍尔,亚历山大·弗雷泽,伊维特·格雷厄姆,帕科·古兹曼,巴里·哈多,马蒂亚斯·哈克,安东尼奥·吉梅诺·耶佩斯,菲利普·科恩,安德烈·马丁斯,森田真本,克里斯托夫·蒙兹,长田正树,中泽俊一(Toshiaki Nakazawa),马泰奥·内格里
地点:
WMT公司
SIG公司:
SIGMT公司
出版商:
计算语言学协会
注:
页:
797–802
语言:
网址:
https://aclantology.org/2020.wmt-1.85
内政部:
比比键:
引用(ACL):
郝阳、王明翰、魏代萌、尚恒超、郭嘉欣、李宗耀、雷立芝、秦颖、陶世民、孙世良和陈一萌。2020HW-TSC参与WMT 2020自动后期编辑共享任务.英寸第五届机器翻译会议记录,第797–802页,在线。计算语言学协会。
引用(非正式):
HW-TSC参与WMT 2020自动后期编辑共享任务(Yang等人,WMT 2020)
复制引文:
PDF格式:
https://aclantology.org/2020.wmt-1.85.pdf
视频:
 https://slideslive.com/38939570
数据
电子扫描