A类libaba的神经机器翻译系统WMT公司18

邓永超,程善波(Shanbo Cheng),陆军,宋凯(Kai Song),王金刚(Jingang Wang),吴胜兰,梁瑶,张古春,张海波,张培(音译),朱长丰,拳击陈


摘要
本文描述了阿里巴巴WMT18共享新闻翻译任务的提交系统。我们参与了包括英语在内的5个翻译方向俄语、英语两个方向的土耳其语和英语→汉语。我们的系统基于谷歌的Transformer模型架构,我们将学术研究的最新功能集成到其中。我们还采用了在过去WMT年中被证明有效的大多数技术,如BPE、反译、数据选择、模型集成和工业规模的重新分级。对于一些形态丰富的语言,我们还将语言知识纳入我们的神经网络。对于我们参与的翻译任务,我们得到的系统在所有5个方向上都取得了最佳的区分大小写的BLEU分数。值得注意的是,我们的英语→俄语系统比第二个重新登录的系统好5分。
选集ID:
W18-6408型
体积:
第三届机器翻译会议记录:共享任务文件
月份:
十月
年份:
2018
地址:
比利时、布鲁塞尔
编辑:
Ondřej Bojar公司,拉金·查特吉,克里斯蒂安·费德曼,马克·费舍尔,伊维特·格雷厄姆,巴里·哈多,马蒂亚斯·哈克,安东尼奥·吉梅诺·耶佩斯,菲利普·科恩,克里斯托夫·蒙兹,马泰奥·内格里,奥雷利·内维尔,玛丽亚娜·奈维斯,马特·波斯特,露西娅·斯佩西亚,马可·图尔奇,卡林·弗斯波尔
地点:
WMT公司
SIG公司:
SIGMT公司
发布者:
计算语言学协会
注:
页:
368–376
语言:
网址:
https://aclantology.org/W18-6408
内政部:
10.18653/v1/W18-6408
比比键:
引用(ACL):
邓永超、程善波、卢军、宋凯、王金刚、吴胜兰、姚亮、张古春、张海波、张培、朱长风和陈博兴。2018阿里巴巴WMT18神经机器翻译系统.英寸第三届机器翻译会议记录:共享任务文件,第368-376页,比利时,布鲁塞尔。计算语言学协会。
引用(非正式):
阿里巴巴的WMT18神经机器翻译系统(邓等人,WMT 2018)
复制引文:
PDF格式:
https://aclantology.org/W18-6408.pdf