An Empirical Study of Machine Translation for the Shared Task of WMT18

Chao Bei; Hao Zong; Yiming Wang; Baoyong Fan; Shiqi Li; Conghu Yuan

doi:10.18653/v1/W18-6404

共享任务的机器翻译实证研究WMT公司18

摘要

本文介绍了环球音讯有限公司提交的WMT18共享新闻翻译任务。我们参加了从英语到汉语的指导，在所有参与者中获得了最好的BLEU（43.8）分数。提交的系统侧重于数据清理和技术，以构建此任务的竞争模型。与其他参与者不同，提交的系统主要依靠数据过滤来获得最佳BLEU分数。我们不仅对提供的句子进行数据过滤，而且对回译的句子也进行数据过滤。我们应用于数据过滤的技术包括按规则过滤、语言模型和翻译模型。我们还进行了几个实验来验证训练技术的有效性。根据我们的实验，退火Adam优化函数和集合解码是最有效的模型训练技术。

选集ID：: W18-6404号
体积：: 第三届机器翻译会议记录：共享任务文件
月份：: 十月
年份：: 2018
地址：: 比利时、布鲁塞尔
编辑：: Ondřej Bojar公司,拉金·查特吉,克里斯蒂安·费德曼,马克·费舍尔,伊维特·格雷厄姆,巴里·哈多,马蒂亚斯·哈克,安东尼奥·吉梅诺·耶佩斯,菲利普·科恩,克里斯托夫·蒙兹,马泰奥·内格里,奥雷利·内维尔,玛丽亚娜·奈维斯,马特·波斯特,露西娅·斯佩西亚,马可·图尔奇,卡林·弗斯波尔
地点：: WMT公司
SIG公司：: SIGMT公司
发布者：: 计算语言学协会
注：
页：: 340–344
语言：
网址：: https://aclantology.org/W18-6404
内政部：: 10.18653/v1/W18-6404
比比键：
引用（ACL）：: 赵蓓、郝宗、王一鸣、范宝勇、李世奇和袁聪虎。2018WMT18共享任务的机器翻译实证研究.英寸第三届机器翻译会议记录：共享任务文件，第340-344页，比利时，布鲁塞尔。计算语言学协会。
引用（非正式）：: WMT18共享任务机器翻译的实证研究（Bei等人，WMT 2018）
复制引文：
PDF格式：: https://aclcollectory.org/W18-6404.pdf

PDF格式引用搜索