调查结果WMT公司2018年自动后期编辑共享任务

拉金·查特吉,马泰奥·内格里,拉斐尔·鲁比诺,马可·图尔奇


摘要
我们展示了第四轮WMT共享任务关于机器翻译自动后期编辑的结果。该任务包括通过学习人工更正,自动更正“黑盒”机器翻译系统的输出。保持前三轮的一般评估设置不变,今年我们重点关注一种语言对(英语-德语)和特定领域的数据(信息技术),机器翻译输出由两种不同的范式产生:基于短语(PBSMT)和神经(NMT)。五个团队分别为PBSMT子任务提交了11次运行,为NMT子任务提供了10次运行。在前一个子任务中,以低质量的原始翻译为特征,顶级结果取得了令人印象深刻的改进,比基线高出6.24 TER和+9.53 BLEU分”不做任何事“系统。NMT子任务被证明更具挑战性,因为原始翻译的质量更高,可用的训练数据更少。在这种情况下,顶部结果显示,改善较小,达到-0.38 TER和+0.8 BLEU点。
选集ID:
W18-6452号
体积:
第三届机器翻译会议记录:共享任务文件
月份:
十月
年份:
2018
地址:
比利时、布鲁塞尔
编辑:
Ondřej Bojar公司,拉金·查特吉,克里斯蒂安·费德曼,马克·费舍尔,伊维特·格雷厄姆,巴里·哈多,马蒂亚斯·哈克,安东尼奥·吉梅诺·耶佩斯,菲利普·科恩,克里斯托夫·蒙兹,马泰奥·内格里,奥雷利·内维尔,玛丽亚娜·奈维斯,马特·波斯特,露西娅·斯佩西亚,马可·图尔奇,卡林·弗斯波尔
地点:
WMT公司
SIG公司:
SIGMT公司
发布者:
计算语言学协会
注:
页:
710–725
语言:
网址:
https://aclantology.org/W18-6452
内政部:
10.18653/v1/W18-6452
比比键:
引用(ACL):
Rajen Chatterjee、Matteo Negri、Raphael Rubino和Marco Turchi。2018WMT 2018自动后期编辑共享任务的发现.英寸第三届机器翻译会议记录:共享任务文件,第710-725页,比利时,布鲁塞尔。计算语言学协会。
引用(非正式):
WMT 2018自动后期编辑共享任务的调查结果(Chatterjee等人,WMT 2018)
复制引文:
PDF格式:
https://aclantology.org/W18-6452.pdf
数据
电子扫描