A Large-Scale Test Set for the Evaluation of Context-Aware Pronoun Translation in Neural Machine Translation

Mathias Müller; Annette Rios Gonzales; Elena Voita; Rico Sennrich

doi:10.18653/v1/W18-6307

神经机器翻译中上下文代词翻译的大规模测试集

摘要

代词的翻译对今天的机器翻译提出了一个特殊的挑战，因为它经常需要当前句子之外的上下文。最近关于跨句子边界访问信息的模型的工作，在自动评估指标（如BLEU）方面只有适度的改进。然而，量化整体翻译质量的指标不足以衡量额外语境带来的收益。我们认为，需要一种不同的评估来评估模型翻译代词等语义间现象的效果。因此，本文提出了一套专门针对代词翻译的对比翻译测试。此外，我们用几个上下文软件模型进行了实验。我们表明，尽管这些系统的BLEU增益适中，但在对比测试集上，它们的准确度远远优于基线。我们的实验还表明了多编码器体系结构参数绑定的有效性。

选集ID：: W18-6307型
体积：: 第三届机器翻译大会论文集：研究论文
月份：: 十月
年份：: 2018
地址：: 比利时布鲁塞尔
编辑：: Ondřej Bojar公司，拉金·查特吉，克里斯蒂安·费德曼，马克·费舍尔，伊维特·格雷厄姆，巴里·哈多，马蒂亚斯·哈克，安东尼奥·吉梅诺·耶佩斯，菲利普·科恩，克里斯托夫·蒙兹，马泰奥·内格里，奥雷利·内维尔，玛丽亚娜·奈维斯，马特·波斯特，露西娅·斯佩西亚，马可·图尔奇，卡林·弗斯波尔
地点：: WMT公司
信号：: SIGMT公司
发布者：: 计算语言学协会
注：
页：: 61–72
语言：
网址：: https://aclantology.org/W18-6307
内政部：: 10.18653/v1/W18-6307
比比键：
引用（ACL）：: 马蒂亚斯·米勒（Mathias Müller）、安妮特·里奥斯（Annette Rios）、埃琳娜·沃伊塔（Elena Voita）和里科·森里奇（Rico Sennrich）。2018用于评估神经机器翻译中上下文感知代词翻译的大规模测试集.英寸第三届机器翻译会议记录：研究论文，第61-72页，比利时布鲁塞尔。计算语言学协会。
引用（非正式）：: 神经机器翻译中上下文代词翻译的大规模测试集（缪勒等人，WMT 2018）
复制引文：
PDF格式：: https://aclantology.org/W18-6307.pdf
代码: 苏黎世NLP/ContraPro
数据: 打开字幕

PDF格式引用搜索代码