神经机器翻译中上下文代词翻译的大规模测试集

马蒂亚斯·米勒安妮特·里奥斯埃琳娜·沃伊塔里科·森里奇


摘要
代词的翻译对今天的机器翻译提出了一个特殊的挑战,因为它经常需要当前句子之外的上下文。最近关于跨句子边界访问信息的模型的工作,在自动评估指标(如BLEU)方面只有适度的改进。然而,量化整体翻译质量的指标不足以衡量额外语境带来的收益。我们认为,需要一种不同的评估来评估模型翻译代词等语义间现象的效果。因此,本文提出了一套专门针对代词翻译的对比翻译测试。此外,我们用几个上下文软件模型进行了实验。我们表明,尽管这些系统的BLEU增益适中,但在对比测试集上,它们的准确度远远优于基线。我们的实验还表明了多编码器体系结构参数绑定的有效性。
选集ID:
W18-6307型
体积:
第三届机器翻译大会论文集:研究论文
月份:
十月
年份:
2018
地址:
比利时布鲁塞尔
编辑:
Ondřej Bojar公司拉金·查特吉克里斯蒂安·费德曼马克·费舍尔伊维特·格雷厄姆巴里·哈多马蒂亚斯·哈克安东尼奥·吉梅诺·耶佩斯菲利普·科恩克里斯托夫·蒙兹马泰奥·内格里奥雷利·内维尔玛丽亚娜·奈维斯马特·波斯特露西娅·斯佩西亚马可·图尔奇卡林·弗斯波尔
地点:
WMT公司
信号:
SIGMT公司
发布者:
计算语言学协会
注:
页:
61–72
语言:
网址:
https://aclantology.org/W18-6307
内政部:
10.18653/v1/W18-6307
比比键:
引用(ACL):
马蒂亚斯·米勒(Mathias Müller)、安妮特·里奥斯(Annette Rios)、埃琳娜·沃伊塔(Elena Voita)和里科·森里奇(Rico Sennrich)。2018用于评估神经机器翻译中上下文感知代词翻译的大规模测试集.英寸第三届机器翻译会议记录:研究论文,第61-72页,比利时布鲁塞尔。计算语言学协会。
引用(非正式):
神经机器翻译中上下文代词翻译的大规模测试集(缪勒等人,WMT 2018)
复制引文:
PDF格式:
https://aclantology.org/W18-6307.pdf
代码
苏黎世NLP/ContraPro
数据
打开字幕