2017年调查结果D类国际标准化组织机器翻译跨语言代词预测的共同任务

谢里德·洛艾西加,萨拉·斯泰姆,普雷斯拉夫·纳科夫,克里斯蒂安·哈德迈耶,约格·蒂德曼,毛罗·塞托洛,扬尼克·凡斯利


摘要
我们描述了2017年DiscoMT跨语言代词预测共享任务的设计、设置和评估结果。该任务要求参与者在句子上下文中,根据源语言代词预测目标语言代词。我们进一步提供了源句子的柠檬化目标语言人工翻译,以及源句子单词和目标语言柠檬之间的自动单词对齐。该任务的目的是,对于每个目标语言代词占位符,使用可以从整个文档中提取的任何类型的信息,预测应该从一组小的封闭类中替换它的单词。我们提供了四个子任务,每个任务针对不同的语言组合和翻译方向:英语到法语、英语到德语、德语到英语和西班牙语到英语。五个小组参与了共享任务,为所有语言对提交材料。评估结果表明,大多数参与团队的表现都大大优于两个基于n-gram语言模型的强大基线系统。
选集ID:
宽17-4801
体积:
第三届机器翻译语篇研讨会论文集
月份:
九月
年份:
2017
地址:
丹麦哥本哈根
编辑:
邦妮·韦伯,安德烈·波佩斯库·贝利斯,约格·蒂德曼
地点:
DiscoMT公司
SIG公司:
发布者:
计算语言学协会
注:
页:
1–16
语言:
网址:
https://aclcollectory.org/W17-4801
内政部:
10.18653/v1/W17-4801
比比键:
引用(ACL):
Sharid Loáiciga、Sara Stymne、Preslav Nakov、Christian Hardmeier、Jörg Tiedemann、Mauro Cettolo和Yannick Versley。20172017年DiscoMT跨语言代词预测共享任务的研究结果.英寸第三届机器翻译语篇研讨会论文集,第1-16页,丹麦哥本哈根。计算语言学协会。
引用(非正式):
2017年DiscoMT跨语言代词预测共享任务的研究结果(Loáiciga等人,DiscMT 2017)
复制引文:
PDF格式:
https://aclantology.org/W17-4801.pdf
附件:
W17-4801.附件.zip
数据
欧罗巴