词汇链与文档级统计机器翻译中的单词嵌入

劳拉·马斯卡雷尔


摘要
目前正在审查2017年EMNLP。基于短语的统计机器翻译(SMT)方法孤立地处理句子,这使得在翻译中很难考虑话语语境。这对需要话语知识才能正确翻译的歧义词提出了挑战。我们提出了一种方法,该方法利用词汇链中的语义相似性,通过将SMT集成到文档级解码器中来改进SMT输出。与使用词汇资源的传统方法相反,我们专注于单词嵌入来处理词汇链。德语到英语的实验结果表明,我们的方法在88%的变化中产生了正确的翻译,在基线上提高了36%-48%的翻译。
选集ID:
宽17-4813
音量:
第三届机器翻译语篇研讨会论文集
月份:
九月
年份:
2017
地址:
丹麦哥本哈根
编辑:
邦妮·韦伯安德烈·波佩斯库·贝利斯约格·蒂德曼
地点:
DiscoMT公司
SIG公司:
发布者:
计算语言学协会
注:
页:
99–109
语言:
网址:
https://aclantology.org/W17-4813
内政部:
10.18653/v1/W17-4813
比比键:
引用(ACL):
劳拉·马斯卡雷尔。2017词汇链与文档级统计机器翻译中的单词嵌入.英寸第三届机器翻译语篇研讨会论文集,第99-109页,丹麦哥本哈根。计算语言学协会。
引用(非正式):
词汇链与文档级统计机器翻译中的单词嵌入(马斯卡雷尔,DiscMT 2017)
复制引文:
PDF格式:
https://aclantology.org/W17-4813.pdf
数据
欧罗巴