用于多语言神经翻译的认知软件形态分割

斯蒂格·阿恩·格伦罗斯,萨米·维皮奥亚,米科·库里莫


摘要
本文描述了阿尔托大学WMT18新闻翻译共享任务的条目。我们参与了多语言子跟踪,在受限条件下培训了一个系统,可以将英语翻译成芬兰语和爱沙尼亚语。该系统基于变压器模型。我们致力于提高拼写、语义和分布相似的单词的形态切分的一致性;这些词包括词源同源词、外来词和专有名词。为此,我们引入了Cognate Morfessor,这是Morfesso方法的一种多语言变体。我们表明,我们的方法提高了翻译质量,尤其是爱沙尼亚语的翻译质量,爱沙尼亚人用于培训翻译模式的资源较少。
选集ID:
W18-6410型
体积:
第三届机器翻译会议记录:共享任务文件
月份:
十月
年份:
2018
地址:
比利时、布鲁塞尔
编辑:
Ondřej Bojar公司,拉金·查特吉,克里斯蒂安·费德曼,马克·费舍尔,伊维特·格雷厄姆,巴里·哈多,马蒂亚斯·哈克,安东尼奥·吉梅诺·耶佩斯,菲利普·科恩,克里斯托夫·蒙兹,马泰奥·内格里,奥雷利·内维尔,玛丽亚娜·奈维斯,马特·波斯特,露西娅·斯佩西亚,马可·图尔奇,卡林·弗斯波尔
地点:
WMT公司
SIG公司:
SIGMT公司
发布者:
计算语言学协会
注:
页:
386–393
语言:
网址:
https://acl选集.org/W18-6410
内政部:
10.18653/v1/W18-6410
比比键:
引用(ACL):
Stig-Arne Grönroos、Sami Virpioja和Mikko Kurimo,2018年。用于多语言神经翻译的认知软件形态分割.英寸第三届机器翻译会议记录:共享任务文件,第386–393页,比利时,布鲁塞尔。计算语言学协会。
引用(非正式):
用于多语言神经翻译的认知软件形态分割(Grönroos等人,WMT 2018)
复制引文:
PDF格式:
https://aclantology.org/W18-6410.pdf