Neural Machine Translation of Logographic Language Using Sub-character Level Information

Longtu Zhang; Mamoru Komachi

doi:10.18653/v1/W18-6303

基于子字符级信息的对数语言神经机器翻译

摘要

最近的神经机器翻译（NMT）系统通过具有注意机制和子单词单元的编码器-解码器模型得到了极大的改进。然而，长期以来，人们忽视了带有文字和字母书写系统的语言之间的重要差异。本研究重点关注这些差异，并使用一种简单的方法来提高NMT系统的性能，该方法利用符号语言的分解子字符级信息。我们的结果表明，我们的方法不仅提高了NMT系统在汉英之间的翻译能力，而且还进一步改进了中日NMT系统，因为它利用了相似子字符单元带来的共享信息。

选集ID：: W18-6303型
体积：: 第三届机器翻译会议记录：研究论文
月份：: 十月
年份：: 2018
地址：: 比利时布鲁塞尔
编辑：: Ondřej Bojar公司,拉金·查特吉,克里斯蒂安·费德曼,马克·费舍尔,伊维特·格雷厄姆,巴里·哈多,马蒂亚斯·哈克,安东尼奥·吉梅诺·耶佩斯,菲利普·科恩,克里斯托夫·蒙兹,马泰奥·内格里,奥雷利·内维尔,玛丽亚娜·奈维斯,马特·波斯特,露西娅·斯佩西亚,马可·图尔奇,卡林·弗斯波尔
地点：: WMT公司
SIG公司：: SIGMT公司
出版商：: 计算语言学协会
注：
页：: 17–25
语言：
网址：: https://aclantology.org/W18-6303
内政部：: 10.18653/v1/W18-6303型
比比键：
引用（ACL）：: 张隆图（Longtu Zhang）和马莫鲁·科马奇（Mamoru Komachi）。2018基于子字符级信息的Logographic语言的神经机器翻译.英寸第三届机器翻译会议记录：研究论文，第17-25页，比利时布鲁塞尔。计算语言学协会。
引用（非正式）：: 基于子字符级信息的对数语言神经机器翻译（Zhang&Komachi，WMT 2018）
复制引文：
PDF格式：: https://aclantology.org/W18-6303.pdf
数据: 亚太经合组织

PDF格式引用搜索