上下文软件神经机器翻译的挑战

金凌浩,杰奎琳·何,乔纳森·梅,马学哲


摘要
上下文软件神经机器翻译是一种利用句子级上下文以外的信息来解决语篇间依赖并提高文档级翻译质量的范式,近年来出现了许多新技术。然而,尽管直觉很合理,大多数上下文软件翻译模型与句子级系统相比仅显示出适度的改进。在这项工作中,我们调查并提出了阻碍该领域进展的几个核心挑战,涉及话语现象、上下文使用、模型架构和文档级评估。为了解决这些问题,我们提出了一种更现实的文档级翻译设置,称为段落对段落(PARA2PARA)翻译,并收集了一个新的汉英小说数据集,以促进未来的研究。
选集ID:
2023.emnlp-main.943年
体积:
2023年自然语言处理实证方法会议记录
月份:
十二月
年份:
2023
地址:
新加坡
编辑:
Houda Bouamor公司,胡安·皮诺,卡利卡-巴厘岛
地点:
EMNLP公司
SIG公司:
出版商:
计算语言学协会
注:
页:
15246–15263
语言:
网址:
https://aclantology.org/2023.emnlp-main.943
内政部:
10.18653/v1/2023.emnlp-main.943
比比键:
引用(ACL):
2023年,金凌浩、何杰奎琳、乔纳森·梅和马学哲。上下文软件神经机器翻译的挑战.英寸2023年自然语言处理实证方法会议记录,第15246–15263页,新加坡。计算语言学协会。
引用(非正式):
上下文软件神经机器翻译的挑战(Jin等人,EMNLP 2023)
复制引文:
PDF格式:
https://aclantology.org/2023.emnlp-main.943.pdf
视频:
 https://aclantology.org/2023.emnlp-main.943.mp4网址