计算机科学>计算与语言
职务: 上下文软件神经机器翻译的挑战
摘要: 上下文软件神经机器翻译涉及利用句子级上下文以外的信息来解决主题间的语篇依赖,提高文档级翻译质量,并产生了一些最新的技术。 然而,尽管直觉很合理,大多数上下文软件翻译模型与句子级系统相比仅显示出适度的改进。 在这项工作中,我们调查了阻碍这一领域进展的几个挑战,涉及到话语现象、上下文使用、模型架构和文档级评估。 为了解决这些问题,我们提出了一种更现实的文档级翻译设置,称为段落对段落(paragraph-To-paragraph,para2para)翻译,并收集了一个新的汉英小说数据集,以促进未来的研究。