研究

解决神经机器翻译中的罕见词问题

摘要

神经机器翻译是一种新的机器翻译方法这显示了与传统方法相当的有希望的结果。传统NMT系统的一个显著弱点是无法正确翻译非常罕见的单词:端到端NMT往往具有相对带有单个unk符号的小型词汇表,代表每一种可能本地外(OOV)字。在本文中,我们提出并实现了一个解决此问题的有效技术。我们对NMT系统进行数据培训它通过单词对齐算法的输出得到增强,从而允许NMT系统为目标句子中的每个OOV单词发出其位置源句中的对应词。此信息将在以后使用在使用字典翻译每个OOV单词的后处理步骤中。我们对WMT14英法翻译任务的实验表明不使用该技术的等效NMT系统。有37.5个BLEU点,我们的NMT系统是第一个在WMT14上取得最佳成绩的系统竞赛任务。评论:ACL 2015 camera-ready versio

    类似工程

    全文

    缩略图-图像