第四届机器翻译会议记录(第1卷:研究论文)

Ondřej博贾,拉金·查特吉,克里斯蒂安·费德曼,马克·菲舍尔,伊维特·格雷厄姆,巴里·哈多,马蒂亚斯·哈克,安东尼奥·吉梅诺·耶佩斯,菲利普·科恩,安德烈·马丁斯,克里斯托夫·蒙兹,马泰奥·内格里,奥雷利·内维尔,玛丽亚娜·奈维斯,马特·波斯特,马可·图尔奇,卡林·弗斯波尔 (编辑)


选集ID:
W19-52号
月份:
八月
年份:
2019
地址:
意大利佛罗伦萨
地点:
WMT公司
SIG公司:
SIGMT公司
出版商:
计算语言学协会
网址:
https://aclantology.org/W19-52
内政部:
Bib导出格式:
BibTeX公司 MODS XML 尾注
PDF格式:
https://aclantology.org/W19-52.pdf

pdf格式围兜
第四届机器翻译会议记录(第1卷:研究论文)
Ondřej Bojar公司|拉金·查特吉|克里斯蒂安·费德曼|马克·费舍尔|伊维特·格雷厄姆|巴里·哈多|马蒂亚斯·哈克|安东尼奥·吉梅诺·耶佩斯|菲利普·科恩|安德烈·马丁斯|克里斯托夫·蒙兹|马泰奥·内格里|奥雷利·内维尔|玛丽亚娜·奈维斯|马特·波斯特|马可·图尔奇|卡林·弗斯波尔

pdf格式围兜
用于神经机器翻译的显著性驱动的单词对齐解释
朔阳顶|海南徐|菲利普·科恩

尽管最初的目标是共同学习对齐和翻译,但神经机器翻译(NMT)模型,尤其是Transformer,通常被认为没有学习可解释的单词对齐。在本文中,我们表明NMT模型确实学习了可解释的词对齐,这只能通过适当的解释方法才能揭示。我们提出了一系列这样的方法,这些方法是模型识别的,可以离线或在线应用,并且不需要更新参数或更改架构。我们表明,在强制解码设置下,对于某些系统,我们的解释方法引起的比对比快速比对具有更好的质量,并且当执行自由解码时,它们与自动比对工具引起的比对非常一致。

pdf格式围兜
利用与语言无关的约束改进零炮翻译
Ngoc-Quan Pham公司|简·尼休斯|唐乐哈|亚历山大·威贝尔

在训练多语言神经机器翻译(NMT)时,一个重要的关注点是在训练过程中看不到的语言对之间进行翻译,即零快照翻译。通过提供一种替代枢轴翻译的方法,提高这种能力一举两得,这也使我们能够更好地理解模型如何捕获语言之间的信息。在这项工作中,我们对多语言NMT模型的这种能力进行了调查。首先,我们有意创建一个与源语言无关的编码器体系结构。这些实验揭示了NMT编码器学习多语言表示的能力。基于这种概念证明,我们能够将正则化方法设计到标准Transformer模型中,从而使整个体系结构在零快照条件下变得更加健壮。我们在标准IWSLT 2017多语言数据集上调查了此类模型的行为。与最先进的多语言系统的零快照性能相比,我们在12个语言对中平均提高了2.23个BLEU点。此外,我们还进行了进一步的实验,即使对于具有多个中间轴心的语言对,这种效果也得到了证实。

pdf格式围兜
将源语法纳入基于变换的神经机器翻译
绘者|肯尼思·希菲尔德

基于变换的神经机器翻译(NMT)最近在许多机器翻译任务上取得了最先进的性能。然而,最近的工作(Raganato和Tiedemann,2018;Tang等人,2018;Tran等人,2018)表明,Transformer模型可能无法学习句法结构及其基于递归神经网络的对应项,特别是在低资源情况下。在本文中,我们将选区解析信息合并到Transformer NMT模型中。我们利用源训练语句的线性化解析,以便在不修改Transformer架构的情况下将语法注入Transformer体系结构。我们介绍了两种方法:多任务机器翻译和带有单个编码器和解码器的解析模型,以及一个混合编码器模型,它学习直接从已解析和未解析的源语句进行翻译。我们评估了我们从英语到20种目标语言的低资源翻译方法,结果表明,对于多任务技术,不同目标语言的平均BLEU持续改进了1.3。我们进一步评估了全方位WMT任务的模型,发现多任务模型有助于低、中源NMT,但会使高资源英语-德语翻译退化。

pdf格式围兜
APE公司at Scale及其对机器翻译评估偏差
马库斯·弗雷塔格|艾萨克·卡斯维尔|斯科特·罗伊

在这项工作中,我们训练了一个自动后期编辑(APE)模型,并使用它来揭示标准机器翻译评估程序中的偏差。我们的APE模型的目标是纠正翻译过程中引入的典型错误,并将“翻译腔”输出转换为自然文本。我们的APE模型完全基于经过英语双向翻译的单语数据进行训练,以模拟与NMT引入的错误类似的错误。我们将我们的模型应用于现有NMT系统的输出,并证明,尽管人类判断的质量在所有情况下都有所提高,但BLEU分数随着前向翻译的测试集而下降。我们针对WMT18英语到德语、WMT15英语到法语和WMT16英语到罗马尼亚语任务验证了这些结果。此外,我们有选择地将我们的APE模型应用于最近WMT评估活动的顶级提交文件的输出。我们看到所有任务的质量都得到了提高,最高可达2.5个BLEU点。

pdf格式围兜
神经机器翻译中回译的推广
米盖尔·格拉萨|金云素|朱利安·夏佩尔|沙赫拉姆·卡迪维|赫尔曼·奈伊

回译(通过翻译目标单语数据来增加数据量)是现代神经机器翻译(NMT)的一个重要组成部分。在这项工作中,我们在NMT模型的交叉熵优化范围内重新定义了反译,阐明了其启发式用法之外的潜在数学假设和近似。我们的公式涵盖了更广泛的合成数据生成方案,包括从目标到源NMT模型进行采样。通过这个公式,我们指出了基于抽样的方法的基本问题,并建议通过(i)禁用目标到源模型的标签平滑和(ii)从受限搜索空间进行抽样来解决这些问题。我们的陈述是针对WMT 2018德语<->英语新闻翻译任务进行的调查。

pdf格式围兜
带标记的回译
艾萨克·卡斯维尔|西普里安·切尔巴|大卫·格兰杰

神经机器翻译(NMT)的最新研究表明,反向翻译过程中的带噪解码可以显著提高质量,反向翻译是一种生成合成并行数据的方法。我们表明,这种合成噪声的主要作用不是像前面所建议的那样使源端多样化,而是简单地向模型表明给定的源是合成的。我们提出了一种更简单的噪声技术替代方案,包括用额外的标记标记回译的源句子。我们在WMT上的结果优于英语-罗曼语中的带噪回译和英语-德语中的匹配表现,重新定义了前者的最新水平。

pdf格式围兜
用于并行语料库挖掘的分层文档编码器
曼迪·郭|杨银飞|基思·史蒂文斯|丹尼尔·塞尔|鹤鸣阁|孙云算(Yun-hsuan Sung)|布赖恩·斯特罗普|雷库兹韦尔

我们探索使用多语言文档嵌入进行并行数据的最近邻挖掘。研究了三种文档级表示:(i)简单平均多语言句子嵌入生成的文档嵌入;(ii)神经bagof-words(BoW)文档编码模型;(iii)基于句子级模型的分层多语言文档编码器(HiDE)。结果表明,从句子级平均得到的文档嵌入对干净数据集的效果出人意料,但表明在文档级分层训练的模型对噪声数据更有效。分析实验表明,我们的层次模型对潜在句子嵌入质量的变化非常鲁棒。使用使用HiDE训练的文档嵌入实现了联合国(UN)并行文档挖掘的最先进水平,en-fr为94.9%P@1,en-es为97.3%P@1。

pdf格式围兜
机器翻译测试集中翻译素的作用
张迈|安东尼奥·托拉尔

机器翻译(MT)领域已经研究了翻译腔的作用,主要是针对训练数据。我们使用WMT新闻共享任务最后三个版本的测试集,包括17个翻译方向,深入研究了翻译对测试数据的影响。我们证明了以下证据:(i)在测试集中使用翻译酮会导致人类对机器翻译系统的评估分数过高;(ii)在某些情况下,系统排名确实会发生变化,(iii)翻译腔对翻译方向的影响与最先进的机器翻译系统在该方向所能达到的翻译质量成反比。

pdf格式围兜
为字幕定制神经机器翻译
叶夫根尼·马图索夫|帕特里克·威尔肯|尤塔·乔治科波卢

在这项工作中,我们定制了一个用于娱乐领域字幕翻译的神经机器翻译系统。神经翻译模型适用于字幕的内容和风格,并通过一种简单而有效的技术进行扩展,该技术用于将内容间上下文用于对话等短句。本文的主要贡献是提出了一种新的字幕分割算法,该算法使用从人类分割决策中学习的递归神经网络,在给定之前的单词级上下文的情况下预测字幕行的结尾。该模型结合了字幕行业中建立的字幕长度和持续时间限制。我们与两位后期编辑(一部纪录片和一部情景喜剧的英译西班牙文翻译)进行了彻底的人性化评估。与从头开始翻译相比,它的生产率显著提高了37%,与没有学习分段模型的基线非自适应系统的后期编辑相比,人工翻译编辑率显著降低。

pdf格式围兜
配音约束在机器翻译中的集成
Ashutosh Saboo公司|蒂莫·鲍曼

翻译系统旨在将语言材料(通常是文本,但也包括语音)从源语言转换为目标语言(以及相应的社会文化背景,在较小程度上),以保持其意义。配音,即嘴唇同步翻译和语音撤销,增加了语音的紧密匹配以及源材料和目标材料的视觉同步特性的限制。翻译的意义保留和“可复制性”之间存在着内在的冲突,因此可以通过权衡同步性约束来控制其权衡。我们介绍了我们的工作,据我们所知,这是第一次将同步约束整合到机器翻译范式中。我们给出了将同步约束集成到基于编码器-解码器的神经机器翻译中的第一个结果,并表明,在对BLEU分数影响很小的情况下,可以实现相当多的“可疑”翻译,并且可疑性的提高比BLEU的降低更为迅速。

pdf格式围兜
用词汇捷径拓宽神经机器翻译的表征瓶颈
丹尼斯·埃梅林|伊万·蒂托夫|里科·森里奇

转换器是一种最先进的神经翻译模型,它利用注意力通过从周围环境中提取的信息来迭代优化词汇表示。词汇特征被输入到第一层,并通过隐藏层的深层网络传播。我们认为,在每一层中表示和传播词汇特征的需要限制了模型的学习能力和表示与任务相关的其他信息的能力。为了缓解这个瓶颈,我们在嵌入层和编码器和解码器内的每个后续层之间引入了门控快捷连接。这使得模型能够动态地访问相关的词汇内容,而不需要花费有限的资源将其存储在中间状态中。我们表明,在标准WMT翻译任务的5个翻译方向(平均0.9 BLEU)上,所提出的修改比基线转换器产生了一致的改进,并减少了沿隐藏层传递的词汇信息量。我们进一步评估了将词汇连接整合到转换器架构中的不同方法,并进行了烧蚀实验,以探索所提出的快捷方式对模型行为的影响。

pdf格式围兜
用于结构化文档翻译的高质量多语言数据集
桥本和驹|拉菲拉·布希亚佐|詹姆斯·布拉德伯里|特蕾莎·马歇尔|理查德·索彻|熊才明

本文为文档领域提供了一个高质量的多语言数据集,以推进结构化文本本地化的研究。与广泛使用的纯文本翻译数据集不同,我们从企业软件平台的在线文档中收集XML结构的并行文本段。这些网页已经从英语专业翻译成16种语言,并由领域专家进行维护,每个语言对大约有100000个文本段可用。我们使用几种不同的复制机制和XML约束的beam搜索,构建并评估了七种英语目标语言的翻译模型。我们还用非英语对进行了实验,以表明我们的数据集有可能显式启用17×16翻译设置。我们的实验表明,学习使用XML标记进行翻译可以提高翻译的准确性,波束搜索可以准确地生成XML结构。我们还将重点放在数字单词和命名实体的翻译上,讨论使用复制机制的权衡。我们进一步对模型输出和真实应用程序的人工翻译之间的差距进行了详细的人工分析,包括对后期编辑的适用性。