第四届机器翻译会议记录(第3卷:共享任务文件,第2天)

Ondřej Bojar公司,拉金·查特吉,克里斯蒂安·费德曼,马克·费舍尔,伊维特·格雷厄姆,巴里·哈多,马蒂亚斯·哈克,安东尼奥·吉梅诺·耶佩斯,菲利普·科恩,安德烈·马丁斯,克里斯托夫·蒙兹,马泰奥·内格里,奥雷利·内维尔,玛丽亚娜·奈维斯,马特·波斯特,马可·图尔奇,卡林·弗斯波尔 (编辑)


选集ID:
W19-54页
月份:
八月
年份:
2019
地址:
意大利佛罗伦萨
地点:
WMT公司
SIG公司:
SIGMT公司
出版商:
计算语言学协会
网址:
https://aclantology.org/W19-54
内政部:
Bib导出格式:
BibTeX公司 MODS XML 尾注
PDF格式:
https://aclantology.org/W19-54.pdf

pdf格式围兜
第四届机器翻译会议记录(第3卷:共享任务文件,第2天)
Ondřej Bojar公司|拉金·查特吉|克里斯蒂安·费德曼|马克·菲舍尔|伊维特·格雷厄姆|巴里·哈多|马蒂亚斯·哈克|安东尼奥·吉梅诺·耶佩斯|菲利普·科恩|安德烈·马丁斯|克里斯托夫·蒙兹|马泰奥·内格里|奥雷利·内维尔|玛丽亚娜·奈维斯|马特·波斯特|马可·图尔奇|卡林·弗斯波尔

pdf格式围兜
调查结果WMT公司2019年质量评估共享任务
埃里克·丰塞卡|丽莎·扬科夫斯卡娅|安德烈·F·T·马丁斯|马克·费舍尔|克里斯蒂安·费德曼

我们报告了WMT19质量评估共享任务的结果,即仅给定源文本和假设翻译,预测机器翻译系统输出质量的任务。该任务包括三个粒度级别的评估:单词、句子和文档。一个新的补充是根据人类的判断评估句子级QE:换句话说,设计不需要参考翻译的机器翻译度量。今年我们包括三种语言对,它们都是由神经机器翻译系统单独生成的。来自11个机构的参与团队提交了针对不同任务变体和语言对的各种系统。

pdf格式围兜
调查结果WMT公司2019年自动后期编辑共享任务
拉金·查特吉|克里斯蒂安·费德曼|马泰奥·内格里|马可·图尔奇

我们展示了第五轮WMT任务关于机器翻译自动后编辑的结果。该任务包括通过学习人工更正,自动更正“黑盒”机器翻译系统的输出。保持前四轮的一般评估设置不变,今年我们重点关注两种语言对(英语-德语和英语-俄语)和特定领域的数据(信息技术)。对于两种语言方向,机器翻译输出都是由参与者未知的神经系统产生的。七个团队参与了英国人任务,共提交了18次跑步。这项评估是在2018年回合所用的同一测试集上进行的,显示出APE技术有了轻微进步:4支球队取得了比去年的获胜系统更好的成绩,比基线提高了-0.78 TER和+1.23 BLEU分。两个团队参与了英苏任务,每个团队提交2次跑步。在这一新的语言方向上,以高质量的原始翻译为特征,这项任务被证明是特别具有挑战性的。提交的运行都没有改善用于生成初始翻译的强大系统的非常高的结果(16.16 TER,76.20 BLEU)。

pdf格式围兜
调查结果WMT公司2019年生物医学翻译共享任务:评估MEDLINE公司摘要和生物医学术语
雷切尔·巴登|凯文·布雷东纳尔·科恩|克里斯蒂安·格罗泽亚|安东尼奥·吉梅诺·耶佩斯|马德琳·基特纳|马丁·克莱林格|南希·马|Aurelie Neveol公司|玛丽亚娜·奈维斯|菲利佩·索尔斯|艾米·萧|卡林·弗斯波尔|麦卡·文森特·纳瓦罗

在WMT生物医学翻译任务的第四版中,我们总共考虑了六种语言,即汉语(zh)、英语(en)、法语(fr)、德语(de)、葡萄牙语(pt)和西班牙语(es)。我们对总共10个语言方向的自动翻译进行了评估,即zh/en、en/zh、fr/en、zh/fr、de/en、end/de、pt/en、en/pt、es/en和en/es。我们根据MEDLINE摘要为10个语言对中的8个提供了训练数据,并为所有这些语言对提供了测试集。除此之外,我们还为英语/英语语言方向的生物医学术语翻译提供了一个新的子任务。es/en、en/es和en/pt测试集以及术语子任务的BLEU得分较高(接近0.5)。在对主要运行进行手动验证后,一些提交被判断为优于参考翻译,例如de/en、en/es和es/en。

pdf格式围兜
调查结果WMT公司2019年关于低资源条件下并行语料库过滤的共享任务
菲利普·科恩|弗朗西斯科·古兹曼|维什拉夫·乔杜里|胡安·皮诺

继WMT 2018并行语料库过滤共享任务之后,我们提出了一个挑战,即为从web上抓取的噪音很大的句子对语料库分配句子级质量分数,目标是再选择2%和10%的高质量数据用于训练机器翻译系统。今年,该任务解决了尼泊尔英语和僧伽罗语资源不足的问题。来自公司、国家研究实验室和大学的11名参与者参与了这项任务。

pdf格式围兜
RTM公司机器翻译性能预测的叠加结果
埃尔贡·比西奇

我们使用参考翻译机获得新的结果,在结果集中增加了学习模型的数量,这些结果被堆叠起来,以获得更好的专家预测混合。我们将从单词级预测中提取的特征与句子或文档级特征相结合,这显著提高了训练集的结果,但减少了测试集的结果。

pdf格式围兜
Unbabel参与WMT公司19翻译质量评估共享任务
法比奥·开普勒|乔纳·特雷努斯|马科斯·特雷维索|米盖尔·维拉|安东尼奥·戈伊斯|M.Amin Farajian先生|安东尼奥·洛佩斯|安德烈·F·T·马丁斯

我们介绍Unabel团队对WMT 2019质量评估共享任务的贡献。我们参加了单词、句子和文档级别的培训,包括3种语言对:英语-德语、英语-俄语和英语-法语。我们的提交基于最近的OpenKiwi框架:我们使用BERT和XLM预处理模型将线性、神经和预测-估计系统与新的传递学习方法相结合。我们分别比较了系统,并提出了用于单词和句子级别预测的新的集成技术。我们还提出了一种将单词标签转换为文档级预测的简单技术。总的来说,我们提交的系统在所有音轨和语言对上都取得了相当大的成绩。

pdf格式围兜
质量工程 伯特:双语伯特使用多任务学习进行神经质量估计
Hyun Kim先生|Joon Ho Lim公司|金贤基|Seung-Hoon Na公司

为了在单词和句子层面上评估翻译质量,本文提出了一种基于BERT的新方法,该方法最近在各种自然语言处理任务中取得了令人印象深刻的结果。我们提出的模型是针对翻译质量评估重新提出的BERT,并对句子级任务和单词级子任务(即源词、目标词和目标空缺)使用多任务学习。在WMT19的质量评估共享任务上的实验结果表明,我们的系统显示出具有竞争力的结果,并在基线上提供了显著的改进。

pdf格式围兜
MIPT公司世界级质量评估系统
米哈伊尔·莫西亚金|瓦瓦拉·洛加切娃

我们探索了WMT19共享任务的不同模型架构,该任务涉及自动翻译的单词级质量评估。我们从一个类似于Shef-bRNN的模型开始,通过使用条件随机场进行序列标记对其进行修改。此外,我们使用不同的方法标记空白和源词。我们进一步开发了该模型,包括来自不同来源的特征,如BERT、任务的基线特征和变压器编码器。我们在English-German数据集上评估模型在相应共享任务中的性能。

pdf格式围兜
NJU公司提交给WMT公司19质量估算共享任务
侯琦

在本文中,我们描述了南京大学团队提交的WMT19句子级质量评估(QE)共享任务的英语-德语对。我们开发了两种基于两阶段神经QE模型的方法,该模型由特征提取器和质量估计器组成。更具体地说,所提出的方法之一利用了来自两个不同翻译方向的两种语言之间的翻译知识;另一种方法利用了源方和目标方的额外单语知识,这些知识是通过预先训练深度自我关注网络获得的。为了有效地训练这些两阶段模型,采用了联合学习训练方法。实验表明,上述两个模型的集成模型在WMT17句子级QE共享任务的基准数据集上取得了最好的结果,并在WMT19中取得了有竞争力的结果,在10份提交中排名第3。

pdf格式围兜
通过预训练的单词和句子嵌入实现质量估计和翻译度量
伊丽莎维塔·扬科夫斯卡娅|安德烈·塔塔|马克·费舍尔

我们建议使用预训练嵌入作为机器翻译句子级质量评估回归模型的特征。在我们的工作中,我们结合免费提供的BERT和LASER多语言嵌入来训练基于神经的回归模型。在第二种方法中,我们不仅使用预训练嵌入作为输入特征,还使用任何机器翻译(MT)系统的对数概率作为输入特征。这两种方法均应用于多个语言对,并作为经典质量评估系统(预测HTER分数)和机器翻译度量(预测人类对翻译质量的判断)进行评估。

pdf格式围兜
来源:酸性机器翻译质量评估的ce-条件Elmo-style模型
周俊培|张志松|胡泽聪

机器翻译(MT)系统的质量评估(QE)是一项日益重要的任务。它降低了后期编辑的成本,允许在正式场合使用机器翻译的文本。在这项工作中,我们描述了WMT 2019句子级QE任务中的提交系统。我们主要探讨了预训练翻译模型在QE中的应用,并采用了双向的类翻译策略。该策略类似于ELMo,但对源语句附加了条件。在WMT QE数据集上的实验表明,我们的策略可以改进QE,使预训练稍微困难一些。在WMT-2019 QE任务中,我们的系统在En-De NMT数据集上排名第二,在En-Ru NMT数据集中排名第三。

pdf格式围兜
基于变换器的联合编码器和解码器多源关注的自动后置编辑模型
王记·李|Jaehun Shin先生|Jong-Hyeok Lee(李宗慧)

本文描述了POSTECH向WMT 2019提交的关于自动后期编辑(APE)的共享任务。本文通过对Transformer的扩展,提出了一种新的多源APE模型。我们研究的主要贡献是:1)重建编码器,以生成翻译(mt)及其src上下文的联合表示,以及传统的src编码;2)建议两种类型的多源注意层,以计算解码器中编码器和解码器状态的两个输出之间的注意。此外,我们通过应用不同的教师支持比率来训练我们的模型,以缓解暴露偏见。最后,我们在模型的变化中采用了集成技术。在WMT19英语-德语APE数据集上的实验表明,TER和BLEU得分都比基线有所提高。与基线相比,我们的首次提交的TER达到-0.73,BLEU达到+1.49。

pdf格式围兜
Unbabel向WMT公司2019APE公司共享任务:伯特-基于编码器-解码器的自动后期编辑
安东尼奥·洛佩斯|M.Amin Farajian先生|戈萨洛·M·科雷亚|乔纳·特雷努斯|安德烈·F·T·马丁斯

本文描述了Unbabel提交给WMT2019 APE共享任务的英语-德语语言对。随着近年来大型、强大的预处理模型的兴起,我们采用BERT预处理模型在编解码器框架中执行自动后编辑。与双编码器架构类似,我们开发了一种基于BERT的编解码器(BED)单个预处理BERT编码器同时接收源src和机器翻译mt字符串的模型。此外,我们还探索了一个保守因素,以约束APE系统执行更少的编辑。如官方结果所示,当基于域内训练数据和人工训练数据的加权组合进行训练时,我们的带有保守性惩罚的BED系统在TER和BLEU方面分别显著提高了强NMT系统的翻译-0.78和+1.23。最后,我们提交的文件达到了新的最先进水平,例如英语版——NMT的German APE。

pdf格式围兜
美国陆军航空兵-DFKI公司–的传输架构E类英语–G公司erman自动后期编辑
桑塔努·帕尔|徐洪飞|尼科·赫比格|安东尼奥·克鲁格|约瑟夫·范·贾纳比特

在本文中,我们向WMT 2019年组织的APE任务提交了一个名为transference的英语-德语自动后期编辑(APE)系统。我们的传输模型基于多编码器变压器架构。与以前的方法不同,它(i)将变压器编码器块用于src,(ii)后跟变压器解码器块,但没有掩蔽,用于对mt进行自我关注,有效地充当组合src–>mt的第二个编码器,以及(iii)将此表示输入到生成pe的最终解码器块中。在WMT 2019 APE开发和测试集上,我们的模型比原始的黑盒神经机器翻译系统提高了0.9和1.0个绝对BLEU点。我们的提交排名第三,但与两个顶级系统相比,性能差异在统计上并不显著。

pdf格式围兜
APE公司通过神经和统计机器翻译使用增强数据。自适应/数据采集单元提交给WMT公司2019APE公司共享任务
迪米塔尔·施特里奥诺夫|约阿希姆·瓦格纳|费利克斯·多·卡莫

自动后编辑(APE)可以简化为机器翻译(MT)任务,其中源是特定MT系统的输出,目标是其后编辑变体。然而,这种方法没有考虑机器翻译系统原始源中的上下文信息。因此,更好的方法是使用多源MT,其中考虑两个输入序列——一个是原始源,另一个是MT输出。额外的上下文信息可以以额外标记的形式引入,这些标记标识一组段的特定全局属性,并作为前缀或后缀添加到每个段中。该技术已成功应用于机器翻译的领域自适应以及APE,值得进一步关注。在这项工作中,我们研究了具有训练数据的多源神经APE(或NPE)系统,这些训练数据已经用两种额外的上下文标记进行了增强。我们使用WMT 2019提供的真实合成数据进行实验,并将结果提交给APE共享任务。我们还尝试使用统计机器翻译(SMT)方法进行APE。虽然我们的系统得分低于基线,但我们认为这项工作是理解APE情况下额外上下文附加值的一步。

pdf格式围兜
费力软件神经自动后期编辑
阿米罗申·特比法赫|马泰奥·内格里|马可·图尔奇

对于2019年WMT APE的这一轮共享任务,我们提交的报告侧重于解决APE中的“过度修正”问题。当APE系统倾向于重新表述已经正确的机器翻译输出时,就会发生过度纠正,并且由此产生的句子会受到基于参考的人工编辑后评估的惩罚。我们的直觉是,通过告知系统MT输出的预测质量,或者换句话说,所需修正的预期数量,可以避免这个问题。为此,遵循多语言NMT中的常见方法,我们在源文本和MT输出的开头都添加了一个特殊标记,以指示所需的后期编辑量。在向WMT 2018 APE共享任务提交最佳文件后,我们的主干架构基于多源变压器,对MT输出和相应的源文本进行编码。我们参与了英语-德语和英语-俄语子任务。在第一个子任务中,我们的最佳提交将原始MT输出质量提高到+0.98 BLEU和-0.47 TER。在第二个子任务中,机器翻译输出的较高质量会增加过度校正的风险,但我们提交的所有运行都无法提高机器翻译输出。

pdf格式围兜
单位d日S公司提交WMT公司19自动编辑后任务
徐洪飞|刘秋辉|约瑟夫·范·贾纳比特

在本文中,我们描述了我们在WMT 2019年向英国-德国APE共享任务提交的文件。我们利用并改进了最初开发用于将上下文信息用于APE的NMT体系结构,在我们自己的转换器模型中实现了这一点,并探索了使用去噪编码器对APE任务进行联合训练。

pdf格式围兜
术语感知的细分和域功能WMT公司19生物医学翻译任务
卡西米罗·皮奥·卡里诺|巴迪娅·拉菲安|Marta R.Costa-jussá|何塞·A·R·福诺洛萨

在这项工作中,我们对提交给WMT19生物医学翻译任务的TALP-UPC系统进行了描述。我们提出的策略是NMT模型依赖性的,并且只依赖于一个成分,即生物医学术语表。我们首先通过使用BabelNet API在我们的训练数据集中标记生物医学单词来提取这样的术语表。然后,我们设计了一种数据准备策略,以在令牌级别插入术语信息。最后,我们用这些术语信息数据训练Transformer模型。我们提交的最佳系统在西班牙语-英语和英语-西班牙语翻译方向上分别排名第二和第三。

pdf格式围兜
生物医学翻译中的迁移学习和领域数据选择
Noor-e-希拉|萨达夫·阿卜杜勒·劳夫|基兰·基亚尼|阿马拉·扎法尔|拉希尔·纳瓦兹

转移学习和选择性数据训练是目前广泛研究的提高神经机器翻译系统质量的两种方法。本文通过应用迁移学习和选择性数据训练进行了一系列实验,以参与WMT19的生物医学共享任务。我们使用信息检索从域外数据中有选择地选择相关句子,并使用转移学习将其用作额外的训练数据。我们还报告了标记化对翻译模型性能的影响。

pdf格式围兜
华为的神经网络机器翻译用于的系统WMT公司2019年生物医学翻译任务
魏鹏|刘建峰|李良友|Qun Liu(刘群)

本文描述了华为的神经机器翻译系统用于WMT 2019生物医学翻译共享任务。我们对我们的系统进行了培训和微调,将域外和域内并行语料库结合起来,用于六个翻译方向,涵盖英语-汉语、英语-法语和英语-德语对。根据官方评估结果,我们提交的系统在英语-法语和英语-德语语言对上取得了最佳BLEU分数。在英汉翻译任务中,我们的系统位居第二。性能的提高归功于更多的领域内培训和更复杂的模型开发。翻译模型和迁移学习(或领域适应)方法的发展对任务的进展做出了重大贡献。

pdf格式围兜
UCAM公司生物医学翻译WMT公司19:转移学习多领域集成
丹妮尔·桑德斯|费利克斯·斯塔尔伯格|比尔·伯恩

2019年WMT生物医学翻译任务涉及翻译Medline摘要。我们使用迁移学习来获得不同领域上的一系列强神经模型,并将它们组合成多领域集成。我们进一步试验了一种自适应语言模型集成加权方案。我们的提交在英语和西班牙语两个方向上都取得了最好的提交结果。

pdf格式围兜
英国标准委员会参与WMT公司生物医学文摘的翻译
菲利佩·索尔斯|马丁·克莱林格

本文描述了巴塞罗那超级计算(BSC)团队为WMT19生物医学翻译共享任务开发的机器翻译系统。我们的系统基于神经机器翻译,使用OpenNMT-py工具包和Transformer体系结构。我们参加了英语/西班牙语和英语/葡萄牙语对的四个翻译指导。为了创建我们的训练数据,我们连接了几个并行语料库,包括域内和域外源,以及UMLS中的术语资源。

pdf格式围兜
这个MLLP公司-UPV公司 S公司泛型的-P(P)葡萄牙语和P(P)葡萄牙-S公司平移机器翻译系统WMT公司19类似语言翻译任务
Pau Baquero-Arnal公司|哈维尔·伊兰佐·桑切斯|豪尔赫·西维拉|阿尔芬斯·胡安

本文描述了瓦伦西亚政治大学MLLP研究小组参与WMT 2019相似语言翻译共享任务的情况。我们已经为葡萄牙人提交了系统西班牙语对,双向。我们已经提交了基于Transformer体系结构的系统,以及一种正在开发中的新型体系结构,我们称之为2D交替RNN。我们已经通过微调进行了域自适应。

pdf格式围兜
这个TALP公司-通用产品代码系统WMT公司相似语言任务:统计与神经机器翻译
Magdalena Biesialska公司|路易斯·瓜迪亚|Marta R.Costa-jussá

尽管相似语言翻译问题多年来一直是人们感兴趣的研究领域,但它仍然远未得到解决。在本文中,我们研究了两种常用方法的性能:统计方法和神经方法。我们得出结论,这两种方法都产生了相似的结果;然而,性能因语言对而异。虽然对于西班牙语-葡萄牙语语言对来说,统计方法的性能优于神经方法,相差6个BLEU点,但对于捷克-波兰来说,所提出的神经模型的性能优于统计方法,相差2个BLUE点。在前一种情况下,语言相似度(基于困惑)远远高于后一种情况。此外,我们报告了带有反向翻译的系统组合的负面结果。在第一次WMT类似语言翻译任务的官方评估中,我们提交的TALP-UPC系统为捷克语->波兰语获得了第一名,为西班牙语->葡萄牙语获得了第二名。

pdf格式围兜
从相互理解的角度看机器翻译
于晨|塔妮娅·阿古斯蒂诺娃

在第一个关于相似语言之间的机器翻译的共享任务中,我们从相互理解的角度介绍了我们在捷克语到波兰语机器翻译方面的首次尝试。我们提出了基于两种语言的相互可理解性的方法,利用它们的拼写和语音相似性,以期改进我们的基线。使用BLEU评估转换结果。在这个指标上,我们的任何建议都无法在最终测试集上超过基线。目前的设置还处于初级阶段,我们可以在未来尝试一些潜在的改进。

pdf格式围兜
在中使用单语数据神经网络机器翻译对于类似语言:提交类似语言翻译任务
Jyotsana Khatri公司|普什巴克·巴塔查里亚

本文描述了我们在第四届机器翻译会议(WMT 2019)上提交的关于相似语言翻译的共享任务。我们为印地语->尼泊尔语方向提交了三个系统,其中我们检查了基于RNN的NMT系统的性能,一种半监督NMT系统,其中两种语言的单语数据均由使用该体系结构的人使用,并且该系统使用源句子和目标句子的副本生成的额外合成句子进行训练,而不使用任何额外的单语数据。

pdf格式围兜
神经机器翻译:H(H)印度-N个埃帕利
萨希努·拉赫曼·拉斯卡尔|Partha Pakray公司|锡瓦吉·班迪奥帕提亚

随着机器翻译(MT)技术的广泛应用,人们对在相似语言对之间进行直接翻译越来越感兴趣。因为主要的挑战是克服可用并行数据的限制,以生成精确的MT输出。目前的工作依赖于带注意机制的神经机器翻译(NMT),在Hindi-Nepali对上下文中对WMT19共享任务进行相似语言翻译。NMT系统训练印地语-尼帕利语平行语料库,并用印地语进行测试和分析尼泊尔语翻译。在WMT19共享任务中公布的官方结果显示,我们的NMT系统在尼泊尔语到印地语翻译的初级配置中获得了双语评估Understudy(BLEU)24.6分。此外,我们在对比系统类型中取得了BLEU分数53.7(印地语对尼泊尔语)和49.1(尼泊尔语对印地语)。

pdf格式围兜
NICT公司的机器翻译系统WMT公司19类似语言翻译任务
本杰明·玛丽|拉吉·达布雷|藤田松树

本文介绍了NICT参与WMT19共享相似语言翻译任务的情况。我们参加了西班牙语-葡萄牙语任务。对于这两个翻译方向,我们准备了最先进的统计(SMT)和神经(NMT)机器翻译系统。我们使用Transformer体系结构的NMT系统在提供的并行数据上进行训练,这些并行数据通过大量的回译单语数据进行了扩充。我们的主要任务是SMT和NMT系统的简单组合。根据BLEU,我们的系统在葡萄牙语到西班牙语和西班牙语到葡萄牙语的翻译方向上分别排名第二和第三。对于对比实验,我们还提交了使用无监督SMT系统生成的输出。

pdf格式围兜
泛语-KMI公司 机器翻译类似语言翻译任务系统WMT公司2019
Atul Kr.Ojha公司|Ritesh Kumar公司|阿坎沙·班萨尔|普里亚·拉尼

本文列举了印地语泛语KMI机器翻译(MT)系统的开发尼泊尔语对,作为WMT 2019共享任务类似语言翻译任务的一部分而设计。Panlingua-KMI团队进行了一系列实验,以探索基于短语的统计(PBSMT)和神经方法(NMT)。在本任务下准备的11个MT系统中,为尼泊尔-印度准备了6个PBSMT系统,为Hindi-Nepali开发了1个PBSMT系统,为尼泊尔开发了2个NMT系统印地语。结果表明,PBSMT可以成为开发紧密相关语言的机器翻译系统的有效方法。我们的Hindi-Nepali PBSMT系统在提交的13个系统中排名第二,我们的Nepali-Hindi PBSMT在提交的12个系统中名列第四。

pdf格式围兜
UDS(通用数据系统)——DFKI公司提交给WMT公司2019C类扎克–P(P)olish相似语言翻译共享任务
桑塔努·帕尔|马科斯·赞皮耶里|约瑟夫·范·贾纳比特

本文介绍了在WMT 2019年提交给类似语言翻译共享任务的UDS-DFKI系统。这项共享任务的第一版以三对类似语言的数据为特色:捷克语和波兰语、印地语和尼泊尔语、葡萄牙语和西班牙语。参与者可以选择参与这三个轨道中的任何一个,并以任何翻译方向提交系统输出。我们报告了系统从捷克语翻译成波兰语的结果,并评论了域外测试数据对系统性能的影响。UDS-DFKI在捷克语到波兰语的翻译中取得了在十支球队中排名第二的竞争成绩。

pdf格式围兜
低资源和相似语言的反向翻译神经机器翻译
迈克尔·普日索塔|穆罕默德·阿卜杜勒·马吉德

我们将介绍我们对WMT19相似语言翻译共享任务的贡献。我们研究了神经机器翻译在三种低资源、相似语言对上的效用:西班牙语-葡萄牙语、捷克语-波兰语和印地语-尼泊尔语。由于最先进的神经机器翻译系统仍然需要大量的比特文本,而我们所考虑的对没有这种比特文本,因此我们主要关注将单语数据合并到我们的模型中,并进行反向翻译。在我们的分析中,我们发现Transformer模型在西班牙语-葡萄牙语和捷克语-波兰语翻译中效果最好,而全球关注的LSTM在印地语-尼泊尔语翻译中的效果最好。

pdf格式围兜
这个单位大学H(H)elsinki提交给WMT公司19类似语言翻译任务
伊夫·谢勒|劳尔·瓦茨奎兹|萨米·维皮奥亚

本文介绍了赫尔辛基大学语言技术小组参与WMT 2019年类似语言翻译任务的情况。我们训练了捷克语和西班牙语葡萄牙语语言对的神经机器翻译模型。我们的实验集中在不同的子词分割方法上,特别是将同源软件分割方法cognate-Morfessor与字符分割和无监督分割方法进行了比较,这些方法将来自不同语言的数据简单连接起来。我们没有观察到同源软件分割方法的主要好处,但可能需要进一步研究来探索参数空间的更大部分。事实证明,字符级模型在西班牙语和葡萄牙语之间的翻译方面具有竞争力,但在训练和解码方面较慢。

pdf格式围兜
含噪并行数据的双单语交叉熵增量滤波
阿米泰·阿克塞尔罗德|阿尼什·库马尔|史蒂夫·斯洛托

我们引入了一种纯单语方法,在低资源场景中从噪声语料库中筛选并行数据。我们的工作受到Junczysdowmunt:2018的启发,但我们放宽了要求,以允许没有并行数据的情况。我们的主要贡献是根据Cynical数据选择Axelrod:2017修改的双单语交叉熵增量标准,当用于训练SMT系统时,该标准与最佳双语过滤方法具有竞争力(在1.8 BLEU内)。我们的方法是轻量级的,在一台标准笔记本电脑上三个小时就能端到端运行。

pdf格式围兜
NRC公司并行语料库过滤系统WMT公司2019
加布里埃尔·伯尼尔-科尔本|Chi kiu Lo公司

我们描述了加拿大国家研究委员会(National Research Council Canada)团队在第四届机器翻译会议上提交的并行语料库过滤任务。

pdf格式围兜
基于多语言句子嵌入的低资源语料库过滤
维什拉夫·乔杜里|余庆堂|弗朗西斯科·古兹曼|霍尔格·施文克|菲利普·科恩

在本文中,我们描述了我们提交给WMT19的低资源并行语料库过滤共享任务。我们的主要方法是基于LASER工具包(Language-Agnostic SEntence Representations),该工具包使用在并行语料库上训练的编码器-解码器体系结构来获得多语言句子表示。然后,我们直接使用这些表示来对有噪声的平行句进行评分和过滤,而无需额外训练评分函数。我们将我们的方法与其他有希望的方法进行了对比,并表明激光产生了很好的结果。最后,我们产生了不同评分方法的集合,并获得了额外的收益。与第二好的系统相比,我们的提交文件在尼泊尔英语和僧伽罗语-英语1M任务中分别取得了1.3和1.4 BLEU的最佳总体性能。此外,我们的实验表明,该技术在低资源甚至无资源场景中很有前景。

pdf格式围兜
质量和覆盖范围:AFRL公司提交给WMT公司19低资源条件任务的并行语料库过滤
格兰特·埃德曼|杰里米·格温努普

WMT19低资源条件下的并行语料库过滤任务旨在测试过滤有噪声的并行语料的各种方法,以使它们对机器翻译系统的训练有用。今年,嘈杂的语料库是尼泊尔语-英语和僧伽罗语-英语的相对低资源语言对。本文描述了空军研究实验室(AFRL)提交的文件,包括预处理方法和评分指标。数值结果表明,相对于基线的效益以及不同选项的相对效益。

pdf格式围兜
Webinterpret提交给WMT公司2019年并行语料库过滤共享任务
杰苏斯·冈萨雷斯-鲁比奥

本文描述了Webinterpret在第四届机器翻译会议(WMT 2019)上参与并行语料库过滤共享任务的情况。在这里,我们描述了我们的方法的主要特征,并讨论了在为共享任务发布的数据集上获得的结果。

pdf格式围兜
基于投影词嵌入的噪声并行语料库过滤
穆拉桑·库尔法尔(Murathan Kurfal)|罗伯特·奥斯汀

我们提出了一种非常简单的低资源语言并行文本清理方法,该方法基于在高资源语言的大型单语语料库上训练的单词嵌入的投影。尽管它很简单,但我们在下游机器翻译评估中采用了强基线系统。

pdf格式围兜
基于假设生成的噪声并行语料库过滤
祖扎纳·帕切塔|Germanán Sanchis-Trilles公司|弗朗西斯科·卡萨库贝塔

WMT2019中噪声并行语料库的过滤任务旨在挑战参与者创建有助于训练机器翻译系统的过滤方法。在这项工作中,我们介绍了一个基于翻译模型生成假设的噪声并行语料库过滤系统。我们使用提供的平行语料库训练两种语言对的翻译模型:尼泊尔语-英语和僧伽罗语-英语。我们使用双语交叉熵选择为三种语言对(尼泊尔语、僧伽罗语和印地语到英语)联合选择训练子集,以创建两种语言对的最佳可能翻译模型。一旦翻译模型被训练好,我们就会翻译噪声语料库,并为每个句子对生成一个假设。我们计算目标句子和生成假设之间的平滑BLEU分数。此外,我们还应用了一些规则来丢弃噪音过大或不恰当的句子,这些句子可能会降低翻译分数。这些启发式算法基于句子长度、源和目标相似性以及源语言检测。我们将结果与共享任务网站上发布的基线进行了比较,共享任务网站使用了Zipporah模型,在此基础上,我们对共享任务中的一个条件进行了显著改进。所设计的滤波系统是独立于域的,所有实验都是使用神经机器翻译进行的。

pdf格式围兜
基于模糊字符串匹配的并行语料库过滤
苏坎塔·森|阿西夫·埃克贝尔|普什巴克·巴塔查里亚

在本文中,我们描述了IIT Patna提交给WMT 2019的关于并行语料库过滤的共享任务。该共享任务要求参与者开发从给定的有噪声的并行语料中对每个并行句子进行评分的方法。评分方法的质量是根据SMT和NMT系统的质量来判断的,这些系统是根据从原始噪声语料库中子采样的一组较小的高质量平行句训练而成的。此任务有两个语言对。我们提交了尼泊尔语-英语和僧伽罗语-英语语言对。我们基于Levenshtein距离定义了英语和翻译成英语的源代码之间的模糊字符串匹配分数。基于分数,我们从每个平行语料库中抽取了两组平行句(分别有100万和500万英语标记),并仅为开发目的训练SMT系统。组织者使用SMT和NMT在最终官方测试集上发布官方评估。共有10支球队参与了这项共享任务,根据官方评估,我们的得分方法在100万尼泊尔英语高考和500万僧伽罗语英语高考的团队排名中获得第二位。

pdf格式围兜
这个单位大学H(H)埃尔辛基提交给WMT公司19并行语料库筛选任务
劳尔·瓦茨奎兹|乌穆特·苏鲁巴卡克|约格·蒂德曼

本文描述了赫尔辛基大学语言技术小组参与WMT 2019并行语料库过滤任务的情况。我们的分数是通过两步策略得出的。首先,我们单独应用了一系列过滤器来删除“质量差”的句子。然后,我们通过使用分类模型对这些特征进行加权,为每个句子生成分数。这种方法使我们能够构建一个简单可靠的系统,很容易适应其他语言对。