第三届机器翻译会议记录:共享任务文件

Ondřej Bojar公司,拉金·查特吉,克里斯蒂安·费德曼,马克·菲舍尔,伊维特·格雷厄姆,巴里·哈多,马蒂亚斯·哈克,安东尼奥·吉梅诺·耶佩斯,菲利普·科恩,克里斯托夫·蒙兹,马特奥·内格里,奥雷利·内维尔,玛丽亚娜·奈维斯,马特·波斯特,露西娅·斯佩西亚,马可·图尔奇,卡林·弗斯波尔 (编辑)


选集ID:
第18-64页
月份:
十月
年份:
2018
地址:
比利时、布鲁塞尔
地点:
WMT公司
SIG公司:
SIGMT公司
出版商:
计算语言学协会
网址:
https://aclantology.org/W18-64
内政部:
Bib导出格式:
BibTeX公司 MODS XML 尾注
PDF格式:
https://aclantology.org/W18-64.pdf

围兜
第三届机器翻译会议记录:共享任务文件
Ondřej Bojar公司|拉金·查特吉|克里斯蒂安·费德曼|马克·菲舍尔|伊维特·格雷厄姆|巴里·哈多|马蒂亚斯·哈克|安东尼奥·吉梅诺·耶佩斯|菲利普·科恩|克里斯托夫·蒙兹|马特奥·内格里|奥雷利·内维尔|玛丽亚娜·奈维斯|马特·波斯特|露西娅·斯佩西亚|马可·图尔奇|卡林·弗斯波尔

pdf格式围兜
2018年机器翻译会议成果(WMT公司18)
Ondřej Bojar公司|克里斯蒂安·费德曼|马克·菲舍尔|伊维特·格雷厄姆|巴里·哈多|马蒂亚斯·哈克|菲利普·科恩|克里斯托夫·蒙兹

本文介绍了2018年机器翻译会议(WMT)期间组织的首要共享任务的结果。参与者被要求为两个方向的7种语言对中的任何一种构建机器翻译系统,并在新闻故事测试集上进行评估。这项任务的主要衡量标准是人类对翻译质量的判断。今年,我们还向其他测试集开放了这项任务,以探索翻译的具体方面。

pdf格式围兜
关于多式联运机器翻译的第三项共享任务的研究结果
洛伊克·巴罗|费提·布加雷斯|露西娅·斯佩西亚|奇拉格·拉拉|德斯蒙德·埃利奥特|斯特拉·弗兰克

我们展示了第三个多模式机器翻译共享任务的结果。在本任务中,英语源句由图像补充,参与系统需要将此类句子翻译成德语、法语或捷克语。该图像可用于补充(或代替)源句。今年,这项任务又增加了第三种目标语言(捷克语)和新的测试集。此外,该任务的一个变体引入了自己的测试集,其中源句子以多种语言给出:英语、法语和德语,参与系统需要生成捷克语翻译。七个小组向这项任务的两个变体提交了45个不同的系统。与去年相比,多式联运提交的表现有所改善,但纯文本系统仍具有竞争力。

pdf格式围兜
调查结果WMT公司2018年生物医学翻译共享任务:评估M(M)edline测试集
玛丽亚娜·奈维斯|安东尼奥·吉梅诺·耶佩斯|奥雷利·内维尔|克里斯蒂安·格罗泽亚|艾米·萧|马德琳·基特纳|卡林·弗斯波尔

机器翻译可以在不同语言之间自动翻译文本文档,并且可以帮助非语言使用者访问仅以特定语言提供的信息,例如科学出版物中的研究结果。在本文中,我们概述了2018年机器翻译研讨会(WMT)上的生物医学翻译共享任务,该研讨会专门检查了生物医学文本机器翻译系统的性能。今年,我们提供了两个来源(EDP和Medline)的科学出版物测试集以及六种语言对(英语和汉语、法语、德语、葡萄牙语、罗马尼亚语和西班牙语)的测试集。我们描述了各种测试集的开发、我们收到的提交文件以及我们进行的评估。我们总共从六支球队获得39分,今年的BLEU分数有些高于去年,特别是对于使用生物医学资源或最先进的机器翻译算法(例如Transformer)的球队。最后,我们的手动评估得分高于德语和西班牙语的参考翻译。

pdf格式围兜
共享任务的机器翻译实证研究WMT公司18
朝北|郝宗|王一鸣|范宝勇|李世奇|聪湖苑

本文介绍了环球音讯有限公司提交的WMT18共享新闻翻译任务。我们参加了从英语到汉语的指导,在所有参与者中获得了最好的BLEU(43.8)分数。提交的系统侧重于数据清理和技术,以构建此任务的竞争模型。与其他参与者不同,提交的系统主要依靠数据过滤来获得最佳BLEU分数。我们不仅对提供的句子进行数据过滤,而且对回译的句子也进行数据过滤。我们应用于数据过滤的技术包括按规则过滤、语言模型和翻译模型。我们还进行了几个实验来验证训练技术的有效性。根据我们的实验,退火Adam优化函数和集成解码是模型训练中最有效的技术。

pdf格式围兜
稳健的parfda统计机器翻译结果
埃尔贡·比西奇

我们为翻译任务中的语言对建立了并行特征衰减算法(parfda)摩西统计机器翻译(SMT)模型。parfda获得的结果接近于基于顶部约束短语的SMT,在WMT 2017数据集上平均有2.252个BLEU点的差异,与使用所有可用语料库相比,用于构建SMT系统的计算量少得多。我们基于目标覆盖率获得BLEU上界,以确定哪些系统使用了附加数据。我们使用PRO进行调整,以减少结果和后处理翻译输出中的波动,从而减少由于单词大小写造成的翻译错误。F1在我们准备的英语到土耳其语测试套件中的关键短语得分显示,parfda取得了第二好的成绩。在评分前对翻译进行校正,总体上取得了最佳结果。

pdf格式围兜
这个滑石粉-通用产品代码机器翻译系统WMT公司18新闻共享翻译任务
Noe Casas公司|卡洛斯·埃斯科拉诺|Marta R.Costa-jussá|何塞·A·R·福诺洛萨

在本文中,我们描述了TALP-UPC研究小组参与WMT18多语种子目录中芬兰语-英语和爱沙尼亚语-英语的新闻共享翻译任务。我们所有的主要提交文件都实现了基于注意力的神经机器翻译体系结构。鉴于芬兰语和爱沙尼亚语属于同一语系且相似,我们将这两种语言对的数据集组合用作训练数据,以弥补每种语言对数据的匮乏。我们还报告了根据单个语言对数据训练的系统的翻译质量,以作为基线和比较参考。

pdf格式围兜
基于短语嵌入的无监督机器翻译
马克西姆·德尔|安德烈·塔塔|马克·菲舍尔

本文描述了塔尔图大学提交给WMT18新闻翻译共享任务的无监督机器翻译轨道。我们只使用单语数据为英-斯语言对的两个方向建立了几个基线翻译系统;这些系统属于基于短语的无监督机器翻译范式,我们在该范式中实验了短语长度高达3。作为主要贡献,我们进行了一组独立的实验,用合成短语嵌入代替短语作为单个词汇条目。结果表明,通过简单地对单个词向量进行求和,可以获得合理的n元向量,从而保持或改进基于短语的无监督机器翻译系统的性能,同时避免了原子短语向量的局限性。

pdf格式围兜
A类libaba的神经机器翻译系统WMT公司18
邓永超|程善波(Shanbo Cheng)|陆军|宋凯(Kai Song)|王金刚(Jingang Wang)|吴胜兰|梁瑶|张古春|张海波|张培(音译)|朱长丰|陈拳击

本文描述了阿里巴巴为WMT18共享新闻翻译任务提供的提交系统。我们参与了包括英语在内的5个翻译方向俄语、英语双向土耳其语和英语中国人。我们的系统基于谷歌的Transformer模型架构,我们将学术研究的最新功能集成到其中。我们还采用了在过去WMT年中被证明有效的大多数技术,如BPE、反译、数据选择、模型集成和工业规模的重新分级。对于一些形态丰富的语言,我们还将语言知识纳入我们的神经网络。对于我们参与的翻译任务,我们得到的系统在所有5个方向上都取得了最佳的区分大小写的BLEU分数。值得注意的是,我们的英语俄罗斯系统的BLEU得分比第二个重新排名的系统高出5分。

pdf格式围兜
这个RWTH(跑道) A类瘦果U型大学E类英语-G公司erman和G公司埃尔曼-E类英语无监督神经机器翻译系统WMT公司2018
米盖尔·格拉萨|金云素(Yunsu Kim)|朱利安·夏佩尔|耿嘉惠|赫尔曼·奈伊

本文描述了亚琛工业大学(RWTH Aachen University)为英语开发的无监督神经机器翻译(NMT)系统德国新闻翻译任务EMNLP 2018第三届机器翻译会议(WMT 2018)。我们的工作基于使用共享编码器-解码器NMT模型的迭代回译。我们对模型的不同词汇类型、单词嵌入初始化方案和优化方法进行了广泛的比较。我们还研究了单词嵌入层的选通和权重规范化。

pdf格式围兜
用于多语言神经翻译的认知软件形态分割
Stig Arne Grönroos公司|萨米·维皮奥亚|Mikko Kurimo先生

本文描述了阿尔托大学WMT18新闻翻译共享任务的条目。我们参与了多语言子跟踪,在受限条件下培训了一个系统,可以将英语翻译成芬兰语和爱沙尼亚语。该系统基于变压器模型。我们致力于提高拼写、语义和分布相似的单词的形态切分的一致性;这些词包括词源同源词、外来词和专有名词。为此,我们引入了Cognate Morfessor,这是Morfesso方法的一种多语言变体。我们表明,我们的方法提高了翻译质量,尤其是爱沙尼亚语的翻译质量,爱沙尼亚人用于培训翻译模式的资源较少。

pdf格式围兜
这个AFRL公司 WMT公司18个系统:集成、延续和组合
杰瑞米·格温努普|蒂姆·安德森|格兰特·埃德曼|郑珣

本文描述了空军研究实验室(AFRL)的机器翻译系统以及在WMT18评估活动期间开发的改进。今年,我们检查了流行的神经机器翻译工具包的开发和添加,并测量了俄语-英语语言对的性能改进。

pdf格式围兜
这个U型大学E类丁堡向WMT公司18新闻翻译任务
巴里·哈多|尼古拉·博戈伊切夫|丹尼斯·埃梅林|乌尔里希·格尔曼|罗曼·格兰基维奇|肯尼思·希菲尔德|安东尼奥·瓦莱里奥·米切利·巴龙|里科·森里奇

爱丁堡大学在新闻翻译任务中向所有14种语言对提交了材料,大多数语言对表现出色。我们介绍了新的RNN变体、混合RNN/Transformer集成、数据选择和加权,以及对反向翻译的扩展。

pdf格式围兜
恩森特F类研发神经机器翻译WMT公司18
胡伯杰|Ambyer Han先生|沈煌(Shen Huang)

本文描述了TencentFmRD中文神经机器翻译(NMT)系统Vus=====================================================2018年WMT英语新闻翻译任务。我们的系统是使用我们的原始系统TenTrans训练的神经机器翻译系统。TenTrans是基于变压器自关注机制的改进NMT系统。除了Transformer训练的基本设置外,TenTrans还使用了多模型融合技术、多特征重新排序、不同的分割模型和联合学习。最后,我们采用一些数据选择策略对训练后的系统进行微调,以实现稳定的性能改进。我们的中国人在所有WMT18提交的系统中,英语系统的BLEU分数排名第二,最佳案例BLEU得分排名第四。

pdf格式围兜
这个MLLP公司-UPV公司 G公司埃尔曼-E类英语机器翻译系统WMT公司18
哈维尔·伊兰佐·桑切斯|Pau Baquero-Arnal公司|戈纳尔·加塞斯·迪亚斯·穆尼奥|阿德里亚·马丁内斯·维拉隆加|豪尔赫·西维拉|阿尔芬斯·胡安

本文描述了由瓦伦西亚政治大学MLLP研究小组为德语构建的统计机器翻译系统英语新闻翻译分享了EMNLP 2018第三届机器翻译会议(WMT18)的任务。我们使用了一套基于Transformer架构的神经机器翻译系统。为了在“受限”条件下训练我们的系统,我们使用基于字符的语言模型的评分技术过滤了提供的并行数据,并基于从提供的单语语料库生成的合成源句子添加了并行数据。

pdf格式围兜
M(M)微软向WMT公司2018年新闻翻译任务:如何翻译学会停止担忧,热爱数据
马金·朱奇斯·道蒙特

本文介绍了微软提交给WMT2018的新闻翻译共享任务。我们参加了一个语言方向——英语-德语。我们的系统遵循当前的最佳实践,将最先进的模型与新的数据过滤(双条件交叉熵过滤)和句子加权方法相结合。我们使用爱丁堡WMT2017培训方案的更新版本培训了相当标准的Transformer-bigh模型,并对Paracroble的不同过滤方案进行了试验。根据自动指标(BLEU),我们在该子任务中取得了最高分数,与次强系统相比,BLEU分数差近2分。根据人类评估,我们在受限系统中排名第一。我们认为这主要是由我们的数据过滤/加权制度造成的。

pdf格式围兜
CUNI公司提交内容WMT公司18
汤姆·科米|罗曼·苏达里科夫|Ondřej博贾

我们以三种语言对参与了WMT 2018共享新闻翻译任务:英语-波斯尼亚语、英语-法语和英语-捷克语。我们的主要关注点是爱沙尼亚语和英语这对资源较少的语言,为此我们以一种简单的方法使用了芬兰语的平行数据。我们首先为高资源语言对训练一个“父模型”,然后对相关的低资源语言对进行自适应。与仅基于爱沙尼亚-英语平行数据训练的基线系统相比,这种方法大大提高了性能。我们的系统基于Transformer架构。对于英语到捷克语的翻译,我们评估了去年基于短语的混合方法和神经机器翻译的模型,主要是为了进行比较。

pdf格式围兜
这个JHU公司机器翻译系统WMT公司2018
菲利普·科恩|杜凯文(Kevin Duh)|布赖恩·汤普森

我们报道了约翰·霍普金斯大学为2018年机器翻译会议(WMT)期间组织的新闻翻译共享任务开发神经机器翻译系统所做的努力。我们开发了德语-英语、英语-德语和俄语-英语系统。我们的新贡献是对前几年的测试集进行迭代反译和微调。

pdf格式围兜
JUCBNMT公司WMT公司2018年新闻翻译任务:基于字符的神经机器翻译F类天生的E类英语
赛尼克·库马尔·马哈塔|迪班卡Das|锡瓦吉·班迪奥帕提亚

在当前的工作中,我们描述了提交给WMT 2018新闻翻译共享任务的系统。创建该系统是为了将新闻文本从芬兰语翻译成英语。该系统使用基于字符的神经机器翻译模型来完成给定的任务。当前的论文记录了预处理步骤、提交系统的描述以及使用该系统生成的结果。我们的系统获得了12.9分的BLEU分数。

pdf格式围兜
NICT公司的神经和统计机器翻译系统WMT公司18新闻翻译任务
本杰明·玛丽|王瑞(Rui Wang)|藤田松树|Masao Utiyama公司|住田英一郎

本文介绍了NICT参与WMT18共享新闻翻译任务的情况。我们参与了四对语言的八个翻译方向:爱沙尼亚英语、芬兰英语、土耳其英语和中国英语。对于每个翻译方向,我们都准备了最先进的统计(SMT)和神经(NMT)机器翻译系统。我们的NMT系统是使用transformer架构进行训练的,使用的是提供的并行数据,这些数据被我们用新的增量训练框架生成的大量反译单语数据放大。我们提交给任务的主要内容是SMT和NMT系统的简单组合。根据BLEU-cased,我们的系统在爱沙尼亚-英语和芬兰语-英语语言对(约束)方面排名第一。

pdf格式围兜
促销用于的系统WMT公司2018年共享翻译任务
亚历山大·莫尔恰诺夫

本文描述了为WMT 2018共享新闻翻译任务提交的PROMT。今年我们只参加了英语-俄语组合。我们构建了两个主要的基于神经网络的系统:1)基于纯Marian的神经系统和2)将基于OpenNMT的神经后编辑组件集成到RBMT引擎中的混合系统。我们还提交了纯基于规则的翻译(RBMT)进行对比。我们展示了两份主要提交文件的竞争结果,这两份文件明显优于RBMT基准。

pdf格式围兜
NTT公司的神经机器翻译系统WMT公司2018
森田真本|铃木骏|长田正树

本文描述了NTT提交给WMT 2018英语-德语和德语-英语新闻翻译任务的神经机器翻译系统。我们的提交文件有三个主要组成部分:Transformer模型、语料库清理和从右向左的n最佳重新分类技术。通过我们的实验,我们确定了两个提高准确性的关键:过滤噪声训练句子和从右向左重新排序。我们还发现Transformer模型比基于RNN的模型需要更多的训练数据,并且当语料库较小时,基于RNN模型有时比Transformer模式获得更好的准确性。

pdf格式围兜
卡尔斯鲁厄科技系统研究所负责新闻翻译任务WMT公司2018
Ngoc-Quan Pham公司|扬·尼胡斯|亚历山大·威贝尔

我们在2018年WMT的新闻翻译任务范围内进行了实验,方向是:英语德语。我们系统的核心是使用变压器架构的基于编解码的神经机器翻译模型。我们用更深层的架构增强了模型。通过使用技术限制内存消耗,我们能够在一个GPU上训练4倍大的模型,并将性能提高1.2 BLEU点。此外,我们对新获得的ParaCrawl语料库进行了句子选择。因此,我们可以将语料库的有效性提高0.5 BLEU点。

pdf格式围兜
Tilde的机器翻译系统WMT公司2018
马尔西斯·平尼斯|马蒂斯游击队|里哈德斯·克里什劳克斯

本文描述了Tilde为2018年WMT新闻翻译共享任务提交的NMT系统的开发过程。我们描述了数据过滤和预处理工作流、NMT系统训练体系结构和自动评估结果。对于WMT 2018共享任务,我们提交了七个英语-波斯尼亚语和爱沙尼亚-英语翻译方向系统(包括受限和非受限)。提交的系统使用Transformer模型进行培训。

pdf格式围兜
CUNI公司变压器神经网络机器翻译的系统WMT公司18
马丁·波普尔

我们描述了我们的NMT系统在新闻翻译中提交给WMT2018共享任务。我们的系统基于变压器模型(Vaswani等人,2017)。我们使用了一种改进的反翻译技术,即在一个方向上迭代翻译单语数据的过程,并使用合成并行数据在相反方向上训练NMT模型。我们对合成数据进行了简单但有效的过滤。我们使用共指消解法对输入句子进行预处理,以消除未删减人称代词的性别歧义。最后,我们对翻译后的输出应用两个简单的后处理替换。在WMT2018中,我们的系统明显优于所有其他英语-捷克语和捷克-英语系统(p<0.05)。

pdf格式围兜
这个U型大学H(H)埃尔辛基提交给WMT公司18新闻任务
亚历山德罗·拉加纳托|伊夫·谢勒|托米·尼米宁|阿维·赫尔斯卡宁|约格·蒂德曼

本文描述了赫尔辛基大学提交给WMT18英语-法语和英语-波斯尼亚语共享新闻翻译任务的两个方面。今年,我们的主要提交材料采用了一种新的神经体系结构,即Transformer,它使用开源OpenNMT框架。我们的实验将领域标记和微调的多语言模型与源语言和目标语言之间的共享词汇结合起来,使用共享任务提供的并行数据和额外的反向翻译。最后,我们从基于规则的方法到我们的最佳神经模型,比较了不同机器翻译架构在英芬兰语翻译中的有效性,分析了输出并强调了未来的研究。

pdf格式围兜
这个RWTH(跑道) A类瘦果U型大学监控的机器翻译系统WMT公司2018
朱利安·夏佩尔|简·罗森达尔|巴哈尔公园|金云素(Yunsu Kim)|阿诺·尼克斯|赫尔曼·奈伊

本文描述了RWTH亚琛大学为德语开发的统计机器翻译系统英语,英语土耳其语和汉语2018年EMNLP第三届机器翻译会议(WMT 2018)的英语翻译任务。我们使用基于Transformer架构的神经机器翻译系统集成。我们主要关注的是德国人英语任务中,我们将根据组织者提供的衡量标准自动首先得分。我们将数据选择、微调、批量大小和模型维数确定为重要的超参数。总的来说,我们比去年提交的报告提高了6.8%的BLEU,比2017年德国的获胜系统提高了4.8%英语任务。英语土耳其任务,我们显示BLEU比去年的获胜系统提高了3.6%。我们进一步报告了中国的结果英语任务中,我们在基线系统上平均提高了2.2%的BLEU,但仍落后于2018年的获胜系统。

pdf格式围兜
这个U型大学C类安布里奇机器翻译系统WMT公司18
费利克斯·斯塔尔伯格|阿德里·德吉斯佩特|比尔·伯恩

剑桥大学提交给WMT18新闻翻译任务的材料侧重于多种翻译模式的结合。我们比较了德语-英语、英语-德语和汉语-英语的递归、卷积和基于自我注意的神经模型。我们的最终系统将所有神经模型与基于短语的SMT系统结合在一个基于MBR的方案中。我们报告称,在强大的Transformer信号群之上,我们取得了微小但持续的收益。

pdf格式围兜
这个线性矩阵单元 M(M)unich无监督机器翻译系统
达里奥·斯托亚诺夫斯基|维克托·汉加|马蒂亚斯·哈克|亚历山大·弗雷泽

我们描述了LMU慕尼黑的无监督英语机器翻译系统Vus=====================================================德语翻译。这些系统用于参与WMT18新闻翻译共享任务,更具体地说,用于无监督学习子轨道。这些系统仅针对英语和德语单语数据进行训练,并利用和结合了先前提出的技术,例如使用基于双语单词嵌入的逐字翻译数据、去噪和实时反译。

pdf格式围兜
腾讯神经机器翻译系统WMT公司18
王明轩|李功|朱文欢|谢军(Jun Xie)|超边

我们参加了WMT2018关于英语的共享新闻翻译任务Vus=====================================================中文配对。我们的系统基于注意序列到序列模型,具有某种形式的递归和自我注意。为了提高翻译性能,还引入了一些数据增强方法。采用集成和重排技术可以获得最佳的翻译效果。我们的中国人英语系统在所有16个提交的系统中取得了最高的案例BLEU分数,我们的英语在提交的18个系统中,中国系统排名第三。

pdf格式围兜
这个N个国际单位rans机器翻译系统WMT公司18
王强(Qiang Wang)|贝莉|刘继强|Bojian Jiang博士|Zheyang Zhang(张哲阳)|李银桥|叶琳|童晓|朱晶波

本文描述了为WMT 2018中文提交的牛Trans神经机器翻译系统英语新闻翻译任务。我们的基线系统基于Transformer架构。我们从四个方面进一步提高了翻译性能2.4-2.6 BLEU点,包括架构改进、多样的集成解码、重新存储和后处理。在受限提交中,我们在提交的16个中文系统中排名第二英语任务,英语16人中排名第三中文任务。

pdf格式围兜
这个U型大学M(M)雅利兰的C类中文-E类nglish神经机器翻译系统WMT公司18
徐伟佳|海洋木瓜

本文描述了马里兰大学提交给WMT 2018中文版的文件Vus=====================================================英语新闻翻译任务。我们的系统是基于BPE的自注意变压器网络,具有并行和反向翻译的单语训练数据。使用集合和重新排序,我们在变压器基线上提高了+1.4 BLEU(中文)英语和+3.97 BLEU(英语)中文打开2017年新闻测试.我们的最佳系统在中国人中达到了24.4分的BLEU分数英语39.0上的中文2018年新闻测试.

pdf格式围兜
E类val值D类无参照语篇评价WMT公司18
Ondřej Bojar公司|基米罗夫斯克|Kateřina Rysová|玛格达琳娜·里索娃

我们给出了使用EVALD工具对机器翻译(MT)输出中的语篇进行自动评估的结果。EVALD最初的设计和培训是为了评估人类写作,适合母语人士和外语学习者。机器翻译在句子层面上的翻译质量有了巨大的飞跃,因此,很有意思的是,人本评估是否变得相关。

pdf格式围兜
这个WMT公司'18睡眠测试套件E类英语-C类泽克,E类英语-G公司埃尔曼,E类英语-F类天生的和土耳其语-E类英语
弗兰克·伯洛|伊夫·谢勒|维尼特·拉维桑卡|Ondřej Bojar公司|斯蒂格·阿恩·格伦罗斯|Maarit Koponen公司|托米·尼米宁|弗朗索瓦·伊冯

机器翻译输出质量的进步需要新的自动评估程序和指标。在本文中,我们将Burlot和Yvon(2017)为英-捷克语和英-拉脱维亚语翻译指南引入的语素协议扩展到三个额外的语言对,并报告了其用于分析WMT 2018参与者对这些语言对的结果。考虑到额外的、类型多样的源语言和目标语言,我们也可以对这种面向形态学的评估程序进行一些概括。

pdf格式围兜
上的测试套件C类扎克–E类英语语法对比
西尔维·辛科娃|Ondřej Bojar公司

在WMT18新闻翻译任务中,我们对捷克语和英语的语法对比进行了机器翻译的初步研究。对于每一种现象,我们都会进行专门的测试,检查候选译文是否如预期的那样表达了这种现象。所建议的分析类型并不是严格意义上的评估,因为这种现象可以用多种方式正确地翻译,我们预计只有一种。然而有趣的是,各种机器翻译系统和单一参考翻译在处理给定现象的总体趋势上的差异。

pdf格式围兜
代词测试套件评估E类英语–G公司埃尔曼机器翻译系统位于WMT公司2018
丽安·吉洛(Liane Guillou)|克里斯蒂安·哈德迈耶|叶卡捷琳娜·拉普希诺娃-加尔顿斯基|谢里德·洛艾西加

我们评估了16个英语到德语机器翻译系统在2018年WMT比赛中代词翻译方面的输出。我们使用一个专门设计的测试套件来评估已知存在问题的各种细粒度类别中的系统质量。主要的评估分数来自一个半自动过程,将自动参考匹配与不确定案例的大量手动注释结合起来。我们发现,目前的NMT系统能够很好地翻译带有语义内指代的代词,但语义间的情况仍然很困难。NMT系统也擅长事件代词的翻译,这与基于短语的SMT范式的系统不同。没有哪一个系统在翻译所有类型的回指代词方面表现得最好,这表明无法解释的随机效应会影响NMT代词的翻译。

pdf格式围兜
细粒度评估G公司埃尔曼-E类基于测试套件的英语机器翻译
费雯·麦肯坦兹(Vivien Macketanz)|Avramidis介|阿尔乔沙·伯查特|汉斯·尤兹克莱特

我们基于语言驱动测试套件,对16个最先进的德语-英语机器翻译系统进行了分析。测试套件由语言专业人员团队手动设计,以涵盖机器翻译通常无法正确翻译的各种语言现象。它包含5000个测试句子,涵盖14类106种语言现象,重点关注动词时态、体和语气。机器翻译输出通过正则表达式以半自动的方式进行评估,正则表达式只关注句子中与每个现象相关的部分。通过我们的分析,我们能够根据系统在这些类别上的性能对其进行比较。此外,我们揭示了特定系统的优缺点,并发现了机器翻译整体表现相对较低的语法现象。

pdf格式围兜
词义消歧测试套件WMT公司18
安妮特·里奥斯|马蒂亚斯·米勒|里科·森里奇

我们提出了一个任务来衡量机器翻译系统根据给定上下文翻译歧义词的能力。该任务基于德语-英语词义消歧(WSD)测试集ContraWSD(Rios Gonzales et al.,2017),但已对其进行过滤以减少噪音,并且已对评估进行调整,以直接评估机器翻译输出,而不是对现有翻译进行评分。我们评估了WMT’18共享翻译任务的所有德语-英语提交文件,以及前几年的一些提交文件,发现与2016年WMT提交的文件相比,任务表现有了显著改善(81%WSD任务的准确率为93%)。我们还发现,未经监督的任务提交具有较低的WSD能力,并且主要翻译具有相同含义的歧义源词。

pdf格式围兜
-CVC公司提交文件WMT公司18多式翻译任务
奥赞·卡拉扬|阿德里安·巴德特|费提·布加雷斯|洛伊克·巴罗|王凯(Kai Wang)|马克·马萨纳|路易斯·赫兰兹|Joost van de Weijer公司

本文描述了LIUM和CVC为WMT18多模态翻译共享任务开发的多模态神经机器翻译系统。今年,我们对之前的多模态注意架构提出了几项修改,以便更好地集成卷积特征,并使用编码器侧信息对其进行细化。我们最终提交的限制性文件在英语方面排名第一法语,英语第二根据自动评估指标METEOR,受限提交中的德语对。

pdf格式围兜
这个M(M)e(电子)摩洛哥迪拉姆提交给WMT公司18多式翻译任务
斯蒂格·阿恩·格伦罗斯|贝诺伊特·休特|米科·库里莫|Jorma Laaksonen公司|伯纳德·梅里亚尔多|Phu Pham公司|Mats Sjöberg公司|乌穆特·苏鲁巴卡克|约格·蒂德曼|拉斐尔·特朗西|劳尔·瓦茨奎兹

本文描述了WMT多模态机器翻译共享任务的MeMAD项目入口。我们建议将Transformer神经机器翻译(NMT)架构应用于多模式设置。在本文中,我们还描述了使用纯文本翻译系统进行的初步实验,从而实现了这一选择。根据flickr18的自动评分标准,我们拥有最高的英语对德语和英语对法语评分系统。我们的实验表明,视觉特征在我们的系统中的影响很小。我们最大的收益来自底层纯文本NMT系统的质量。我们发现适当使用额外数据是有效的。

pdf格式围兜
这个AFRL公司-O(运行)hio(基奥)S公司塔特WMT公司18多式联运系统:视觉与传统相结合
杰里米·格温努普|约书亚·桑维克|迈克尔·赫特|格兰特·埃德曼|约翰·杜塞利斯|詹姆斯·戴维斯

AFRL-Ohio State扩展了可视域驱动机器翻译的使用,将其用作传统机器翻译系统的对等。作为对等,它被封装在神经和统计机器翻译系统的系统组合中,以呈现复合翻译。

pdf格式围兜
CUNI公司系统WMT公司18多式翻译任务
Jindřich Helcl公司|利波维奇|杜珊·瓦里什

我们将提交给WMT18多式翻译任务。我们提交的报告的主要特点是应用了一个自关注网络而不是递归神经网络。我们评估了两种将视觉特征纳入模型的方法:首先,我们将图像表示作为网络的另一个输入;其次,我们训练模型来预测视觉特征并将其用作辅助目标。对于我们的提交,我们获得了文本和多模态附加数据。与递归网络和自关注文本基线相比,这两种方法都有显著的改进。

pdf格式围兜
S公司heffield提交WMT公司18多模态翻译共享任务
Chiraag拉拉|Pranava Swaroop中央医院|卡罗琳娜·斯卡顿|露西娅·斯佩西亚

本文介绍了谢菲尔德大学提交的WMT18多模式机器翻译共享任务。我们参与了任务1和1b。对于任务1,我们构建了一个标准的基于序列到序列注意的神经机器翻译系统(NMT),并研究了多模态重新排序方法的实用性。更具体地说,使用新的多模式跨语言词义消歧模型对该系统中的n个最佳候选翻译进行重新分类。对于任务1b,我们探索了三种方法:(i)基于跨语言词义消歧的重新分类(对于任务1),(ii)基于来自德语-捷克、法语-捷克和英语-捷克系统的NMT n最佳列表共识的重新分类,以及(iii)通过法语到英语和德语到英语的机器翻译,生成英语源数据,然后使用多模式再记录器进行假设选择,从而增强数据。

pdf格式围兜
多模态集成序列级训练机器翻译:OSU(操作系统单元)-B类艾杜WMT公司18多模机器翻译系统报告
郑仁杰|杨依林|马明波|梁晃

本文描述了俄勒冈州州立大学和百度研究中心为WMT 2018多模态翻译共享任务联合开发的多模态机器翻译系统。在本文中,我们介绍了一种通过向解码器侧提供图像特征来合并图像信息的简单方法。我们还探索了不同的序列级训练方法,包括预定抽样和强化学习,这些都会带来实质性的改进。我们的系统使用不同的体系结构和训练方法集成了多个模型,并在三个子任务(任务1中的En-De和En-Cs以及任务1B中的(En+De+Fr)-Cs)中实现了最佳性能。

pdf格式围兜
生物医学文献的翻译S公司泛型的-E类英语
米雷拉·斯泰法尼亚杜马|沃尔夫冈·门泽尔

对于WMT 2018的翻译生物医学领域相关文档的共享任务,我们开发了一个评分公式,该公式使用简单有效的加权术语频率方法,并集成在数据选择管道中。该方法应用于五种语言对,在葡萄牙语-英语上表现最好,BLEU得分为41.84,在三家机构提交的七分中排名第三。在本文中,我们描述了我们的方法和结果,并将其与最先进的方法进行了比较。我们对该任务的贡献在于引入了一种快速、无监督的方法,用于为训练模型选择特定领域的数据,这些模型仅使用10%的一般领域数据即可获得良好的结果。

pdf格式围兜
自动选择最佳翻译的翻译人员组合——提交福克斯WMT公司18生物医学翻译任务-
克里斯蒂安·格罗泽亚

本文描述了用于WMT 2018生物医学翻译任务的弗劳恩霍夫FOKUS系统。这里描述的方法是从NMT(Transformer)模型生成的候选集中自动选择最有希望的翻译。我们通过使用字典、词干分析和一组启发法,选择了每个句子的最高保真度翻译。我们的方法很简单,可以使用任何机器翻译器,除了已经用于构建NMT模型之外,不需要进一步的培训。缺点是分数没有超过最佳组合,但非常接近(相差约0.5 BLEU)。

pdf格式围兜
线性矩阵单元 M(M)unich的神经机器翻译系统WMT公司2018
马蒂亚斯·哈克|达里奥·斯托亚诺夫斯基|维克托·汉加|亚历山大·弗雷泽

我们为英语-德语对提供LMU慕尼黑机器翻译系统。我们已经为两个翻译方向(英语)建立了神经机器翻译系统德语和德语英语)和两个不同的领域(生物医学领域和新闻领域)。这些系统用于我们参与WMT18生物医学翻译任务和新闻机器翻译共享任务。我们最近的系统开发工作的主要重点是在去年强大的英语生物医学翻译引擎的基础上,在生物医学领域实现改进德语(Huck等人,2017a)。我们在本文中报告的后一项任务取得了相当大的进展。

pdf格式围兜
亨特神经网络机器翻译的系统WMT公司18生物医学翻译任务:神经机器翻译中的迁移学习
阿卜杜勒·汗|Subhadarshi熊猫|贾旭|Lampros弗洛卡斯

本文描述了Hunter Neural Machine Translation(NMT)提交给WMT’18生物医学英语到法语翻译任务的情况。训练数据和测试数据分布之间的差异给新领域的文本翻译带来了挑战。除了之前将域内模型与域外模型相结合的工作外,我们还发现在组合不同的域内模型时可以提高准确性和效率。我们对NMT进行了大量实验迁移学习我们一个接一个地在不同的域内生物医学数据集上进行训练。这意味着前一个训练的参数将作为下一个训练参数的初始化。再加上预先训练的域外新闻模型,我们在基线上提高了3.73 BLEU点的翻译质量。此外,我们将集成学习应用于中间时段的训练模型,比基线提高了4.02个BLEU点。总的来说,我们的系统比去年EDP 2017测试集上的最佳系统高11.29个BLEU点。

pdf格式围兜
UFRGS公司参与WMT公司生物医学翻译共享任务
菲利佩·索尔斯|卡林·贝克尔

本文描述了南里奥格兰德联邦大学(UFRGS)团队为生物医学翻译共享任务开发的机器翻译系统。我们的系统基于统计机器翻译和神经机器翻译,分别使用Moses和OpenNMT工具包。我们参与了英语/西班牙语和英语/葡萄牙语配对的四个翻译方向。为了创建我们的训练数据,我们连接了几个并行语料库,包括域内和域外源,以及UMLS中的术语资源。根据官方共享任务评估,我们的系统获得了最佳的BLEU分数。

pdf格式围兜
基于变换器和多源的神经机器翻译R(右)生物医学的浪漫语言WMT公司2018年任务
布莱恩·图贝|Marta R.Costa-jussá

Transformer体系结构已成为机器翻译领域的最先进技术。该模型依赖于基于注意的机制,在多个任务中优于以前的神经机器翻译架构。在本系统描述文件中,我们报告了利用Transformer模型和生物医学WMT 2018任务的评估框架,使用多源Romance语言训练神经机器翻译的详细信息。使用来自同一系列的多源语言可以提高超过6个BLEU点。

pdf格式围兜
的结果WMT公司18指标共享任务:字符和嵌入都获得了良好的性能
马庆松|Ondřej Bojar公司|伊维特·格雷厄姆

本文介绍了WMT18度量共享任务的结果。我们要求该任务的参与者使用自动指标对WMT18新闻翻译任务中涉及的机器翻译系统的输出进行评分。我们收集了10个指标和8个研究小组的得分。除此之外,我们还计算了8个标准指标(BLEU、SentBLUE、chrF、NIST、WER、PER、TER和CDER)的分数作为基线。收集的分数根据系统级相关性(每个指标的分数与WMT18官方手册系统排名的相关性如何)和分段级相关性(指标与人类在判断特定句子相对于替代输出的质量时的一致性频率)进行评估。今年,我们采用了一种单一的人工评估:直接评估(DA)。

pdf格式围兜
调查结果WMT公司2018年质量评估共享任务
露西娅·斯佩西亚|弗雷德里克·布莱恩|瓦瓦拉·洛加切娃|拉蒙·阿斯图迪略|安德烈·F·T·马丁斯

我们报告了WMT18质量评估共享任务的结果,即在不同粒度级别(单词、短语、句子和文档)预测机器翻译系统输出质量的任务。今年我们包括四种语言对、三个文本域以及统计和神经机器翻译系统生成的翻译。来自十个机构的参与团队提交了针对不同任务变体和语言对的各种系统。

pdf格式围兜
调查结果WMT公司2018年自动后期编辑共享任务
拉金·查特吉|马特奥·内格里|拉斐尔·鲁比诺|马可·图尔奇

我们展示了第四轮关于MT自动后期编辑的WMT共享任务的结果。该任务包括通过学习人工更正,自动更正“黑盒”机器翻译系统的输出。与前三轮的总体评估设置相同,今年我们专注于一种语言对(英语-德语)和特定领域的数据(信息技术),MT输出由两种不同的范式产生:基于短语的(PBSMT)和神经的(NMT)。五个团队分别为PBSMT子任务提交了11次运行,为NMT子任务提供了10次运行。在前一个子任务中,以低质量的原始翻译为特征,顶级结果取得了令人印象深刻的改进,比基线高出6.24 TER和+9.53 BLEU分”不做任何事“系统。NMT子任务被证明更具挑战性,因为原始翻译的质量更高,可用的训练数据更少。在这种情况下,顶部结果显示,改善较小,达到-0.38 TER和+0.8 BLEU点。

pdf格式围兜
调查结果WMT公司2018年并行语料库过滤共享任务
菲利普·科恩|Huda Khayrallah公司|肯尼思·希菲尔德|米克尔·L·福卡达

我们提出了一个共享任务,即为从web上抓取的噪音很大的句子对语料库分配句子级质量分数,目标是再选择1%和10%的高质量数据用于训练机器翻译系统。来自公司、国家研究实验室和大学的17名参与者参与了这项任务。

pdf格式围兜
M(M)eteor++:将复制知识纳入机器翻译评估
郭一诺|崇阮|胡俊峰

在机器翻译评估中,一个好的候选翻译可以被视为对参考文献的改写。我们注意到有些单词在改写时总是被复制,我们称之为复制知识考虑到这些知识的稳定性,一个好的候选翻译应该包含参考句子中出现的所有单词。因此,在参与WMT’2018度量共享任务时,我们引入了一种简单的统计方法来提取复制知识,并将其纳入Meteor度量,从而产生了一种新的机器翻译度量流量计++我们的实验表明,Meteor++能够很好地集成复制知识,并显著提高WMT17和WMT15评估集的性能。

pdf格式围兜
ITER公司:通过优化编辑成本提高翻译编辑率
Joybrata Panja公司|苏迪普·库马尔·纳斯卡

本文介绍了我们参与WMT 2018指标共享任务的情况。我们提出了一个改进版本的翻译编辑/错误率(TER)。除了在TER中包括基本的编辑操作,即插入、删除、替换和移位,我们的度量还允许词干匹配、优化编辑成本和更好的规范化,以便与人类的判断分数更好地关联。与TER相比,该指标与人类判断的相关性更高。

pdf格式围兜
诡计:使用句子嵌入进行自动机器翻译评估的回归器
岛中弘|Tomoyuki Kajiwara公司|马莫鲁·科马奇

我们为WMT18度量共享任务引入RUSE度量。句子嵌入可以捕获基于字符或单词N元的局部特征无法捕获的全局信息。虽然使用具有手动评估功能的小规模翻译数据集训练句子嵌入很困难,但在其他任务中使用大规模数据训练句子嵌入可以改进机器翻译的自动评估。我们使用基于三种句子嵌入的多层感知器回归器。WMT16和WMT17数据集的实验结果表明,RUSE度量在仅具有嵌入功能的段级和系统级度量任务中都达到了最先进的性能。

pdf格式围兜
保留或不保留:用于后期编辑的单词级质量评估
普拉森吉特·巴苏|桑塔努·帕尔|苏迪普·库马尔·纳斯卡

本文介绍了我们参与WMT 2018机器翻译文本单词级质量评估(QE)共享任务的情况,即预测机器翻译文本输出中给定源上下文的单词是否正确翻译,因此是否应保留在编辑后翻译(PE)中。为了执行QE任务,我们测量目标机器翻译单词的源上下文与训练数据中PE中保留单词的上下文的相似性。这可以通过两种不同的方式实现,使用单词包(工程量清单)模型和文档到矢量(文件2Vec)模型。工程量清单模型中,我们计算余弦相似性,而在文件2Vec我们考虑Doc2Vec相似性的模型。通过在F1multvs.相似度得分图上应用Kneedle算法,我们导出了对MT单词进行OK/BAD决策所依据的阈值。实验结果表明,Doc2Vec模型在单词级QE任务上的表现优于BoW模型。

pdf格式围兜
RTM公司预测翻译性能的结果
埃尔贡·比西奇

通过基于训练性能和堆叠使用权重的改进预测组合和多层感知器构建更深入的预测模型,RTM成为句子级翻译分数预测的第三个系统,并在英语到德语的NMT QET结果中达到最低RMSE。对于文档级任务,我们将文档级RTM模型与通过文档句子串联获得的句子级RTM模式进行了比较,并获得了类似的结果。

pdf格式围兜
神经机器翻译E类英语-阿米尔
希曼舒·乔达里|阿迪蒂亚·库马尔·帕塔克|拉吉夫·拉坦·萨哈|蓬努兰加姆·库马拉古鲁

网络上有大量有价值的英语资源,这些资源通常被翻译成当地语言,以促进不太熟悉英语的当地人之间的知识共享。然而,手动翻译这些内容是一个非常繁琐、昂贵和耗时的过程。为此,机器翻译是一种有效的文本翻译方法,无需任何人工参与。神经机器翻译(NMT)是现有机器翻译系统中最新、最有效的翻译技术之一。在本文中,我们将NMT应用于英语-英语语言对。我们提出了一种新的神经机器翻译技术,使用单词嵌入和字节空编码(BPE)来开发一个有效的翻译系统,该系统克服了在线翻译不多的语言的OOV(词汇外)问题。我们使用BLEU分数来评估系统性能。实验结果表明,我们提出的MIDAS翻译器(8.33 BLEU分数)优于Google翻译器的3.75 BLEU得分。

pdf格式围兜
伪参考翻译在质量评估中的优势机器翻译输出
梅拉尼娅·杜马|沃尔夫冈·门泽尔

本文介绍了一种新的质量估计方法,该方法扩展了(Duma和Menzel,2017)中的方法,将伪引用翻译作为数据源考虑到以前使用的树核和序列核。该系统的两个变体被提交给英语-德语对的句子级WMT18质量评估任务。在SMT轨道上的13个系统中,他们分别排名第4和第6,而在NMT轨道上,11个提交的系统中,排名分别为4和5。

pdf格式围兜
有监督和无监督的最简质量估计器:维康科技参与WMT公司2018年质量评估任务
蒂埃里·埃切戈伊(Thierry Etchegoyhen)|伊娃·马丁内斯·加西亚|安多尼·阿斯佩提亚

我们描述了维康科技参与WMT 2018质量评估共享任务的情况,为此我们提交了最低限度的质量评估。我们的方法的核心基于两个简单的特征:词汇翻译重叠和语言模型交叉熵得分。这些特征在两个系统变体中得到了利用:uMQE是一个无监督系统,通过平均单个特征得分获得最终质量得分;sMQE是一种有监督的变量,其中最终得分由在可用的注释数据集上训练的支持向量回归器估计。我们的最低限度质量评估方法的主要目标是提供可靠的评估器,这些评估器需要最少的部署工作、很少的资源,并且在uMQE的情况下,不依赖昂贵的数据注释或后期编辑。我们的方法应用于句子质量评估中的所有语言对,获得了全面的竞争结果。

pdf格式围兜
用于翻译质量评估的上下文编码
胡俊杰|魏成昌|吴跃欣|格雷厄姆·纽比格

单词水平质量估计(QE)的任务包括获取源句子和机器生成的翻译,并预测输出中哪些单词是正确的,哪些是错误的。本文提出了一种使用三部分神经网络方法对每个目标词的局部和全局上下文信息进行有效编码的方法。第一部分使用嵌入层来表示两种语言中的单词及其词性标签。第二部分利用一维卷积层集成每个目标单词的局部上下文信息。第三部分应用一组前馈和递归神经网络对句子中的全局上下文进行进一步编码,然后再进行预测。该模型作为CMU条目提交到WMT2018 QE共享任务中,并取得了很好的结果,在六个轨道中的三个轨道中排名第一。

pdf格式围兜
S公司heffield提交的WMT公司18质量估算共享任务
朱莉娅·伊芙|卡罗琳娜·斯卡顿|弗雷德里克·布莱恩|露西娅·斯佩西亚

在本文中,我们介绍了谢菲尔德大学提交的WMT18质量评估共享任务。我们讨论了我们提交给所有四个子任务的内容,我们的团队是唯一一个参与所有语言配对和变体(37种组合)的团队。我们的系统显示出具有竞争力的结果,几乎在所有情况下都优于基准。

pdf格式围兜
UA公司lacant机器翻译质量估计WMT公司2018年:使用短语表和前馈神经网络的简单方法
费利佩·桑切斯·马丁内斯|米奎尔·埃斯普拉-戈米斯|米克尔·L·福卡达

我们描述了阿拉坎特大学在2018年WMT上提交的单词和句子级机器翻译(MT)质量评估(QE)共享任务。我们对单词级机器翻译质量工程的方法基于之前的工作,将机器翻译句子中的单词标记为好 啊,并被扩展以确定是否需要在每个单词后面的空白处插入单词或单词序列。我们的句子级提交只是使用单词级方法预测的编辑操作来近似TER。在六个数据集中,有三个数据集的子任务(识别间隙插入)中,所提出的方法排名第一,其余数据集排名第二。

pdf格式围兜
A类libaba提交WMT公司18质量估算任务
王佳怡|开凡|李波(Bo Li)|周凤鸣|陈拳击|杨斌石|罗思

WMT 2018翻译质量评估共享任务的目标是研究在没有参考翻译的情况下自动评估机器翻译结果质量的方法。本文介绍了QE大脑系统,该系统提出了神经双语专家模型作为基于条件目标语言模型的特征抽取器,并使用双向变换器,然后使用Bi-LSTM预测模型处理源代码和翻译输出的语义表示,以进行自动质量评估。该系统已应用于句子级评分和排名任务以及单词级任务,以查找翻译中每个单词的错误。一组广泛的实验结果表明,我们的系统在WMT 2017质量评估任务中优于最佳结果,并在WMT 2018中获得最佳结果。

pdf格式围兜
基于力编码注意和跨语言嵌入的质量评估
伊丽莎维塔·扬科夫斯卡娅|安德烈·塔塔|马克·菲舍尔

本文描述了塔尔图大学团队提交的WMT18句子级质量评估共享任务。该模型使用基于神经机器翻译系统注意权重的特征和跨语言短语嵌入作为回归模型的输入特征。提出的两个模型只需要一个带有注意机制的神经机器翻译系统,而不需要额外的资源。结果表明,将神经网络和基线特征相结合,可以显著改善单独的基线特征。

pdf格式围兜
微软-使用单位din提交给WMT公司2018共享任务:用于自动后期编辑的双源变压器
马金·朱奇斯·道蒙特|罗曼·格兰基维奇

本文描述了微软和爱丁堡大学提交给WMT2018的自动后期编辑共享任务。基于WMT2017共享任务中的训练数据和系统,我们从上一个共享任务中重新实现了我们自己的模型,并在广泛参数共享的基础上引入了改进。接下来,我们对IT领域的双源变压器模型和数据选择的实现进行了实验。我们的提交文件决定性地赢得了SMT后期编辑子任务,确立了新的最先进技术,在NMT子任务中排名第二(或相当于16.46对16.50 TER)。基于NMT子任务中相当微弱的结果,我们假设神经对神经APE实际上可能没有用处。

pdf格式围兜
基于变换器的多源自动后置编辑系统
桑塔努·帕尔|尼科·赫比格|安东尼奥·克鲁格|约瑟夫·范·贾纳比特

本文介绍了我们提交给2018年WMT组织的APE任务的英语-德语自动后期编辑(APE)系统(Chatterjee等人,2018)。提出的模型是转换器架构的扩展:两个独立的基于自关注的编码器对机器翻译输出(mt)和源(src)进行编码,然后是一个联合编码器,该编码器负责处理这两个编码序列(encsrc和encmt)的组合,以生成编辑后的句子。我们比较了这种多源体系结构(即{src,mt}pe)到单语转换器(即mtpe)模型与多源{src,mt}集成pe和单源mtpe模型。对于PBSMT和NMT任务,集成产生的结果最好,其次是多源模型,最后是单源方法。我们最好的模型,即集成,在PBSMT和NMT任务中分别获得了66.16分和74.22分的BLEU分数。

pdf格式围兜
DFKI公司-MLT公司的系统描述WMT公司18自动编辑后任务
达里娅·佩利彭科(Daria Pylypenko)|拉斐尔·鲁比诺

本文介绍了DFKI-MLT小组提交给WMT’18 APE共享任务的自动后期编辑(APE)系统。三个单语神经序列到序列APE系统仅使用目标语言数据进行训练:一个使用注意力递归神经网络结构,另一个仅使用注意力(变压器)架构。训练数据由机器翻译(MT)输出组成,机器翻译输出用作APE模型的源,与人工编辑后的版本或参考翻译作为目标对齐。我们只使用了提供的训练集,并训练了适用于基于短语和神经MT输出的APE模型。结果表明,与递归模型相比,只注意模型取得了更好的性能,在基于短语的机器翻译输出后,与基线相比有显著改善,但在应用于神经机器翻译输出时,性能下降。

pdf格式围兜
用于自动后期编辑的多编码器变压器网络
Jaehun Shin先生|Jong-Hyeok Lee(李宗慧)

本文描述了POSTECH提交给WMT 2018关于自动后期编辑(APE)的共享任务。我们提出了一种新的基于变压器网络的神经端到端后编辑模型。我们修改了编码器-解码器注意,以反映APE问题中机器翻译输出、源和后编辑翻译之间的关系。在WMT17英语-德语APE数据集上的实验表明,与WMT17 APE共享任务的最佳结果相比,TER和BLEU得分都有所提高。与基线相比,我们的第一次提交的PBSMT任务达到-4.52 TER和+6.81 BLEU分数,NMT任务达到-0.13 TER和+0.40 BLEU得分。

pdf格式围兜
用于自动后期编辑的组合损耗多源变压器
阿米罗申·特比法赫|鲁奇特·阿格拉瓦尔|马特奥·内格里|马可·图尔奇

机器翻译(MT)自动后置编辑(APE)的最新方法表明,神经多源模型可以获得最佳结果,该模型通过同时考虑来自相应源句子的信息来校正原始MT输出。为此,我们首次提出了一种基于Transformer体系结构的神经多源APE模型。此外,我们使用序列级损失函数,以避免培训期间的暴露偏差,并与任务使用的自动评估指标保持一致。这些是我们提交给WMT 2018 APE共享任务的主要特征,在该任务中,我们参与了PBSMT子任务(即基于短语系统的MT输出校正)和NMT子任务,即神经输出校正。在第一个子任务中,我们的系统在基线上提高到-5.3 TER和+8.23 BLEU点,在提交的11次跑步中排名第二。在第二份报告中,以最初翻译的质量较高为特点,我们报告了较低但在统计上显著的收益(高达-0.38 TER和+0.8 BLEU),在10份提交材料中排名第一。

pdf格式围兜
语音并行语料库过滤系统WMT公司18
汤姆·阿什|雷米·弗朗西斯|威尔·威廉姆斯

我们进入并行语料库过滤任务时使用了两步策略。第一步使用一系列实用的硬“规则”来删除最差的例句。第一步将有效语料库大小从最初的10亿减少到1.6亿。第二步使用四种不同的启发式算法进行加权,以生成分数,然后用于进一步筛选到1亿或1000万个令牌。我们的最终系统在不需要对精确的任务或语言对进行过度微调的情况下产生具有竞争力的结果。隔离的第一步提供了一个非常快速的滤波器,可以提供最终系统的大部分增益。

pdf格式围兜
堆栈,OOV公司密度和N克饱和度:维康科技参与WMT公司2018年并行语料库过滤共享任务
安多尼·阿斯佩提亚|蒂埃里·埃切戈伊(Thierry Etchegoyhen)|伊娃·马丁内斯·加西亚

我们描述了维康科技参与WMT 2018并行语料库过滤共享任务的情况。我们旨在评估该任务的简单方法,该方法可以有效处理大量数据,并且可以轻松部署到不同语言对和域的新数据集。我们的方法基于STACC,这是一种在可比较语料库中进行平行句子识别的有效且可移植的方法。为了解决语料库过滤任务的具体问题,该任务具有大量噪声数据的特点,核心方法进行了扩展,根据句子对中未知单词的数量进行惩罚。此外,我们还试验了一种基于源句子n-gram的补充数据饱和方法,目的是降级那些没有贡献大量未观察到n-gram信息的平行句子对。我们的方法不需要事先训练,并且对于语料库过滤任务中的大型数据集类型高效。我们用这种简单便携的方法取得了有竞争力的结果,在竞争系统中排名前半。

pdf格式围兜
规则和机器学习的混合管道用于过滤网络搜索的并行语料库
爱德华·巴布|Verginica Barbu Mititelu公司

使用由规则和机器学习组成的混合流水线来过滤带有噪声的web英语-German并行语料库,以完成并行语料过滤任务。流水线的核心是一个基于逻辑回归算法的模块,该模块返回接受翻译单元的概率。逻辑回归的训练集是通过自动注释创建的。通过手动标记训练集来评估自动标注的质量。

pdf格式围兜
报道与愤世嫉俗:AFRL公司提交给WMT公司2018并行语料库筛选任务
格兰特·埃德曼|杰里米·格温努普

WMT 2018平行语料库过滤任务旨在测试过滤有噪声平行语料集的各种方法,以使其对机器翻译系统的训练有用。我们描述了AFRL提交,包括其预处理方法和质量指标。数值结果表明了不同选项的相对优势,并显示了我们的方法的竞争力。

pdf格式围兜
MAJE公司提交给WMT公司2018年并行语料库过滤共享任务
玛丽娜·福米切娃|杰苏斯·冈萨雷斯-鲁比奥

本文描述了Webexplect在第三届机器翻译大会(WMT 2018)上参与并行语料库过滤的共享任务。本文描述了我们的方法的主要特征,并讨论了在为共享任务发布的数据集上获得的结果。

pdf格式围兜
一种无监督的并行语料库过滤系统
维克托·汉加|亚历山大·弗雷泽

在本文中,我们描述了LMU慕尼黑提交的WMT 2018并行语料库过滤共享任务解决了清除有噪声的并行语料库的问题。挖掘和清理平行句的任务对于提高机器翻译系统的质量非常重要,特别是对于低资源语言。我们依靠在没有任何双语信号的情况下创建的双语单词嵌入,以一种完全无监督的方式来解决这个问题。在对噪声数据进行预滤波后,我们通过计算双语句子水平的相似性来对句子对进行排序,然后通过使用单语相似性来去除冗余数据。我们的无监督系统在共享任务的官方评估中取得了良好的性能,仅落后于最佳系统几分,而不需要任何并行训练数据。

pdf格式围兜
含噪并行语料库的双条件交叉熵滤波
马金·朱奇斯·道蒙特

在这项工作中,我们引入了带噪并行数据的双条件交叉熵滤波。对于每个含噪平行语料库的句子对,我们根据在干净数据上训练的两个逆翻译模型计算交叉熵得分。我们惩罚发散的交叉熵,并用两个模型的交叉熵平均值来衡量惩罚。根据这些分数进行排序或阈值化可以得到更好的并行数据子集。与使用干净的WMT数据训练的模型相比,使用仅从Paracrall中过滤的并行数据训练模型,我们获得了更高的BLEU分数。我们在WMT2018并行语料库过滤共享任务的背景下进一步评估了我们的方法,获得了共享任务的总体最高排名分数,在四个子任务中的三个子任务中得分最高。

pdf格式围兜
这个JHU公司并行语料库过滤系统WMT公司2018
Huda Khayrallah公司|海南徐|菲利普·科恩

这项工作描述了我们提交给WMT18并行语料库过滤共享任务的情况。我们使用稍微修改过的Zipporah语料库过滤工具包(Xu和Koehn,2017),该工具包计算句子对的适当性分数和流利性分数,并使用分数的加权和作为选择标准。这项工作与Zipporah的不同之处在于,我们尝试使用要过滤的噪声语料库来计算组合权重,从而避免像标准Zippora那样生成合成数据。

pdf格式围兜
使用马氏距离测量句子平行性:NRC公司WMT公司18并行语料库过滤共享任务
帕特里克·利特尔|塞缪尔·拉金|达琳·斯图尔特|米歇尔·西马德|西里尔·古特|Chi-kiu Lo公司

WMT18共享了并行语料库过滤任务(Koehn等人,2018b),要求团队从大型高召回率、低精度网络搜索并行语料夹中为句子对评分(Koehan等人,2018年a)。参与者可以使用现有的样本语料库(例如过去的WMT数据)作为监督信号,以了解“干净”的语料库是什么样的。然而,在低资源的情况下,经常会发生语言的目标语料库是只有该语言中的平行文本示例。因此,我们做了几个无监督的条目,给自己设置了一个额外的限制,即我们不能使用额外的干净的平行语料库。其中一个条目在100M单词条件的前十大系统中得分相当一致,而在翻译欧洲药品管理局语料库(Tiedemann,2009)的一项任务中,即使在10M单词条件下,该条目也在最佳系统中得分。

pdf格式围兜
使用语义机器翻译评估度量清理噪声并行语料库的准确语义文本相似度:NRC公司监督提交到并行语料库筛选任务
Chi-kiu Lo公司|米歇尔·西马德|达琳·斯图尔特|塞缪尔·拉金|西里尔·古特|帕特里克·利特尔

我们提出了一种语义文本相似度方法,该方法使用一种新的语义机器翻译评估指标YiSi来过滤带有噪声的网络爬行并行语料库。主要基于这种监督方法的系统在WMT18并行语料库过滤共享任务中表现良好(在1亿字评估中排名第四,在1000万字评估中位列第八,在48份提交中排名第六)。事实上,我们表现最好的系统-NRC-yisi-bicov是两次评估中仅有的四份排名前10的提交文件之一。我们提交的系统还包括一些初始过滤步骤,用于缩小测试语料库的大小,以及一个最终冗余删除步骤,用于更好地覆盖过滤语料库中的语义和标记。在本文中,我们还描述了我们在自动合成有噪声的并行开发语料库以调整权重以结合不同的并行性和流畅性特征方面的失败尝试。

pdf格式围兜
A类libaba向WMT公司18并行语料库筛选任务
陆军|吕晓宇|杨斌石|陈拳击

本文描述了阿里巴巴机器翻译集团提交给WMT 2018并行语料库过滤共享任务的报告。在评估并行语料料库的质量时,调查了语料库的三个特征,即1)双语/翻译质量,2)单语质量和3)语料库多样性。采用基于规则和基于模型的方法对平行句对进行评分。最终的并行语料库过滤系统是可靠的,易于构建和适应其他语言对。

pdf格式围兜
UTFPR公司WMT公司2018年:机器翻译的最小监督语料库过滤
古斯塔沃·帕佐尔德

我们在WMT 2018并行语料库过滤任务中展示了UTFPR系统。我们的监督方法通过在人工生成的二进制分类数据集上训练经典的二进制分类模型来区分好翻译和坏翻译,该数据集源自高质量的翻译集,以及由6个语义距离特征组成的最小集,这些特征仅依赖于易于收集的资源。我们根据“好”标签的概率对翻译进行排名。我们的结果表明,logistic回归对与我们的方法最为吻合,在评估的不同环境中产生更一致的结果。

pdf格式围兜
这个ILSP(综合后勤保障计划)/提交给WMT公司2018并行语料库筛选共享任务
瓦西里斯·帕帕瓦西里奥|索非亚诺普洛斯索非亚诺普洛斯|普罗科皮斯|Stelios Piperidis公司

本文描述了语言与语音处理研究所/雅典娜研究与创新中心(ILSP/ARC)提交的WMT 2018并行语料库过滤共享任务。我们探索了系统在任务背景下探索的句子和句子对的几个属性,目的是根据句子对在机器翻译系统训练中的适当性对其进行聚类。我们还讨论了对最合适的聚类句子对进行排序的其他方法,目的是生成评估的两个数据集(任务要求的1000万和1亿单词)。通过总结组织者在评估阶段进行的几项实验的结果,我们的提交物的BLEU平均得分为26.41分,尽管它没有使用任何特定于语言的资源,如双语词典、单语语料库或机器翻译输出,而最佳参与者系统的平均得分为27.91分。

pdf格式围兜
SYSTRAN公司参与WMT公司2018年并行语料库过滤共享任务
MinhQuang Pham公司|约塞普·克雷戈|让·塞内拉特

本文描述了SYSTRAN在第三届机器翻译会议(WMT 2018)上参与并行语料库过滤共享任务的情况。我们首次使用神经句子相似度分类器参与研究,该分类器旨在预测多语言环境中句子对的相关性。本文描述了我们的方法的主要特征,并讨论了在为共享任务发布的数据集上获得的结果。

pdf格式围兜
Tilde的并行语料库过滤方法WMT公司2018
毛茛

本文描述了并行语料库过滤方法,该方法允许从语料库不可用于神经机器翻译训练的水平(即,生成的系统无法达到合理的翻译质量;远低于10 BLEU分)来降低噪声“并行”语料库的噪声达到一个经过训练的系统显示良好的水平(1000万字数据集上超过20个BLEU点,100万字数据集中最多30个BLEUs点)。该论文还记录了Tilde提交给WMT 2018关于并行语料库过滤的共享任务的文件。

pdf格式围兜
这个RWTH(跑道) A类瘦果U型大学过滤系统WMT公司2018并行语料库筛选任务
尼克·罗森巴赫|简·罗森达尔|金云素(Yunsu Kim)|米盖尔·格拉萨|阿曼·戈克拉尼|赫尔曼·奈伊

本文描述了RWTH亚琛大学提交的的并行语料库过滤任务EMNLP 2018第三届机器翻译会议(WMT 2018)。我们使用几种基于规则的启发式方法预选句子对。这些句子对使用基于计数的神经系统作为语言和翻译模型进行评分。除了单句对评分之外,我们还实现了一种简单的冗余消除启发式。我们性能最好的语料库过滤系统依赖于递归神经语言模型和基于转换器架构的翻译模型。在2018年新闻测试中,使用10M随机抽样代币训练的模型达到9.2%的BLEU性能。使用我们的过滤和排名技术,我们实现了34.8%的BLEU。

pdf格式围兜
Prompsit提交给WMT公司2018并行语料库筛选共享任务
Víctor M.Sánchez-Cartagena公司|马尔塔·巴尼翁|塞尔吉奥·奥尔蒂兹·罗哈斯|杰玛·拉米雷斯

本文描述了Prompsit Language Engineering提交给WMT 2018并行语料库过滤共享任务的报告。我们提交的四份材料基于一个自动分类器,用于识别相互翻译的句子对。在分类器之前应用了一套手工制定的硬规则,用于丢弃有明显缺陷的句子。我们探索了不同的策略来实现具有不同词汇和流利句子的训练语料库:语言模型评分、主动学习启发的数据选择算法和n-gram饱和。与其他参与者相比,我们提交的1亿单词训练语料库非常有竞争力。

pdf格式围兜
NICT公司的语料库过滤系统WMT公司18并行语料库筛选任务
王瑞(Rui Wang)|本杰明·玛丽|Masao Utiyama公司|住田英一郎

本文介绍了NICT参与WMT18共享并行语料库过滤任务的情况。组织者提供了10亿单词的德语-英语语料库,作为Paracroble项目的一部分。该语料库噪音太大,无法构建可接受的神经机器翻译(NMT)系统。利用WMT18共享新闻翻译任务的干净数据,我们设计了几个特征,并训练分类器对噪声数据中的每个句子对进行评分。最后,我们抽取了1亿和1000万个单词,并构建了相应的NMT系统。实验结果表明,基于采样数据训练的NMT系统取得了良好的性能。