下载

新增:Meteor现在可以只使用用于机器翻译系统开发的并行数据自动学习新目标语言的版本。请参阅教程了解更多信息。

流星(包括X射线和流星短语表):

将MT系统调整为Meteor:
  • 摩西:默认支持,请参见MeteorScorer公司。小时用于指示。
  • cdec:使用--with-meteor标志进行配置,并指定“流星”作为评估指标(当前仅限英语)。

关于

Meteor自动评估指标通过将机器翻译假设与一个或多个参考翻译对齐来对其进行评分。对齐基于单词和短语之间的精确匹配、词干匹配、同义词匹配和释义匹配。根据假设-参考对之间的比对计算分段和系统级度量分数。该指标包括几个自由参数,这些参数被调整以模拟各种人类判断任务,包括WMT排名和NIST充分性。当前版本还包括用于MERT和MIRA的调优配置。Meteor扩展了对以下语言的支持(解释匹配和调整参数):英语、捷克语、德语、法语、西班牙语和阿拉伯语。Meteor是用纯Java实现的,无需安装或依赖性即可获得MT输出。平均而言,假设是以每个CPU内核每秒500个片段的速率进行评分的。在独立评估中,Meteor始终显示出与人类判断的高度相关性,例如EMNLP WMT 2011NIST指标MATR 2010.

流星X射线的使用XeTeX公司格努普洛特根据Meteor的输出创建对齐矩阵和分数分布的可视化。通过这些可视化,可以轻松比较MT系统或系统配置,并通过检查基础Meteor定线,促进深入的性能分析。最终输出为PDF格式,并保留中间的TeX和Gnuplot文件,以便包含在报告或演示中。示例部分包括流星X射线的样本对齐矩阵和分数分布。

[查看流星计分和可视化示例]

[阅读Meteor的完整文档,包括详细说明]

出版物

Meteor(当前版本,包括释义表和X射线):
  • 迈克尔·登科夫斯基和阿隆·拉维,“Meteor Universal:针对任何目标语言的特定语言翻译评估”,2014年EACL统计机器翻译研讨会论文集[PDF格式][围兜]
旧版本的Meteor:
  • 迈克尔·登科夫斯基和阿隆·拉维,“Meteor 1.3:机器翻译系统可靠性优化和评估的自动度量”,2011年EMNLP统计机器翻译研讨会论文集[PDF格式][围兜]

  • 迈克尔·登科夫斯基和阿隆·拉维,“METEOR-NEXT和METEOR短语表:改进了对五种目标语言的评估支持”,2010年ACL统计机器翻译和度量矩阵联合研讨会会议记录[PDF格式][围兜]

  • 迈克尔·登科夫斯基和阿隆·拉维,“将METEOR机器翻译评估指标扩展到短语级别”,NAACL/HLT会议记录,2010[PDF格式][围兜]

  • 阿隆·拉维和迈克尔·登科夫斯基,“机器翻译自动评估的METEOR度量”,机器翻译,2010[PDF格式]

  • 阿巴亚·阿加瓦尔和阿隆·拉维,“METEOR、M-BLEU和M-TER:与机器翻译输出的人类排名高度相关的评估指标”,2008年ACL统计机器翻译研讨会论文集[PDF格式]

  • 阿隆·拉维和阿巴亚·阿加瓦尔,“气象:一种与人类判断高度相关的机器翻译自动评估指标”,2007年ACL统计机器翻译研讨会论文集[PDF格式]

  • Satanjeev Banerjee和Alon Lavie,“METEOR:一种改进了与人类判断相关性的机器翻译自动评估指标”,2005年ACL MT和/或总结内在和外在评估措施研讨会会议记录[PDF格式]