来自摩西

摩西:高级功能

用户文档

解码器的基本功能在辅导的和培训部分。但要从摩西那里获得好的结果,您可能需要使用本页中描述的一些功能。

高级模型
一个基本的SMT系统包含一个语言模型和一个翻译模型,但是有几种方法可以通过添加额外的模型来扩展(并可能改进翻译)。例如,这些可以改进重新排序的建模,或捕获相关单词之间的相似性。
高效短语和规则存储
为了建立一个最先进的翻译系统,摩西经常需要庞大的短语对或规则表。这些表的有效存储和访问需要专门的数据结构,本页描述了几种不同的实现。
搜索
给定机器翻译模型和源句,寻找最佳翻译是一个棘手的搜索问题。摩西实施了几种方法来驯服这种棘手的问题。
未知单词
无论你的培训数据有多大,你想要翻译的文本中总会有OOV(外来词)。一种方法可能是音译——如果源语言和目标语言具有不同的字符集。
混合翻译
有时你需要规则!如果你想为摩西模型添加明确的知识,例如翻译术语或数字、日期等,摩西有几种方法可以做到这一点。
摩西作为一种服务
Moses包含一个基本服务器,可以通过xml-rpc交付翻译。
增量训练
传统的Moses管道是一系列批处理过程,但如果您想向正在运行的系统添加额外的训练数据,该怎么办?将短语表存储在后缀数组中可以实现这一点。
域适应
如果训练数据与测试数据存在系统性差异,则存在域问题。文献中提出了几种技术,摩西包括其中许多技术的实现。
约束解码
在某些应用程序中,您知道该转换,但需要知道模型是如何导出它的。
基于缓存的模型
这些可能是文档上下文影响翻译的有用方法。
稀疏特征
产生许多特征的特征函数,例如词汇化特征
支持工具
操作模型和配置文件的各种工具。
外部工具
语言工具、单词对齐器、评估指标和框架、其他开源机器翻译系统。
Web翻译
根据需要翻译网页和文本的Web服务软件。
管道创建语言
管理软件组件管道的通用机制,如Moses培训。
过时的功能
已经被移走的东西,但文件被保存下来留给后人。
检索自http://www2.statmt.org/moses/?n=moses.AdvancedFeatures网站
页面上次修改时间:2015年12月23日下午05:43