项目摘要

MOLTO的目标是开发一套用于在多种语言之间实时高质量翻译文本的工具。语言是工具中的独立模块,可以多种多样;将建造涵盖欧盟23种官方语言大部分内容的原型。

作为其主要技术,MOLTO使用特定领域的语义语法和基于本体的中间语言。这些组件是在GF(语法框架)中实现的,这是一种语法形式主义,其中多种语言通过一个通用的抽象语法相关联。GF已经应用于几个中小规模的领域,通常针对多达十种语言,但MOLTO将在生产力和适用性方面扩大这一范围。

扩大规模的一部分是增加域的大小和语言的数量。一个更重要的部分是让没有GF专业知识的领域专家可以使用该技术,并尽可能减少构建翻译人员所需的工作量。理想情况下,这可以通过扩展词典和写一组例句来完成。

MOLTO最需要研究的部分是本体标准(OWL)和GF语法之间的双向互操作性,以及通过统计方法扩展基于规则的翻译。OWL-GF互操作性将使基于多语言自然语言的交互与机器可读知识相结合。统计方法将在需要时增加系统的鲁棒性。将开发新的方法来将GF语法与统计翻译结合起来,以使两者都受益。

MOLTO技术将作为开源库发布,可以插入标准翻译工具和网页,从而适合标准工作流。它将在网络演示中演示,并应用于三个案例研究:15种语言的数学练习、至少3种语言的专利数据以及15种语言对博物馆对象的描述。