常见问题

这些是我们被问到的关于MOLTO的问题,以及我们的答案。如果你找不到你想要的,欢迎联系我们.

  • MOLTO的目标是什么?

    我们想开发一种工具,用于在web上以高质量在多种语言之间自动翻译文档(最多可同时翻译15种语言)。

  • MOLTO与网络上现有的翻译工具有何不同?

    Systran(Babelfish)和Google Translate等工具是为信息消费者设计的,但我们主要为信息生产者服务。我们希望质量足够好,例如,电子商务网站可以自动翻译其网页,而不用担心信息会发生变化。例如,通过其他工具,潜在客户可以阅读用法语写的电子商务页面,并将其翻译成瑞典语,以了解商店是否对她感兴趣。

  • 这不是太好了吗?

    当然,我们必须付出代价:我们无法翻译任何东西。我们只能翻译我们定制的系统要翻译的内容。这源于机器翻译中众所周知的权衡:不能同时达到完全覆盖和完全精确。在这种权衡中,Systran和谷歌选择了覆盖范围,而MOLTO选择了精度。

  • 你能翻译什么样的东西?

    MOLTO翻译人员专门从事不同领域的翻译工作,他们以统一且易于理解的方式使用语言。在MOLTO中,我们将为三个领域构建系统:数学练习、生物医学专利和博物馆对象描述。但这些领域只是示例,有助于我们开发和评估工具;我们希望这些工具能够应用于其他人开发的新领域。例如,电子商务网站、维基百科文章、合同、商业信函、用户手册和软件本地化。

  • 我还能在哪里找到MOLTO新闻?

    MOLTO推特提要发布小新闻快讯、关于MOLTO技术和人员的有趣事实,甚至偶尔发布事件的照片。您可以在以下位置关注我们http://twitter.com/moltop项目.

  • 我如何确认MOLTO资金?

    所有出版物应包括以下声明,表明前景是在欧盟的财政支持下产生的:

    根据FP7-ICT-247914号赠款协议,导致这些结果的研究得到了欧盟第七框架计划(FP7/2007-2013)的资助。

  • 如何连接到NEF(欧盟的参与者门户)?

    参与者门户网站提供有助于项目监控和管理的服务。它也是一个安全的互联网网站,以欧洲委员会认证服务(ECAS)为基础,确保充分的认证和保密机制。

    通过参与者门户访问NEF:http://ec.europa.eu/research/participants/portal/

    作为参与者,您可以通过参与者门户访问NEF,输入协调员提交的数据。

  • 开放存取——特别条款39——到底意味着什么?

    FP7开放获取试点基于同行评审出版物的自我归档开放获取。委员会还通过报销订阅期刊中的开放存取出版成本,为FP7中的完全开放存取出版提供了机会。

    作者应在发表时将其文章的同行评审手稿存放在资料库(也称为开放档案)中。

  • UGOT如何实现自我存档和开放访问?

    哥德堡大学的自我存档系统正在开发中。自存档将在古普(哥德堡大学出版社),将有可能确定公开出版的时间。目前,自我存档可以在GUPEA公司(哥德堡大学出版社-Elektroniskt Arkiv),但你需要帮助。

  • MOLTO交付物是否有风格?

    不,不是正式的,因为每个小组都使用他最喜欢的编辑。理想情况下,可交付成果在wiki中在线协作准备,作为“活的可交付成果”。这允许归档注释和版本控制(由CMS Drupal完成)。如果您选择在线编辑,那么,一旦可交付成果在

    http://www.molto-project.eu/wiki/living-deliverables

    您可以使用打印机友好型然后是打印。在大多数情况下,这会生成页码和良好的A4格式。

  • 你能翻译报纸文本吗?

    不,“报纸文本”在MOLTO的意义上并不是一个定义明确的领域,至少从我们今天掌握的知识来看不是这样。所以我们把它留给其他工具来翻译报纸、小说和随机网页。

  • 为新领域建立高质量的翻译系统需要付出巨大的努力吗?

    这正是我们想要做的。传统上,建立一个规模合理的翻译系统需要多年的努力。我们想把这个时间缩短到几个月,有时甚至是几天。我们希望它适用于没有受过MOLTO、语言学或编程方面特殊培训的人。阅读“技术”一节,了解我们认为可以如何做到这一点。

  • 你会让人类翻译失业吗?

    不。首先因为我们不能在定义明确的领域之外进行翻译。其次,更有趣的是,我们将为人类翻译人员提供新的工作模式:他们将能够定制翻译系统,而不是反复翻译同一领域中的类似文档。这些系统将从几个精选的示例中学习如何翻译同一领域内的其他文本,这些示例由人类翻译。这将提高译者的工作水平。

  • 质量是否与人工翻译相匹配?

    人类翻译人员总是比MOLTO更好地对风格做出明智的决定,从而产生更优雅的文本。另一方面,MOLTO将擅长专业领域的术语和惯用用法,而人类翻译人员可能缺乏这方面的培训。

  • MOLTO有哪些语言?

    MOLTO致力于处理15种语言,其中包括12种欧盟官方语言——保加利亚语、丹麦语、荷兰语、英语、芬兰语、法语、德语、意大利语、波兰语、罗马尼亚语、西班牙语和瑞典语,以及3种其他语言——加泰罗尼亚语、挪威语和俄语。但在项目期间,可能会添加其他语言,因为它们是由其他正在进行的项目提供的。

  • 如何添加我的语言?

    我们在MOLTO中为每种语言使用的主要东西是一个资源语法,它实际上是一个定义语言语法规则的软件库:它的词形变化和句法结构。为一种新语言编写资源语法需要一个相当熟练的程序员花费3-6个月的时间,他必须具备该语言的良好理论和实践知识。

  • 最有可能的下一种语言是什么?

    目前正在进行的工作至少包括阿拉伯语、波斯语、希伯来语、印地语/乌尔都语、冰岛语、日语、拉脱维亚语、马耳他语、葡萄牙语、斯瓦希里语、茨瓦纳语和土耳其语。仍然缺乏开发人员的欧盟语言是捷克语、爱沙尼亚语、希腊语、匈牙利语、爱尔兰语、立陶宛语、斯洛伐克语和斯洛文尼亚语。欢迎您为这些语言做出贡献!

  • MOLTO何时可用?

    我们将于2010年6月发布MOLTO web服务的第一个原型。该原型将不断更新,2011年将发布更成熟的工具。案例研究将于2012年末完成。但您现在已经可以通过尝试冰箱磁铁演示或a文本输入演示.

  • 你的翻译有错误-质量如何?

    我们将不断收到用户的反馈,并尽快修复所有错误。MOLTO技术的一个优点是它具有高度可编程性:我们可以高精度地定位翻译中的错误,并快速生成系统的固定版本,而不会破坏其他任何东西。

  • MOLTO有哪些人?

    我们是来自五个欧盟国家的三所大学和两家私营公司。约25人将积极参与MOLTO。

  • 你的背景和能力是什么?

    MOLTO拥有计算机科学、语言学和数学背景的人员。有大学教授、博士生、工程师和翻译。

  • 欧盟资金将如何使用?

    总预算略低于3000000欧元,其中EC捐款为2375000欧元。这将支付390人月的工作,分为工程师、博士生、翻译、项目经理和教师的部分工资。90%以上的预算用于工资和与工资相关的费用;其余部分主要用于旅行,既用于站点之间的内部会议,也用于参与会议以传播结果。从另一个角度来看,86%用于研究和开发,10%用于传播和开发,5%用于管理。

  • 谁可以利用这些结果?

    几乎所有的软件都将以开源自由软件的形式公开发布GNU LGPL许可证. TheLGPL公司许可证意味着任何人都可以将MOLTO工具用于任何事情,包括研究和商业目的。第三方应用程序无需像GPL许可证一样再次作为开源发布。当然,我们也希望将大部分衍生工作以开源的形式发布给社区。

  • 会有商业应用吗?

    是的,我们的公司合作伙伴将在MOLTO期间评估商业用途。

  • MOLTO背后的主要理念是什么?

    其主要思想是使用基于领域语义的中间语言,并配备可逆生成功能。因此,翻译是解析源语言和生成目标语言的组合。该技术的实现由GF、Grammatic Framework、grammatic Framework.org提供。GF在MOLTO中使用本体,如在语义网中使用的本体。我们还将使用统计机器翻译(SMT)方法来提高健壮性并从数据中提取语法。

  • 什么是GF?

    GF是一个定义多语言语法的框架,每个语法都基于通用抽象语法。抽象语法通过使用类型理论,与逻辑框架.自然语言生成部分称为具体语法,这是一种基于特征的语法形式主义,相当于PMCFG(并行多上下文自由语法)和具有多项式解析行为。GF使用PMCFG作为其“机器语言”,该语言由

  • 你为什么相信这些想法会奏效?

    GF已经开发了12年,基于多语言GF翻译已经在许多应用中进行了测试,包括从数学到软件规范再到口语对话系统(请参见GF主页).我们还相信有很多有趣的领域翻译即使我们无法提供竞争对手像谷歌翻译这样的开放域系统。

  • 语际转换不是一个不切实际的梦想吗?

    是的,如果我们想有一种通用的中间语言来解决所有问题的话。这就是为什么我们不相信我们能用MOLTO技术翻译报纸。然而,事实证明,特定领域的中间语言是相当可行的。请注意这一举动与本体论中发生的情况类似:它们已经从通用本体到领域本体。

  • 有什么科学挑战吗?

    第一个挑战是扩大应用程序的规模。没有那么多我们已经知道如何管理的语言,但词汇量从数百个单词到数千个单词不等。我们需要技巧手动构建并自动提取此类翻译词典。这导致了第二个挑战,即在技能和时间方面最大限度地减少开发工作:将GF作为正常工作流程的一部分,提供给没有受过特殊培训的人。