专利机器翻译和检索原型测试版

标题专利机器翻译和检索原型测试版
出版物类型可交付成果
作者密歇根州切切夫,激活,R,España-Bonet,C公司,冈萨雷斯,M,马尔克斯,L,波波夫,B,兰塔,A
加入号码071
出版商MOLTO联盟
出版年份2012
编号D 7.1条
发布日期01/2012
摘要

本文件是对应于第7页案例研究:专利。它描述了专利翻译和检索的初步原型。

首先,对工作包进行了概述,我们简要总结了原型中考虑的场景。然后,我们给出了原型体系结构的总体布局、演示界面以及原型中集成的技术。最后,我们总结了工作包的当前状态和最终原型的未来方向。

关键词专利案例研究,第7页
工作类型项目可交付成果
统一资源定位地址http://molto-patents.ontotext.com/
自然

原型

传播水平

公共

状态

最终

附件大小
D71_最终.pdf1.05 MB

评论

新修订版

祝大家新年快乐!

我已经上传了最新版本的可交付成果,并添加了您的所有贡献和评论。如果您需要乳胶源,也可以根据要求提供。

请尽快告诉我任何进一步的意见,以便我们可以在未来几天将状态更改为“最终”。

干杯!梅里特塞尔。

对可交付成果的反馈

大家好,

阅读交付物后,我有以下评论:

  • 关于我应该写更多关于“查询语法的特征”,我想要更多关于我应该确切参考什么的指示,因为没有从我的观点来看,说得太多了。有趣的是你如何最后给出了这些示例(可能来自本体中的关系)因为我只做了涵盖所有积极因素的最小语法示例及其泛化,模块化本体。

  • 关于自然语言产生的答案,恐怕我不要真正遵循,因为没有语法描述专利本体论,从我在演示中看到的内容来看,您只是展示了专利文本并突出某些概念,但不做任何进一步操纵结果。

  • 我也不确定未来应该使用多少种语言被查询语法/翻译系统覆盖,因为在工作中计划中提到了所有14个功能都最少语言。你考虑到了吗?

  • 这篇文章需要进行拼写检查,因为它有一些语法不一致,例如在摘要中出现“summare”随后拼写为“summary”和“bio-medical”“生物医学”。

  • 你的介绍性段落大部分取自报告我和亚当写的信,也应该作为参考。

如果您需要我的任何贡献,我很乐意作为只要你提出更具体的要求,因为我不知道在信息检索方面的所有进展中,因为我只与语法一起工作。

顺颂商祺,雷蒙纳

自然语言中的答案

正确的!我们必须在文件中强调,这不是实际的实施。相反,第2节描述了案例研究中的用例。它包括原型的“愿望”(例如,在NL中生成响应)以及不一定要集成到原型中的其他场景(例如,在线翻译)。

谢谢,

梅里特塞尔。

参考文献

请将您提到的报告的参考信息发送给我,我很乐意引用它。关于从中摘录的两句话,我认为我是从我们发送给MT峰会的论文的一个非常初步的版本中摘录出来的,我在D71中引用了这句话。我的错是没有意识到最初的来源是这份报告。

一般来说,请告诉我您错过的任何其他参考。

Merixell公司

对D71的贡献

IMHO,可交付成果是对原型中所有合作伙伴协作完成的工作的描述。拟议的文件只是初步草案。作为贡献者和作者,你们都可以提出任何更改,添加/删除部分并解释你们的工作。除了你们之外,没有人能比自己更好地解释你们的作品。因此,您可以按照自己喜欢的方式在可交付成果中添加您的工作。

特别是,在我看来,查询语法是系统的重要组成部分,因为它是系统的输入。输入由两个过程组成:首先,解析用户输入并生成抽象表示,然后将此表示转换为SPARQL。因此,系统其余部分的性能和功能在某种程度上取决于NL输入的处理方式。这就是为什么我觉得任何未来的读者(和我们)都有兴趣用一些细节来描述这两个过程(解析+翻译)(实际上,其他模块也是如此;)

梅里特塞尔。

口音

只需添加拼写检查问题:在表2中,法语列中的所有口音都丢失了。

--乔迪·萨卢德斯

关于所涉及的语言

对于所有与专利相关的内容,我认为我们只承诺了3种语言(现在是英语、法语和德语),而不是全部14种。这包括了查询,对吗?

工作计划

工作计划http://www.molto-project.eu/workpan/7说三种语言。我不知道谁是这个工作包描述的原始作者。