登录 帮助
打印
主页概述.html
 

GATE:用于文本处理的全生命周期开源解决方案

目录

(住院?参见2分钟指南.)

1介绍

GATE已有15年历史,目前正积极用于所有类型的涉及人类语言的计算任务。GATE擅长文本分析各种形状和尺寸。从大公司到小初创公司,从数百万欧元的研究联盟用于本科生项目,我们的用户社区是这类系统中最大、最多样化的分布在除一个大陆以外的所有大陆1.

GATE是开源的自由软件; 用户可以获得用户和开发人员社区通过GATE.ac.uk网站或在商业基础上我们的工业合作伙伴。我们是最大的开源语言处理项目开发团队的规模是最大可比项目的两倍多(其中许多与GATE集成2). 超过5欧元已为GATE开发投资万美元; 我们的我们的目标是确保这笔钱继续用于所有人GATE的用户。

本说明总结了GATE软件和过程,并给出了一些示例它们的用途。我们认为,GATE是其类型的领先系统,但作为科学家们,我们不得不建议你不要相信我们的话;这就是为什么我们在过去的许多竞争评估中衡量了我们的软件十年半(MUC、TREC、ACE、DUC…)。我们邀请您尝试一下,参与GATE社区,为人类语言做出贡献科学、工程和发展。

2GATE家族

GATE多年来不断发展,为开发人员提供了一个桌面客户端基于工作流的web应用程序、Java库、体系结构和流程。GATE是:

我们还开发:

有关更多信息,请参阅家庭主页.

我们最初的动机之一是消除解决常见问题的必要性进行有用研究之前的工程问题,或之前的重新设计将研究结果部署到应用程序中。关贸总协定的核心职能工程的最大份额:

除了核心功能之外,GATE还包括各种语言的组件处理任务,例如解析器、形态学、标记、信息检索工具,各种语言的信息提取组件,以及许多其他。GATE Developer和Embedded提供了一个信息萃取系统(ANNIE)已被广泛采用和评估(在MUC、TREC、ACE、,DUC、Pascal、NTCIR等)。ANNIE通常用于创建RDF或OWL(元数据)用于非结构化内容(语义的注释).

GATE第1版编写于20世纪90年代中期;在新千年之交我们用Java完全重写了系统;版本5于2009年6月发布。

2.1.组件模型

GATE持续良好并取得成功的原因之一是核心被分解为可重用的块(使用原始的Java组件型号)。以下总结了Embedded中可用的一些API:

三。第一堂兄-Ontotext家族

补充GATE的开发和协作分布式注释工具,KIM提供了一个简单的部署选项(前端、,后端)。

使用GATE开发的许多系统嵌入到现有的应用程序中一种或另一种;Ontotext家族提供了一个很好的替代品方法和基于GATE的注释以及KIM/Mímir索引和搜索引擎代表了企业文本分析的健壮成熟解决方案搜索和类似内容。

4下一步在哪里?

渴望更多?文件的主要来源和去向的摘要获取帮助:

祝你好运!

脚注

  1. 谣传我们计划派遣几个开发团队单程前往南极洲当然,门票是虚假的、诽谤性的和一厢情愿的想法。
  2. 我们的理念是重用而不是重新设计,因此我们可以与其他系统集成和互操作,例如:LingPipe、OpenNLP、UIMA和许多更具体的工具。
  3. 这是的数字直接谢菲尔德投资,因此被低估了。
  4. 大门Developer和GATE Embedded是捆绑的,在较早的发行版中简称“GATE”。