登录 帮助
打印
主页商业customers.html(客户.html)
 

GATE和客户之声中的情绪分析

客户案例

英国国家档案馆(TNA)

TNA持有90TB的.gov.uk网站档案可以追溯到1997年,大约有一个存储了数十亿个不同的页面。其中,3500万已经用GATE Embedded on Amazon EC2进行了分析,并根据BigOWLIM语义库进行了注释,还用GATE Mímir进行了索引。我们最近与TNA进行了一个项目,以使用GATE和Ontotext的链接开放数据工具,以帮助访问其政府网站记录。系统注释了常见的实体类型,如人员、组织、,位置、日期等,以及更通用的度量和金额类型(这也是正常化的),以及一些特定类型的政府部门、公务员职位、政治家、项目等。该系统在web搜索页面中作为附加功能提供在TNA(面向最终用户)并通过SPARQL和REST API(面向开发人员)。

更多信息:

媒体

英国广播公司(BBC)正在引领更加灵活和智能的网络发布通过动态语义发布(DSP)。DSP架构方法现在巩固了最近重新推出和更新的BBC体育网站以及英国广播公司2012年奥运会在线内容.BBC未来媒体部正在使用GATE实现此方法的其他技术。该系统实现了约80%的成本节约与传统的数据库支持的web系统相比。

DSP的一个重要部分是允许记者用概念注释他们的工作。为此,英国广播公司(BBC)创建了一个名为“涂鸦”的工具。这是自然的语言处理(NLP)开始出现,GATE在其中发挥着重要作用。概念在文本中确定,并建议作者进行注释。要查找更多信息,请参阅本页.

这个新闻协会也会满座在长期运行的GATE项目的基础上,以类似的努力加快速度这将处理其海量图像库中的字幕。

媒体是我们文本分析和语义建模的完美应用领域技术,部分原因是新闻语言表现得很好(相对而言!),部分原因是内容非常有价值,以及部分原因是现有的分类方案通常应用得很广泛严格。联系我们将GATE添加到您的媒体系统中。

客户的声音

企业不断努力了解客户的想法他们的产品和服务,他们希望看到什么功能,有什么问题他们的经验等等。手工操作既昂贵又困难(在某些情况下案例不可能:与流行产品相关的客户体验量现在网络上的内容已经超出了传统市场的规模研究)。

客户的声音(VoC)应用程序使用情绪分析,信息提取语义标注为客户的意见、问题和愿望挖掘文本和演讲。该过程的典型输入包括:

基于GATE的系统在多家VoC供应商中使用,包括一家公司分析一些大型运输公司的客户反馈英国的组织和一家纽约客户情绪初创公司。

药物研究

自20世纪90年代末以来,GATE一直用于药物研究。早期基于葛兰素史克GATE的系统允许科学导航根据化学和药物术语撰写的论文。同时默克公司运行了100个集群执行基于GATE的注释的机器Medline科学文摘数据库。最近我们有了活动用户位于阿斯利康,罗氏公司,伊利·莉莉、和其他。

Ontotext上的拥有一套使用GATE的产品生命科学应用程序,包括来自生物科学数据库的RDF数据的最大聚集。

癌症研究

作为LarKC项目我们最近运行了一个尝试自动复制一个结果世卫组织癌症研究实验室最近发表在《自然》杂志上年。这一先前公布的结果表明多态性与肺癌风险增加相关。发现需要大量的手动工作来检查来自传感器阵列的数据。在分析这些数据时,通常的统计技术需要大量数据以使分析可用且可靠。此外,通常技术并没有利用任何以前的知识发表了关于特定基因和疾病的文章。

在我们的实验中,贝叶斯错误发现概率(BFDP)用于考虑到有关基因的先验知识。例如,如果我们已经知道基因在肺组织中表达,我们可以在BFDP模型,当计算特定传感器数据的相关性时多态性。关于基因的先验知识埋藏在科学文献中为了在BFDP中使用它,我们使用文本挖掘来查找讨论特定基因、疾病、解剖学等的论文。

在评估中使用BFDP和文本挖掘,我们已经能够找到基因与肺癌相关,使用所需数据的一半通过典型的统计技术。就实验室工作当量而言,使用这种技术,客户可以节省约30万欧元。

Web挖掘

这个斯波克人搜索引擎(现被收购Intellius公司)和Garlik个人隐私服务两者都依赖GATE进行个人信息的web挖掘数据。Intellius的Andrew Borthwick是GATE核心SourceForge的提交人项目。

目前一个典型的问题是解释聚焦网络的结果爬行。(目前)从整体上提取复杂数据成本太高web,但集中的方法可以使数据大小小到足以可行,但手工分析成本太高。GATE的信息提取/语义标注功能通常用于从网页中找出感兴趣的实体、关系和事件爬行器返回。

决策支持

你能读懂医生的笔迹吗?实际上现在很多医疗保健各组织正在逐步淘汰手写材料,这是一个整体可用于自动分析的新数据集上下文,-自动分析)。GATE客户正在与临床合作各种设置中的报告,例如用于改进决策支持援助。

这个MedCPU产品套件使用创新文本挖掘以将其临床决策辅助系统连接到自然医生认为最容易表达自己的语言,而不是一种语言网站上乱七八糟的文字!

招聘

求职习惯于使用记号笔和当地报纸;现在它的意思是在一台炙手可热的笔记本电脑上花了几个小时,发现了比你更多的谷歌窍门真的很想知道。几家公司都有基于GATE的招聘广告挖掘和CV,包括Innovantage公司,一个布里斯托尔一家知名公司,负责开采英国公司场地并供应就业委员会和招聘公司的结果。

其他