Ambiverse NLU公司

多语言Ambiverse自然语言理解套件(AmbiverseNLU)将语言理解任务的最先进组件组合在一个单一、易于使用、可扩展的套件中:命名实体识别和消除歧义(或实体链接)、开放信息提取、实体显著性估计和概念链接。

您可以将AmbiverseNLU用作web服务,通过命令行脚本调用它,或在自己的代码中使用它(例如作为maven依赖项)。

AmbiverseNLU由MPI for Informatics和Ambiverse GmbH联合开发。

新闻

2018年11月26日:AmbiverseNLU开源发布


使用AmbiverseNLU

演示

设置AmbiverseNLU

Ambiverse NLU公司可用作开源在GitHub上,根据Apache 2.0许可证进行许可。

你也可以使用我们的Docker图像文件夹快速设置AmbiverseNLU。



出版物

  • Dominic Seyler、Tatiana Dembelova、Luciano Del Corro、Johannes Hoffart、Gerhard Weikum。外部知识在命名实体识别任务中的重要性研究2018年ACL
  • Gerhard Weikum、Johannes Hoffart和Fabian M.Suchanek。十年的知识积累:教训与挑战IEEE数据工程。2016
  • Luciano Del Corro、Abdalghani Abujabal、Rainer Gemulla、Gerhard Weikum。FINET:上下文软件细粒度命名实体键入。2015年EMNLP
  • 法比奥·彼得罗尼(Fabio Petroni)、卢西亚诺·德尔·科罗(Luciano Del Corro)、雷纳·杰穆拉(Rainer Gemulla)。核心:使用分解机器的上下文软件开放关系提取。2015年EMNLP
  • 卢西亚诺·德尔·科罗(Luciano Del Corro)、雷内尔·杰穆拉(Rainer Gemulla)、格哈德·威库姆(Gerhard Weikum)。Werdy:通过句法和语义修剪识别和消除动词和动词短语的歧义。2014年EMNLP
  • Johannes Hoffart、Dragan Milchevski、Gerhard Weikum。STICS:使用字符串、对象和猫进行搜索。SIGIR 2014。
  • Johannes Hoffart、Yasemin Altun、Gerhard Weikum。发现具有模糊名称的新兴实体。WWW 2014
  • 卢西亚诺·德尔·科罗(Luciano Del Corro),雷纳·杰穆拉(Rainer Gemulla)。基于子句的开放信息提取。2013年WWW
  • Johannes Hoffart、Stephan Seufert、Dat Ba Nguyen、Martin Theobald、Gerhard Weikum。KORE:用于实体消歧的关键短语重叠相关性。2012年CIKM
  • Johannes Hoffart等人。文本中命名实体的健壮消歧。2011年EMNLP

自然语言理解组件

KnowNER:命名实体识别

命名实体识别(NER)识别文本中提及的命名实体(人员、组织、位置、歌曲、产品等)。

KnowNER处理英语、捷克语、德语、西班牙语和俄语文本。

AmbiverseNLU为NER提供KnowNER。

 

进一步阅读:D.Seyler、T.Dembelova、L.Del Corro、J.Hoffart和G.Weikum,“外部知识在命名实体识别任务中的重要性研究”,ACL 2018


ClausIE:开放式信息提取

开放式信息提取(OpenIE)是一项任务,它从自然语言文本中以n元命题的形式生成结构化输出,由主题、关系和一个或多个参数组成。例如,在“阿尔伯特·爱因斯坦出生于乌尔姆”这句话中,一个开放的信息提取系统将生成提取(“阿尔伯特·爱因斯坦”、“出生于”、“乌尔姆”),其中第一个论点通常是
称为主语,第二个称为关系,最后一个称为宾语或论点。

克劳斯致力于英语文本。

AmbiverseNLU为OpenIE提供了ClausIE的增强版本。

 

进一步阅读:L.Del Corro和R.Gemulla,“基于子句的开放信息提取”,WWW 2013


实体显著性

实体显著性给文档中的每个实体以[0,1]分,表示其对文档的重要性。

我们的实体显著性是完全多语言的。

AIDA:命名实体消歧

命名实体消歧(NED)将NER(见上文)识别的提及链接到唯一标识符。大多数名称都是模棱两可的,尤其是姓氏,实体消歧可以解决这种模棱两角的问题。与NER一起,NED通常被称为实体链接。

AIDA处理英语、汉语、捷克语、德语、西班牙语和俄语文本。

AmbiverseNLU为NED提供了增强版的AIDA,将提及的实体映射到Wikipedia-derived中注册的实体雅高知识库。

 

进一步阅读:J.Hoffart、M.A.Yosef、I.Bordino、H.Furstenau、M.Pinkal、M.Spaniol、B.Taneva、S.Thater和G.Weikum,“文本中命名实体的有力消歧”,EMNLP 2011


概念链接

概念链接类似于实体链接,但侧重于非命名实体(例如汽车、椅子等)。它识别文本中的相关概念,并将它们链接到在Wikipedia-derived中注册的概念雅戈知识库。

概念链接适用于英语、汉语、捷克语、德语、西班牙语和俄语文本。

AmbiverseNLU提供了一个新的概念链接组件,该组件基于原始的AIDA实体消歧和知识知情发现。