加布里洛维奇,E。;马尔科维奇,S。 基于Wikipedia的自然语言处理语义解释。 (英语) 兹比尔1182.68319 J.阿蒂夫。智力。研究(JAIR) 34, 443-498 (2009). 摘要:自然语言语义的充分表示需要获得大量常识和特定领域的世界知识。该领域以前的工作是基于纯粹的统计技术,没有利用背景知识,基于有限的词典学知识库(如WordNet),或基于巨大的人工努力(如CYC项目)。在这里,我们提出了一种新的方法,称为显式语义分析(ESA),用于非限定自然语言文本的细粒度语义解释。我们的方法代表了维基百科(现有最大的百科全书)中概念的高维空间中的意义。我们用基于Wikipedia的概念明确表示任何文本的含义。我们评估了该方法在文本分类和计算自然语言文本片段之间语义关联度方面的有效性。使用ESA在这两项任务中都比以前的技术水平有了显著改进。重要的是,由于使用了自然概念,ESA模型很容易向人类用户解释。 引用于6文件 MSC公司: 68T50型 自然语言处理 68M10个 计算机系统中的网络设计和通信 关键词:显式语义分析 软件:周期;RCV1型;SVM灯;WordNet(文字网) PDF格式BibTeX公司 XML格式引用 \textit{E.Gabrilovich}和\textit{S.Markovitch},J.Artif。智力。研究(JAIR)34,443--498(2009;Zbl 1182.68319) 全文: arXiv公司