×

从维基百科中获取的用于计算语义相关性的知识。 (英语) Zbl 1182.68291号

摘要:维基百科提供了一个语义网络,用于以比搜索引擎更结构化的方式计算语义相关性,并且比WordNet覆盖面更广。我们展示了使用维基百科计算语义相关性的实验,并将其与WordNet在各种基准数据集上进行了比较。现有的相关性度量在使用维基百科时表现得比谷歌统计给出的基线更好,并且我们表明,维基在某些数据集上优于WordNet。我们还解决了维基百科是否以及如何作为知识库集成到NLP应用程序中的问题。包含Wikipedia可以提高基于机器学习的共指消解系统的性能,这表明它是NLP应用程序的宝贵资源。最后,通过计算德语数据集的语义相关性,我们表明我们的方法可以很容易地用于英语以外的语言。

MSC公司:

68层35 人工智能语言和软件系统理论(基于知识的系统、专家系统等)
68T05型 人工智能中的学习和自适应系统
68米10 计算机系统中的网络设计和通信
PDF格式BibTeX公司 XML格式引用