维基百科矿工

一个用于挖掘维基百科的开源工具包。在线百科全书Wikipedia是一个庞大的、不断发展的、由相互关联的文章组成的挂毯。对于开发人员和研究人员来说,它代表了一个庞大的多语言的概念和语义关系数据库,是自然语言处理和许多其他研究领域的潜在资源。本文介绍了wikipediaminer工具包,这是一个开源软件系统,允许研究人员和开发人员将Wikipedia丰富的语义集成到自己的应用程序中。该工具包创建的数据库包含维基百科内容和结构的摘要版本,并包含一个JavaAPI来提供对它们的访问。Wikipedia的文章、类别和重定向被表示为类,可以有效地进行搜索、浏览和迭代。高级功能包括对Wikipedia转储的并行处理、机器学习的语义相关性度量和注释特性,以及基于XML的web服务。wikipediaminer旨在成为一个共享数据挖掘技术的平台。


zbMATH中的参考文献(参考,1标准件)

显示第1到第10个结果,共10个。
按年份排序(引用)

  1. 江云城:语义计算的形式化模型(2019)
  2. Dinov,Ivo D.;Siegrist,Kyle;Pearl,Dennis K.;Kalinin,Alexandr;Christou,Nicolas:Probability\textitDistributome:用于探索概率分布的属性、相互关系和应用的web计算基础设施(2016年)
  3. 弗拉蒂,蒂齐亚诺;瓦内拉,丹尼尔;帕西尼,托马索;纳维格利,罗伯托:多语言维基百科比特学项目(2016)
  4. Astrakhantsev,N.A.;Fedorenko,D.G.;Turdakov,D.Yu.:特定领域文本集合中自动术语识别的方法:一项调查(2015年)ioport公司
  5. David Milne;Ian H.Witten:用于挖掘Wikipedia的开源工具包(2013)不是zbMATH
  6. Milne,David;Witten,Ian H.:用于挖掘wikipedia的开源工具包(2013)ioport公司
  7. Navigli,Roberto;Ponzetto,Simone Paolo:BabelNet:广覆盖多语言语义网络的自动构建、评估和应用(2012)
  8. 梅德利安,奥莉娜;米尔恩,大卫;莱格,凯瑟琳;维滕,伊恩H.:维基百科的挖掘意义(2009)ioport公司
  9. 王璞;胡健;曾华军;陈,郑:利用维基百科知识改进文本分类(2009)ioport公司
  10. Medelyan,Olena;Legg,Catherine;Milne,David N.;Witten,Ian H.:维基百科的挖掘意义(2008)ioport公司