牦牛

另一个关键字提取器(Yake)。利用文本特征自动提取关键词的无监督方法。牦牛!是一种基于从单个文档中提取的文本统计特征来选择文本中最重要的关键词的一种轻量级无监督自动关键词提取方法。我们的系统不需要对特定的文档集进行训练,也不需要依赖词典、外部语料库、文本大小、语言或域。为了证明我们建议的优点和意义,我们将其与十种最先进的无监督方法(TF.IDF、KP Miner、RAKE、TextRank、SingleRank、ExpandRank、TopicRank、TopicalPageRank、PositionRank和multipartierank)和一种监督方法(KEA)进行了比较,以证明我们的建议的优点和意义。在20个数据集(见下面的基准测试部分)上进行的实验结果表明,我们的方法在许多不同大小、语言或领域的集合下,显著优于最先进的方法。除了这里描述的python包之外,我们还提供了一个demo、一个API和一个移动应用程序。

此软件的关键字

这里的任何内容都将在支持canvas元素的浏览器上被替换


zbMATH中的参考文献(参考文献1条)

显示结果1/1。
按年份排序(引用)

  1. Abheesht Sharma,Gunjan Chhablani,Harshit Pandey,Rajaswa Patil:漂移:科学文献历时分析工具包(2021)阿尔十四