×

atr4型

swMATH ID: 26638
软件作者: 北阿斯特拉罕采夫
描述: ATR4S:Scala中带有最新自动术语识别方法的工具包。自动识别的术语广泛用于各种特定领域的文本处理任务,如机器翻译、信息检索或情感分析。然而,对于哪种方法最适合特定的设置,仍然没有达成一致意见,此外,也没有对已经开发的方法进行可靠的比较。我们认为,其中一个主要原因是缺乏最先进的方法实现,而这些方法通常是非平凡的。为了解决这些问题,我们提出了ATR4S,这是一个用Scala编写的开放源码软件,它包含15种以上的自动术语识别(ATR)方法,并实现了从文本文档预处理到术语候选集收集、术语候选评分,最后到术语候选排序的整个流程。它是一个高度可扩展、模块化和可配置的工具,支持自动缓存。我们还比较了7个开放数据集上10种最先进的方法的平均精度和处理时间。实验比较表明,没有一种方法能够证明所有数据集的平均精度都是最佳的,其他可用的ATR工具也不包含最佳的方法。
主页: https://arxiv.org/abs/1611.07804
关键词: 计算与语言;arXiv_cs。;自动术语识别;术语提取;开源软件;斯卡拉
相关软件: 日本;StanfordCoreNLP公司;德塞拉;FlexiTerm公司
引用于: 0个文档

标准条款

1出版物描述软件 年份
ATR4S:Scala中带有最新自动术语识别方法的工具包arXiv公司
N.阿斯特拉罕茨夫
2016