×

TMG公司

swMATH ID: 4180
软件作者: D.泽Impukis;E.加洛普洛斯
描述: TMG:一个用于从文本集合生成术语文档矩阵的MATLAB工具箱。数据挖掘和文本集合信息检索中的大量计算内核都涉及线性代数技术。这些内核通常对以大型稀疏术语文档矩阵(tdm)形式表示的数据进行操作。我们提出了TMG,这是一个研究和教学工具箱,用于从文本集合生成稀疏tdms,并通过添加或删除的方式对这些tdms进行增量修改。工具箱完全用MATLAB编写,MATLAB是一个流行的问题解决环境,在计算线性代数方面功能强大,目的是简化文档预处理和信息检索算法的原型。讨论了与MATLAB稀疏基础设施和数据结构的使用有关的几个设计问题。我们举例说明了该工具在数值探索词干分析和不同的词权重策略对查询和聚类任务性能的影响中的使用
主页: http://rd.springer.com/chapter/10.1007/3-540-28349-8_7
依赖项: Matlab公司
相关软件: Matlab公司JDQZ公司PROPACK公司svd包普里姆拉戈R(右)算法862TETRAD公司ARPACK公司JDQR公司ElemStatLearn(电子状态学习)生物NMF海军陆战队
引用于: 9文件

按年份列出的引文