TMG公司 swMATH ID: 4180 软件作者: D.泽Impukis;E.加洛普洛斯 描述: TMG:一个用于从文本集合生成术语文档矩阵的MATLAB工具箱。数据挖掘和文本集合信息检索中的大量计算内核都涉及线性代数技术。这些内核通常对以大型稀疏术语文档矩阵(tdm)形式表示的数据进行操作。我们提出了TMG,这是一个研究和教学工具箱,用于从文本集合生成稀疏tdms,并通过添加或删除的方式对这些tdms进行增量修改。工具箱完全用MATLAB编写,MATLAB是一个流行的问题解决环境,在计算线性代数方面功能强大,目的是简化文档预处理和信息检索算法的原型。讨论了与MATLAB稀疏基础设施和数据结构的使用有关的几个设计问题。我们举例说明了该工具在数值探索词干分析和不同的词权重策略对查询和聚类任务性能的影响中的使用 主页: http://rd.springer.com/chapter/10.1007/3-540-28349-8_7 依赖项: Matlab公司 相关软件: Matlab公司;JDQZ公司;PROPACK公司;svd包;普里姆;拉戈;R(右);算法862;TETRAD公司;ARPACK公司;JDQR公司;ElemStatLearn(电子状态学习);生物NMF;海军陆战队 引用于: 9文件 全部的 前5名24位作者引用 2 朱、穆 1 克里斯托斯·布特西迪斯 1 蔡瑞初 1 巴勃罗·德·卡斯特罗。 1 de França,Fabrício O。 1 Daniel M.Dunlavy。 1 哈密尔顿·M·费雷拉。 1 大卫·弗里茨彻 1 埃夫斯特拉蒂奥斯·加洛普洛斯 1 阿里·戈德西 1 郝志峰 1 W.Philip Kegelmeyer 1 塔玛拉·吉布森·科尔达 1 亚历山大·拉弗拉米·桑德斯 1 沃尔克·梅尔曼 1 巴勒莫·科埃略(Guilherme Palermo Coelho) 1 优素福·萨阿德 1 托尼·C·斯科特。 1 丹尼尔·斯泽尔德(Daniel B.Szyld)。 1 马都苏丹·塞拉尼 1 尤金·维查林斯基 1 埃琳娜·维尼克 1 冯·祖本,费尔南多·何塞 1 张振杰 全部的 前5名7篇连载文章中引用 2 模式识别 1 SIAM矩阵分析与应用杂志 1 神经网络 1 计算统计与数据分析 1 ETNA公司。数值分析电子交易 1 自然计算 1 数学 全部的 前5名在9个字段中引用 4 计算机科学(68至XX) 三 统计学(62-XX) 2 线性代数和多线性代数;矩阵理论(15-XX) 2 数值分析(65-XX) 1 组合数学(05-XX) 1 概率论与随机过程(60-XX) 1 量子理论(81-XX) 1 运筹学、数学规划(90-XX) 1 博弈论、经济学、金融和其他社会和行为科学(91-XX) 按年份列出的引文