×

潜在语义分析和Fiedler检索。 (英语) Zbl 1108.68045号

摘要:潜在语义分析(LSA)是一种基于奇异值分解的信息检索和处理方法。它具有几何解释,其中对象(例如文档和关键字)放置在低维几何空间中。在本文中,我们导出了一种替代的代数/几何方法,用于在空间中放置对象,以便于信息分析。我们表明,我们的方法与LSA密切相关,并且对于特定的缩放参数选择基本等效。然后我们展示了我们的方法支持一些现有LSA方法无法处理的泛化和扩展。

MSC公司:

68第20页 信息存储和数据检索
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] C.J.Alpert,S.-Z.Yao,《谱划分:特征向量越多越好》,载于:《年度ACM设计自动化会议论文集》,1995年,第195-200页。;C.J.Alpert,S.-Z.Yao,《谱划分:特征向量越多越好》,载于《美国计算机学会设计自动化年会论文集》,1995年,第195-200页。
[2] 巴特尔,B.T。;科特雷尔,G.W。;Belew,R.K.,《潜在语义索引是多维尺度的最佳特例》(ACM SIGIR信息检索研究与开发年度国际会议论文集(1992),ACM),161-167
[3] 贝尔金,M。;Niyogi,P.,用于降维和数据表示的拉普拉斯特征映射,神经计算,151373-1396(2003)·兹比尔1085.68119
[4] 贝里,M。;Browne,M.,《理解搜索引擎:数学建模和文本检索》(1999),SIAM:SIAM Philadelphia·Zbl 0996.68500号
[5] 贝里,M。;Drmac,Z.博士。;Jessup,E.,矩阵、向量空间和信息检索,SIAM Rev.,41,335-362(1999)·Zbl 0924.68069号
[6] 贝里,M。;Dumais,S。;O'Brien,G.,《使用线性代数进行智能信息检索》,SIAM Rev.,37,573-595(1995)·Zbl 0842.68026号
[7] M.W.Berry,SVDPACK:稀疏奇异值分解的Fortran-77软件库,技术报告CS-92-159,田纳西大学,诺克斯维尔,TN,1992年6月。;M.W.Berry,SVDPACK:稀疏奇异值分解的Fortran-77软件库,技术报告CS-92-159,田纳西州诺克斯维尔田纳西大学,1992年6月。
[8] Berry,M.W。;亨德里克森,B。;Raghavan,P.,浏览超文本的稀疏矩阵重新排序方案,(应用数学讲座,第32卷(1996),AMS),99-123·Zbl 0857.68036号
[9] Deerwester,S.公司。;Dumais,S。;Furnas,G。;Landauer,T。;Harshman,R.,《潜在语义分析索引》,J.Am.Soc.Inform。科学。,41, 391-407 (1990)
[10] Dhillon,I.S.,使用二部谱图划分对文档和单词进行共聚类,(第七届知识发现和数据挖掘国际会议论文集(2001),ACM)
[11] Fiedler,M.,图的代数连通性,捷克。数学。J.,23,298-305(1973)·Zbl 0265.05119号
[12] Fiedler,M.,非负对称矩阵特征向量的一个性质及其在图论中的应用,捷克。数学。J.,25,619-633(1975)·Zbl 0437.15004号
[13] 亨德里克森,B。;Leland,R.,用于映射并行计算的改进谱图分割算法,SIAM J.Sci。计算。,16, 452-469 (1995) ·Zbl 0816.68093号
[14] 朱万,M。;Mohar,B.,图的最优线性标号和特征值,离散应用。数学。,36, 153-168 (1992) ·Zbl 0759.05087号
[15] T.G.Kolda,B.W.Bader,J.P.Kenny,使用多线性代数进行高阶网络链接分析,收录于:IEEE数据挖掘国际会议论文集,2005年11月。;T.G.Kolda,B.W.Bader,J.P.Kenny,《使用多线性代数的高阶网络链接分析》,载于:《IEEE国际数据挖掘会议论文集》,2005年11月。
[16] Lehoucq,R.B。;索伦森特区。;Yang,C.,《ARPACK用户指南:用隐式重启Arnoldi方法解决大规模特征值问题》(1998),SIAM:SIAM Philadelphia,PA·兹比尔0901.65021
[17] 牛顿,M.C。;O.Sykora。;Vrto,I.,2边二分叉数的两种新启发式方法,(第十届国际制图研讨会论文集。第十届国际制图研讨会论文集,计算机科学讲义,2528(2002),施普林格),312-319·Zbl 1037.68594号
[18] Salton,G。;McGill,M.,《现代信息检索导论》(1983年),McGraw-Hill:McGraw-Shill纽约·Zbl 0523.68084号
[19] D.A.Spielman,S.-H.Teng,用于图划分、图稀疏化和求解线性系统的近线性时间算法,收录于:ACM计算理论研讨会论文集,2004年,第81-90页。;D.A.Spielman,S.-H.Teng,用于图划分、图稀疏化和求解线性系统的近线性时间算法,收录于:ACM计算理论研讨会论文集,2004年,第81-90页·Zbl 1192.65048号
[20] Stüben,K.,《代数多重网格综述》,J.Compute。申请。数学。,128, 281-309 (2001) ·Zbl 0979.65111号
[21] 查,H。;何,X。;丁,C。;顾,M。;Simon,H.,二部图划分和数据聚类,(第十届信息和知识管理国际会议论文集(2001),ACM)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。