×

使用特征值分析进行潜在语义索引,以实现高效的信息检索。 (英语) Zbl 1122.68047号

摘要:近年来,基于截断奇异值分解的潜在语义索引(LSI)文本检索技术得到了广泛的研究。然而,计算截断SVD所涉及的昂贵复杂性是LSI方法的一个主要缺点。在本文中,我们演示了矩阵秩近似如何影响信息检索系统的有效性。此外,我们提出了一种基于特征值分析的LSI方法的实现,用于秩近似,无需计算截断SVD,并给出了其计算细节。在测试的文档集合中,在保持检索准确性的同时,可以观察到计算时间的显著改进。

MSC公司:

68第20页 信息存储和数据检索
68层35 人工智能语言和软件系统理论(基于知识的系统、专家系统等)
68T05型 人工智能中的学习和自适应系统
15甲18 特征值、奇异值和特征向量

软件:

svd包算法844
PDF格式BibTeX公司 XML格式引用
全文: 欧洲DML