使用R的随机矩阵分解

N.本杰明·埃里克森, 谢尔盖·沃罗宁, 史蒂文·布伦顿, J.内森·库茨

主要文章内容

摘要

矩阵分解是应用数学、统计计算和机器学习领域的基本工具。特别是,低秩矩阵分解非常重要,广泛用于数据分析、降维和数据压缩。然而,海量数据集给传统算法带来了计算挑战,对内存和处理能力都造成了很大的限制。最近,引入了强大的随机性概念,作为减轻计算负载的策略。概率算法的基本思想是利用一定的随机性,从高维数据矩阵中推导出一个较小的矩阵。然后使用较小的矩阵来计算所需的低秩近似。这些算法对于低秩结构矩阵的逼近具有计算效率。我们介绍了R包rsvd,并提供了随机矩阵分解的教程介绍。具体地,讨论了奇异值分解、(稳健)主成分分析、插值分解和CUR分解的随机例程。几个例子演示了这些例程,并显示了与R中实现的其他方法相比的计算优势。

文章详细信息

文章提要栏