×

高维主成分分析的一致性和稀疏性。 (英语) Zbl 1388.62174号

摘要:主成分分析(PCA)是一种经典的数据降维方法,它以变量向量的观测值(或案例)的形式表示。当代数据集通常具有与(n)相当甚至更大的(p)。在这种情况下,我们的主要主张是:(a)在对主模式进行任何PCA类型搜索之前,需要对维数进行一些初始降低;(b)在信号具有稀疏表示的基础上工作,可以最好地实现维数的初始降低。我们描述了一个简单的渐近模型,其中通过标准PCA对主成分向量的估计是一致的当且仅当(p(n)/n到0)。我们提供了一个简单的算法来选择具有最大样本方差的坐标子集,并证明了如果对所选子集进行PCA,那么即使是(p(n)\gg n),也可以恢复一致性。

理学硕士:

62H25个 因子分析和主成分;对应分析
PDF格式BibTeX公司 XML格式引用
全文: 内政部 链接