伊恩·约翰斯通。;卢、余亚瑟 高维主成分分析的一致性和稀疏性。 (英语) Zbl 1388.62174号 美国统计协会。 104,编号486,682-693(2009). 摘要:主成分分析(PCA)是一种经典的数据降维方法,它以变量向量的观测值(或案例)的形式表示。当代数据集通常具有与(n)相当甚至更大的(p)。在这种情况下,我们的主要主张是:(a)在对主模式进行任何PCA类型搜索之前,需要对维数进行一些初始降低;(b)在信号具有稀疏表示的基础上工作,可以最好地实现维数的初始降低。我们描述了一个简单的渐近模型,其中通过标准PCA对主成分向量的估计是一致的当且仅当(p(n)/n到0)。我们提供了一个简单的算法来选择具有最大样本方差的坐标子集,并证明了如果对所选子集进行PCA,那么即使是(p(n)\gg n),也可以恢复一致性。 引用于4评论引用于199文件 理学硕士: 62H25个 因子分析和主成分;对应分析 关键词:特征向量;尺寸缩减;正规化;阈值化 PDF格式BibTeX公司 XML格式引用 \textit{I.M.Johnstone}和\textit{A.Y.Lu},J.Am.Stat.Assoc.104,No.486,682--693(2009;Zbl 1388.62174) 全文: 内政部 链接