×

基于交叉数据矩阵的PCA的扰动理论。 (英语) Zbl 1493.62325号

摘要:主成分分析(PCA)一直是一种有用且重要的降维工具。然而,在某些情况下,如高维和小样本量,必须小心使用此方法。一般来说,具有大样本量或大信噪比的低维对保证主成分分析获得的主要特征值和特征向量的一致性至关重要。基于交叉数据矩阵(CDM)的主成分分析是另一种估计主成分分析分量的方法,通过将数据拆分为两个子集,并计算相应协方差矩阵的叉积的奇异值分解。研究表明,基于CDM的主成分分析对于主要特征值和特征向量具有比普通主成分分析更广的一致性区域。虽然一致性区域的差异已经得到了很好的研究,但一个有趣的实际问题和理论问题是,它们在特征值和特征向量估计方面如何不同,特别是对于两者都位于同一一致性区域中的情况。在本文中,我们通过矩阵扰动导出了基于CDM的PCA的有限样本近似结果以及渐近行为。此外,我们还导出了基于CDM的PCA与普通PCA的比较度量。此度量仅取决于数据维度、噪声相关性和噪声信号比(NSR)。利用这个度量,我们开发了一个算法,该算法选择好的分区,并将这些好分区的结果进行集成,以形成基于CDM的主成分分析的最终估计。文中给出了数值和实际数据示例。

MSC公司:

62甲12 多元分析中的估计
2012年12月62日 参数估计量的渐近性质
62H25个 因子分析和主要成分;对应分析
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Ahn,J。;Marron,J.S。;穆勒,K.M。;Chi,Y.Y.,高维、低样本量的几何表示在温和条件下成立,Biometrika,94760-766(2007)·Zbl 1135.62039号
[2] Anderson,T.W.,主成分分析的渐近理论,《数学年鉴》。Stat.,34,122-148(1963)·Zbl 0202.49504号
[3] M.青岛。;沈,D。;沈,H。;Yata,K。;Zhou,Y.H。;Marron,J.S.,《高维低样本量渐近性调查》,澳大利亚。N.Z.J.Stat.,60,4-19(2018)·Zbl 1462.62368号
[4] Baik,J。;Ben Arous,G。;Péché,S.,非零复样本协方差矩阵最大特征值的相变,Ann.Probab。,33, 1643-1697 (2005) ·Zbl 1086.15022号
[5] 霍尔,P。;Marron,J.S。;Neeman,A.,《高维低样本数据的几何表示》,J.R.Stat.Soc.Ser。B、 67427-444(2005)·Zbl 1069.62097号
[6] Johnstone,I.M.,《关于主成分分析中最大特征值的分布》,《Ann.Stat.》,295-327(2001)·Zbl 1016.62078号
[7] 约翰斯通,I.M。;Lu,A.Y.,《关于高维主成分分析的一致性和稀疏性》,美国统计协会,104,682-693(2009)·兹比尔1388.62174
[8] Katsevich,E。;Katsevich,A。;Singer,A.,低温电磁异质性问题的协方差矩阵估计,SIAM J.成像科学。,8, 126-185 (2015) ·兹比尔1362.92036
[9] Kibria,B.G。;Joarder,A.H.,《多元t分布的简短回顾》,《统计研究杂志》,40,59-72(2006)
[10] Nadler,B.,《主成分分析的有限样本近似结果:矩阵摄动法》,《Ann.Stat.》,362791-2817(2008)·Zbl 1168.62058号
[11] Paul,D.,大维尖峰协方差样本特征结构的渐近性,统计学家。Sinica,17,1617-1642(2007)·Zbl 1134.62029号
[12] 沈,D。;沈,H。;朱,H。;Marron,J.S.,《高维低样本量渐近的统计学和数学》,统计学家。Sinica,26,1747-1770(2016)·Zbl 1356.62077号
[13] Tipping,M.E。;Bishop,C.M.,概率主成分分析,J.R.Stat.Soc.Ser。B、 61、611-622(1999)·Zbl 0924.62068号
[14] Tyler,D.E.,《多根局部替代下主成分根的渐近分布》,《Ann.Stat.》,11232-1242(1983)·Zbl 0546.62007号
[15] Wang,S.-H。;黄,S.-Y。;Chen,T.-L.,高维低样本下基于交叉数据矩阵的主成分分析的渐近正态性,多元分析杂志。,175 (2020) ·Zbl 1437.62221号
[16] 姚,J。;郑S。;Bai,Z.D.,《样本协方差矩阵和高维数据分析》(2015),剑桥大学出版社·Zbl 1380.62011年
[17] Yata,K。;Aoshima,M.,非高斯数据在高维、低样本量背景下的PCA一致性,Commun。统计-理论方法,38,2634-2652(2009)·Zbl 1175.62060号
[18] Yata,K。;Aoshima,M.,利用交叉数据矩阵的奇异值分解对高维、低样本数据进行有效主成分分析,J.多元分析。,101, 2060-2077 (2010) ·Zbl 1203.62112号
[19] Yata,K。;Aoshima,M.,《通过几何表示降低噪声的高维低样本数据的有效主成分分析》,《多元分析杂志》。,105, 193-215 (2012) ·Zbl 1236.62065号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。