开放式访问
2017年8月 相关性下主成分分析的尖锐检测:所有特征值都很重要
埃德加·多布里班
安。统计师。 45(4): 1810-1833 (2017年8月)。 数字对象标识码:10.1214/16-AOS1514

摘要

主成分分析(PCA)是一种广泛使用的降维方法。在高维数据中,与弱主成分(PC)相对应的“信号”特征值不一定与大部分“噪声”特征值分离。因此,基于最大特征值的流行测试对检测弱PC的能力很小。在尖峰模型的特殊情况下,某些测试渐近等价于线性谱统计(LSS)-平均效应全部的最近的研究表明,特征值具有一定的功效。

我们考虑协方差矩阵谱的“局部替代”模型,该模型允许一般的相关结构。我们开发了新的测试来检测此模型中的PC。虽然顶部特征值包含的信息很少,但由于特征值之间的强相关性,我们可以通过使用LSS对所有特征值进行平均来检测弱PC。我们证明,通过求解某个积分方程,可以找到最优LSS。为了求解该方程,我们开发了高效算法,该算法基于我们最近用于计算极限经验谱的方法[Dobriban(2015)]。该方程的可解性也为尖峰模型中的相变提供了一个新的视角。

引用

下载引文

埃德加·多布里班(Edgar Dobriban)。 “相关性下主成分分析的敏锐检测:所有特征值都很重要。” 安。统计师。 45 (4) 1810 - 1833, 2017年8月。 https://doi.org/10.1214/16-AOS1514

问询处

收到日期:2016年2月1日;修订日期:2016年8月1日;发布日期:2017年8月
首次在欧几里得项目中提供:2017年6月28日

zbMATH公司:06773292
数学科学网:MR3670197号
数字对象标识符:10.1214/16-AOS1514

学科:
主要用户:62H25个
次要:45B05型,62H15型

关键词:线性积分方程,线性谱统计量,最佳测试,主成分分析,随机矩阵理论

版权所有©2017数学统计研究所

第45卷•第4期•2017年8月
返回页首