×

峰值协方差矩阵主成分的统计推断。 (英语) Zbl 1486.62180号

摘要:在本文中,我们研究了高维尖峰样本协方差矩阵的极值特征值和特征向量在超临界情况下的渐近行为,此时可以可靠地检测尖峰。特别地,我们推导了极端特征值和相关特征向量的广义分量的联合分布,即特征向量在任意给定方向上的投影,假设维数和样本量都比较大,联合分布是根据有限多个高斯和卡方变量的线性组合给出的,参数取决于投影方向和尖峰。我们对峰值的假设是完全通用的。首先,尖峰强度只需略高于临界阈值,不需要强度上限。第二,允许多个尖刺,即具有相同强度的尖刺。第三,没有对峰值进行结构性假设。由于一般设置,我们可以将结果应用于各种涉及特征值和特征向量的高维统计假设测试问题。具体而言,我们提出了准确而有力的统计数据,以对主成分进行假设检验。这些统计数据依赖于数据,并适应潜在的真实峰值。数值模拟也证实了我们提出的统计的准确性和强大性,并表明与文献中的现有方法相比,其性能显著提高。特别是,即使在峰值较小或维数较大的情况下,我们的方法也是准确且强大的。

MSC公司:

62H25个 因子分析和主成分;对应分析
60对20 随机矩阵(概率方面)
15甲18 特征值、奇异值和特征向量
15B52号 随机矩阵(代数方面)
62H15型 多元分析中的假设检验
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] 安德森·T·W(2003)。多元统计分析导论,第3版。概率统计中的威利级数新泽西州霍博肯威利·Zbl 1039.62044号
[2] AVELLANEDA,M.、HEALY,B.、PAPANICOLAOU,A.、PAPANCOLAOU,G.和XU,T.(2020年)。美国股票的主要特征投资组合。SSRN提供。
[3] Bai,J.和Ng,S.(2002年)。确定近似因子模型中的因子数。计量经济学70 191-221. ·Zbl 1103.91399号 ·数字对象标识代码:10.1111/1468-0262.00273
[4] BAI,J.和NG,S.(2006年)。评估宏观经济和金融中的潜在因素和观察因素。J.计量经济学131 507-537. ·Zbl 1337.62341号 ·doi:10.1016/j.jeconom.2005.01.015
[5] BAI,J.和NG,S.(2013年)。主成分估计和静态因素识别。J.计量经济学176 18-29. ·Zbl 1284.62350号 ·doi:10.1016/j.jeconom.2013.03.007
[6] BAI,J.和NG,S.(2019年)。近似因子模型的秩正则化估计。J.计量经济学212 78-96. ·Zbl 1452.62405号 ·doi:10.1016/j.jeconom.2019.04.021
[7] BAI,Z.和YAO,J.(2008年)。尖峰种群模型中特征值的中心极限定理。亨利·彭加雷·普罗巴布(Henri PoincaréProbab)安·Inst。斯达。44 447-474. ·Zbl 1274.62129号 ·doi:10.1214/07-AIHP118
[8] Bai,Z.和Yao,J.(2012)。广义加标总体模型中的样本特征值。《多元分析杂志》。106 167-177. ·Zbl 1301.62049号 ·doi:10.1016/j.jmva.2011.10.009
[9] Baik,J.、Ben Arous,G.和Péché,S.(2005)。非零复样本协方差矩阵最大特征值的相变。安·普罗巴伯。33 1643-1697. ·Zbl 1086.15022号 ·doi:10.1214/00911790500000233
[10] Baik,J.和Silverstein,J.W.(2006)。加标总体模型的大样本协方差矩阵的特征值。《多元分析杂志》。97 1382-1408. ·Zbl 1220.15011号 ·doi:10.1016/j.jmva.2005.08.003
[11] BAO,Z.、DING,X.和WANG,K.(2021)。矩阵去噪模型的奇异向量和奇异子空间分布。安。统计师。49 370-392. ·Zbl 1459.60011号 ·doi:10.1214/20-AOS1960
[12] BAO,Z.和WANG,D.(2022)。BBP跃迁临界区的特征向量分布。普罗巴伯。理论相关领域182 399-479. ·Zbl 1482.15036号 ·doi:10.1007/s00440-021-01062-4
[13] BAO,Z.、DING,X.、WANG,J.和WANG,K.(2022)。补充“峰值协方差矩阵主成分的统计推断”https://doi.org/10.1214/21-AOS2143SUPP网站
[14] BELINSCHI,S.T.、BERCOVICI,H.和CAPITAINE,M.(2021)。关于大型独立随机矩阵中多项式的离群特征值。国际数学。Res.否。IMRN公司4 2588-2641. ·Zbl 1471.15031号 ·doi:10.1093/imrn/rnz080
[15] Belinschi,S.T.、Bercovici,H.、Capitaine,M.和Février,M.(2017)。大变形酉不变模型谱中的异常值。安·普罗巴伯。45 3571-3625. ·Zbl 1412.60014号 ·doi:10.1214/16-AOP1144
[16] BENAYCH-GEORGES,F.、GUIONNET,A.和MAIDA,M.(2011)。随机矩阵有限秩变形的极值特征值的涨落。电子。J.概率。16 1621-1662. ·Zbl 1245.60007号 ·doi:10.1214/EJP.v16-929
[17] Benaych-Georges,F.和Nadakuditi,R.R.(2011)。大型随机矩阵的有限低秩扰动的特征值和特征向量。高级数学。227 494-521. ·Zbl 1226.15023号 ·doi:10.1016/j.aim.2011.02.007
[18] Benaych-Georges,F.和Nadakuditi,R.R.(2012)。大型矩形随机矩阵低秩扰动的奇异值和奇异向量。《多元分析杂志》。111 120至135·Zbl 1252.15039号 ·doi:10.1016/j.jmva.2012.04.019
[19] BENIDIS,K.、SUN,Y.、BABU,P.和PALOMAR,D.P.(2016)。正交稀疏PCA和协方差估计(通过Procrustes重新计算)。IEEE传输。信号处理。64 6211-6226. ·Zbl 1414.94069号 ·doi:10.1109/TSP.2016.2605073
[20] Birnbaum,A.、Johnstone,I.M.、Nadler,B.和Paul,D.(2013)。含噪声高维数据的稀疏PCA的极小极大界。安。统计师。41 1055-1084之间·Zbl 1292.62071号 ·doi:10.1214/12-AOS1014
[21] BLOEMENDAL,A.,ERDŐS,L.,KNOWLES,A.,YAU,H.-T.和YIN,J.(2014)。样本协方差和广义Wigner矩阵的各向同性局部律。电子。J.概率。19第33号·Zbl 1288.15044号 ·doi:10.1214/ejp.v19-3054
[22] Bloemendal,A.、Knowles,A.、Yau,H.-T.和Yin,J.(2016)。关于样本协方差矩阵的主成分。普罗巴伯。理论相关领域164 459-552. ·Zbl 1339.15023号 ·doi:10.1007/s00440-015-0616-x
[23] BLOEMENDAL,A.和VIRáG,B.(2013年)。加标随机矩阵的极限I。普罗巴伯。理论相关领域156 795-825·Zbl 1356.60014号 ·doi:10.1007/s00440-012-0443-2
[24] BLOEMENDAL,A.和VIRáG,B.(2016年)。加标随机矩阵的极限2。安·普罗巴伯。44 2726-2769. ·Zbl 1396.60004号 ·doi:10.1214/15-AOP1033
[25] Bun,J.、Bouchaud,J.-P.和Potters,M.(2017年)。清理大相关矩阵:来自随机矩阵理论的工具。物理学。代表。666 1-109. ·Zbl 1359.15031号 ·doi:10.1016/j.physrep.2016.10.005
[26] CAPITAINE,M.(2018)。尖峰信息plus-noise型矩阵离群值的限制特征向量。概率标准XLIX.数学课堂笔记。2215 119-164. 查姆施普林格·Zbl 1451.15022号
[27] CAPITAINE,M.和DONATI-MARTIN,C.(2021)。Wigner矩阵块对角变形离群特征向量涨落的非普适性。ALEA Lat.Am.J.Probab公司。数学。斯达。18 129-165. ·Zbl 1456.15033号 ·doi:10.30757/alea.v18-07
[28] Capitaine,M.、Donati Martin,C.和Féral,D.(2009年)。大维格纳矩阵有限秩变形的最大特征值:涨落的收敛性和非均匀性。安·普罗巴伯。37 1-47. ·Zbl 1163.15026号 ·doi:10.1214/08-AOP394
[29] CAPITAINE,M.、DONATI-MARTIN,C.和FERAL,D.(2012年)。Wigner矩阵变形特征值的中心极限定理。亨利·彭加雷·普罗巴布(Henri PoincaréProbab)安·Inst。斯达。48 107-133. ·Zbl 1237.60007号 ·doi:10.1214/10-AIHP410
[30] 丁欣(2020)。高维变形矩形矩阵及其在矩阵去噪中的应用。伯努利26 387-417. ·Zbl 1439.15013号 ·doi:10.3150/19-BEJ1129
[31] 丁晓和杨凤(2021)。尖峰可分协方差矩阵和主成分。安。统计师。49 1113-1138. ·Zbl 1469.15035号 ·doi:10.1214/20-aos1995
[32] 丁晓川和季海川(2020)。随机矩阵乘法和尖峰不变模型的局部律。网址:arXiv:2010.16083。
[33] Dobriban,E.(2017)。相关性下主成分分析中的尖锐检测:所有特征值都很重要。安。统计师。45 1810-1833. ·兹比尔1486.62182 ·doi:10.1214/16-AOS1514
[34] DOBRIBAN,E.(2020年)。因子分析和主成分分析的排列方法。安。统计师。48 2824-2847. ·Zbl 1460.62093号 ·doi:10.1214/19-AOS1907
[35] Dobriban,E.和Owen,A.B.(2019年)。确定性平行分析:一种改进的因子和主成分选择方法。J.R.统计社会服务。B.统计方法。81 163-183. ·兹比尔1407.62216
[36] Donoho,D.、Gavish,M.和Johnstone,I.(2018年)。尖峰协方差模型中特征值的最优收缩。安。统计师。46 1742-1778. ·Zbl 1403.62099号 ·doi:10.1214/17-AOS1601
[37] Erdős,L.、Knowles,A.和Yau,H.-T.(2013)。随机带矩阵解的平均波动。安·亨利·彭卡14 1837-1926. ·Zbl 1296.15020号 ·doi:10.1007/s00023-013-0235-y
[38] FAN,J.、FAN,Y.、HAN,X.和LV,J.(2019年)。大随机矩阵特征向量的渐近理论。可从arXiv:1902.06846获取。
[39] Fan,J.、Liao,Y.和Mincheva,M.(2011)。近似因子模型中的高维协方差矩阵估计。安。统计师。39 3320-3356. ·Zbl 1246.62151号 ·doi:10.1214/11-AOS944
[40] FAWCETT,T.(2006)。ROC分析简介。模式识别。莱特。27 861-874.
[41] Féral,D.和Péché,S.(2007年)。大维格纳矩阵秩一变形的最大特征值。通信数学。物理学。272 185-228. ·兹比尔1136.82016 ·doi:10.1007/s00220-007-0209-3
[42] Hallin,M.、Paindaveine,D.和Verdebout,T.(2010年)。主要成分的最优等级测试。安。统计师。38 3245-3299. ·Zbl 1373.62295号 ·doi:10.1214/10-AOS810
[43] JAMES,G.、WITTEN,D.、HASTIE,T.和TIBSHIRANI,R.(2013)。统计学习导论:应用程序在R中.统计学中的施普林格文本103.纽约斯普林格·Zbl 1281.62147号 ·doi:10.1007/978-1-4614-7138-7
[44] JOHNSTONE,I.和YANG,J.(2018)。关于非高斯数据尖峰协方差模型样本特征结构的渐近性的注记。可在arXiv:11810.10427购买。
[45] Johnstone,I.M.(2001)。关于主成分分析中最大特征值的分布。安。统计师。29 295-327. ·Zbl 1016.62078号 ·doi:10.1214/aos/1009210544
[46] Johnstone,I.M.和Lu,A.Y.(2009年)。高维主成分分析的一致性和稀疏性。J.Amer。统计师。协会。104 682-693. ·Zbl 1388.62174号 ·doi:10.1198/jasa.2009.0121
[47] JOLLIFFE,I.T.(2002)。主成分分析,第2版。统计学中的斯普林格系列纽约州施普林格·Zbl 1011.62064号
[48] KE,Z.、MA,Y.和LIN,X.(2020)。通过整体特征值匹配分析估计协方差矩阵中尖峰特征值的数量。ArXiv预印本。可从ArXiv:2006.00436获得。
[49] Knowles,A.和Yin,J.(2013)。Wigner矩阵的各向同性半圆定律和变形。普通纯应用程序。数学。66 1663-1750. ·Zbl 1290.60004号 ·doi:10.1002/cpa.21450
[50] KNOWLES,A.和YIN,J.(2014)。变形Wigner矩阵的异常值。安·普罗巴伯。42 1980-2031. ·Zbl 1306.15034号 ·doi:10.1214/13-AOP855
[51] Knowles,A.和Yin,J.(2017)。随机矩阵的各向异性局部律。普罗巴伯。理论相关领域169 257-352. ·Zbl 1382.15051号 ·doi:10.1007/s00440-016-0730-4
[52] KOLTCHINSKII,V.和LOUNICI,K.(2017年)。主成分分析中的新渐近结果。Sankhya A公司79 254-297. ·Zbl 06822893号 ·doi:10.1007/s13171-017-0106-6
[53] LAMBERT,Z.V.、WILDT,A.R.和DURAND,R.M.(1991)。因子载荷的近似置信区间。多变量。行为。物件。26 421-434。
[54] 李忠、韩凤和姚杰(2020)。广义尖峰种群模型中大样本协方差矩阵的极值和迹的渐近联合分布。安。统计师。48 3138-3160. ·Zbl 1465.62045号 ·doi:10.1214/19-AOS1882
[55] LOUBATON,P.和VALLET,P.(2011年)。高斯信息加噪声模型中特征值的几乎确定局部化——应用于尖峰模型。电子。J.概率。16 1934-1959. ·Zbl 1245.15039号 ·doi:10.1214/EJP.v16-943
[56] Ma,Z.(2013)。稀疏主成分分析和迭代阈值。安。统计师。41 772-801. ·兹比尔1267.62074 ·doi:10.1214/13-AOS1097
[57] MONASSON,R.和VILLAMAINA,D.(2015)。从相关矩阵的所有经验特征向量估计其主成分。欧罗普提斯。莱特。112 50001.
[58] MORALES-JIMENEZ,D.、JOHNSTONE,I.M.、MCKAY,M.R.和YANG,J.(2021)。高维尖峰模型样本相关矩阵特征结构的渐近性。统计师。西尼卡31 571-601. ·Zbl 1469.62267号 ·doi:10.5705/ss.20
[59] NADAKUDITI,R.R.和EDELMAN,A.(2008)。白噪声中基于样本特征值的高维信号检测,使用相对较少的样本。IEEE传输。信号处理。56 2625-2638·Zbl 1390.94567号 ·doi:10.1109/TSP.2008.917356
[60] NADAKUDITI,R.R.和SILVERSTEIN,J.W.(2010)。基于样本广义特征值检测噪声中信号的基本极限,使用相对较少的含信号和仅含噪声样本。IEEE J.选择。顶部。信号处理。4 468-480.
[61] Nadler,B.(2008)。主成分分析的有限样本近似结果:矩阵摄动方法。安。统计师。36 2791-2817. ·Zbl 1168.62058号 ·doi:10.1214/08-AOS618
[62] NADLER,B.和JOHNSTONE,I.M.(2011)。噪声协方差矩阵为任意时Roy最大根检验的检测性能。2011年IEEE统计信号处理研讨会681-684。
[63] NAUMOV,A.、SPOKOINY,V.和ULYANOV,V.(2019年)。样本协方差谱投影仪的自举置信集。普罗巴伯。理论相关领域174 1091-1132. ·Zbl 1420.62073号 ·doi:10.1007/s00440-018-0877-2
[64] ONATSKI,A.(2009)。测试大因子模型中因子数量的假设。计量经济学77 1447-1479. ·Zbl 1182.62180号 ·doi:10.3982/ECTA6964
[65] Onatski,A.(2012)。具有弱影响因子的大因子模型主成分估计的渐近性。J.计量经济学168 244-258. ·Zbl 1443.62497号 ·doi:10.1016/j.jeconom.2012.01.034
[66] Onatski,A.、Moreira,M.J.和Hallin,M.(2013)。高维数据球形度测试的渐近能力。安。统计师。41 1204-1231. ·Zbl 1293.62125号 ·doi:10.1214/13-AOS1100
[67] ONATSKI,A.、MOREIRA,M.J.和HALLIN,M.(2014)。高维信号检测:多尖点情况。安。统计师。42 225-254. ·Zbl 1296.62123号 ·doi:10.1214/13-AOS1181
[68] OORT,F.J.(2011)。探索性因子分析中基于似然的置信区间。结构。埃克。模型。18 383-396. ·doi:10.1080/10705511.2011.582009
[69] Passmier,D.和Yao,J.(2014)。在高维情况下,峰值数量的估计,可能相等。《多元分析杂志》。127 173-183. ·Zbl 1293.62044号 ·doi:10.1016/j.jmva.2014.02.017
[70] Paul,D.(2007年)。大维尖峰协方差模型样本特征结构的渐近性。统计师。西尼卡17 1617-1642年·Zbl 1134.62029号
[71] Péché,S.(2006年)。埃尔米特随机矩阵的小秩扰动的最大特征值。普罗巴伯。理论相关领域134 127-173. ·Zbl 1088.15025号 ·doi:10.1007/s00440-005-0466-z
[72] Perry,A.、Wein,A.S.、Bandeira,A.S.和Moitra,A.(2018年)。PCA I的最优性和次最优性:尖峰随机矩阵模型。安。统计师。46 2416-2451. ·Zbl 1404.62065号 ·doi:10.1214/17-AOS1625
[73] PIZZO,A.、RENFREW,D.和SOSHNIKOV,A.(2013)。关于Wigner矩阵的有限秩变形。亨利·庞加莱研究所Probab。斯达。49 64-94. ·Zbl 1278.60014号 ·doi:10.1214/11-AIHP459
[74] SHEN,H.和HUANG,J.Z.(2008)。基于正则化低秩矩阵逼近的稀疏主成分分析。《多元分析杂志》。99 1015-1034. ·Zbl 1141.62049号 ·doi:10.1016/j.jmva.2007.06.007
[75] SILIN,I.和FAN,J.(2020年)。协方差矩阵特征空间的假设检验。可从arXiv:2020.09810获得。
[76] SILIN,I.和SPOKOINY,V.(2018年)。协方差矩阵谱投影的贝叶斯推断。电子。J.统计。12 1948-1987. ·Zbl 1406.62064号 ·doi:10.1214/18-EJS1451
[77] TYLER,D.E.(1981)。特征向量的渐近推断。安。统计师。9 725-736. ·Zbl 0474.62051号
[78] TYLER,D.E.(1983年)。主分量向量的一类渐近检验。安。统计师。11 1243-1250. ·Zbl 0544.62053号 ·doi:10.1214/aos/1176346337
[79] Xi,H.、Yang,F.和Yin,J.(2020年)。样本协方差矩阵特征向量经验谱分布的收敛性。安。统计师。48 953-982. ·兹比尔1447.15033 ·doi:10.1214/19-AOS1832
[80] YAMAMOTO,H.、FUJIMORI,T.、SATO,H.,ISHIKAWA,G.、KAMI,K.和OHASHI,Y.(2014)。主成分分析中因子负荷的统计假设检验及其在代谢物集富集分析中的应用。BMC生物信息。15 51.
[81] 杨凤(2020)。各向异性样本协方差矩阵特征向量的线性谱统计。可从arXiv:2005.00999获取。
[82] ZOU,H.、HASTIE,T.和TIBSHIRANI,R.(2006)。稀疏主成分分析。J.计算。图表。统计师。15 265-286 ·doi:10.1198/106186006X113430
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。