×

大型Gram型矩阵谱分解的非症状特性及其应用。 (英语) Zbl 07526582号

摘要:革兰氏矩阵及其谱分解对于统计学、应用数学、物理学和机器学习中的许多问题都具有重要意义。在本文中,我们仔细研究了当数据不一定独立时,大型Gram型矩阵谱分解的非渐近性质。具体来说,我们导出了右Gram矩阵的特征向量与它们的种群对应项之间偏差的指数尾界,以及这些偏差的Berry-Esseen型界。我们还获得了左Gram矩阵(即样本协方差矩阵)的特征值与它们的总体对应值之比的非渐近尾界,而与数据矩阵的大小无关。在一系列应用中进一步证明了所记录的非渐近性质,包括因子模型和相关机器学习问题中潜在因子估计数的非渐近特征,高维时间序列的估计和预测,大样本协方差矩阵的谱特性,如摄动界和谱投影的推断,以及使用相关数据进行低秩矩阵去噪。

MSC公司:

62华夏 多元分析
60传真 概率论中的极限定理
62埃克斯 统计分布理论

软件:

农场测试
PDF格式BibTeX公司 XML格式引用
全文: 内政部 链接

参考文献:

[1] Adamczak,R.、Litvak,A.、Pajor,A.和Tomczak-Jaegermann,N.(2010年)。对数压缩系综中经验协方差矩阵收敛性的定量估计。J.艾默。数学。Soc公司。23 535-561. ·Zbl 1206.60006号
[2] Ahn,S.C.和Horenstein,A.R.(2013)。因子数的特征值比检验。计量经济学81 1203-1227. ·Zbl 1274.62403号 ·doi:10.3982/ECTA8968
[3] Ahn,S.C.、Lee,Y.H.和Schmidt,P.(2001)。具有时变个体效应的线性面板数据模型的GMM估计。J.计量经济学101 219-255. ·Zbl 0966.62091号
[4] Anderson,T.W.(1962)。多元统计分析导论纽约:Wiley。
[5] T.W.安德森(1963)。主成分分析的渐近理论。安。数学。斯达。34 122-148. ·Zbl 0202.49504号
[6] Anderson,T.W.和Rubin,H.(1956年)。因子分析中的统计推断。第三届伯克利数理统计与概率研讨会论文集,卷5:对计量经济学、工业研究和心理测量学的贡献111-150. 加州大学出版社·Zbl 0070.14703号
[7] Athreya,K.B.和Lahiri,S.N.(2006年)。测度论与概率论纽约:Springer·Zbl 1130.60001号
[8] Bai,J.(2003)。大维度因子模型的推理理论。计量经济学71 135-171之间·Zbl 1136.62354号 ·数字对象标识代码:10.1111/1468-0262.00392
[9] Bai,J.(2009)。具有交互式固定效果的面板数据模型。计量经济学77 1229-1279. ·Zbl 1183.62196号 ·doi:10.3982/ECTA6135
[10] Bai,J.和Li,K.(2014)。具有交互效应的面板数据模型的理论和方法。安。统计师。42 142-170. ·Zbl 1331.62112号 ·doi:10.1214/13-AOS1183
[11] Bai,J.和Ng,S.(2002年)。确定近似因子模型中的因子数。计量经济学70 191-221. ·Zbl 1103.91399号 ·数字对象标识代码:10.1111/1468-0262.00273
[12] Bai,J.和Ng,S.(2008年)。大维度因素分析。发现经济趋势。3 89-163.
[13] Bai,J.和Ng,S.(2013年)。主成分估计和静态因素识别。J.计量经济学176 18-29. ·Zbl 1284.62350号 ·doi:10.1016/j.jeconom.2013.03.007
[14] Bai,Z.、Choi,K.P.和Fujikoshi,Y.(2018年)。在高维主成分分析中,AIC和BIC在估计重要成分数量方面的一致性。安。统计师。46 1050-1076. ·Zbl 1395.62119号
[15] Bai,Z.和Silverstein,J.W.(2010年)。大维随机矩阵的谱分析纽约:Springer·Zbl 1301.60002号
[16] Bai,Z.和Yin,Y.(1993)。大维样本协方差矩阵最小特征值的极限。安·普罗巴伯。21 1275-1294. ·Zbl 0779.60026号 ·doi:10.1214操作/1176989118
[17] Bai,Z.,Yin,Y.和Krishnaiah,P.R.(1986年)。当基本分布是各向同性时,关于两个随机矩阵乘积的极限谱分布。《多元分析杂志》。19 189-200. ·Zbl 0657.62058号
[18] Bai,Z.,Yin,Y.和Krishnaiah,P.R.(1988年)。关于多元矩阵特征值的极限经验分布函数。理论问题。申请。32 490-500·Zbl 0676.62021号
[19] Baik,J.、Arous,G.B.和Péché,S.(2005)。非零复样本协方差矩阵最大特征值的相变。安·普罗巴伯。33 1643-1697. ·兹比尔1086.15022
[20] Bartholomew,D.J.、Knott,M.和Moustaki,I.(2011年)。潜在变量模型与因子分析:统一的方法纽约:Wiley·Zbl 1266.62040号
[21] Bialecki,B.和Fairweather,G.(1995年)。可分离椭圆边值问题正交样条配置中的矩阵分解算法。SIAM J.科学。计算。16 330-347. ·Zbl 0820.65009号
[22] Bickel,P.J.和Levina,E.(2008)。通过阈值进行协方差正则化。安。统计师。36 2577-2604. ·Zbl 1196.62062号 ·doi:10.1214/08-AOS600
[23] Bickel,P.J.和Levina,E.(2008)。大协方差矩阵的正则化估计。安。统计师。36 199-227. ·Zbl 1132.62040号
[24] Bien,J.、Bunea,F.和Xiao,L.(2016)。协方差矩阵的凸带。J.艾默。统计师。协会。111 834-845. ·doi:10.1080/01621459.2015.1058265
[25] Bobkov,S.G.、Chistyakov,G.和Götze,F.(2018年)。典型加权和的Berry-Esseen界。电子。J.概率。23. ·Zbl 1414.60012号
[26] Bobkov,S.G.和Chistyakov,G.P.(2015)。关于随机变量的集中函数。J.理论。普罗巴伯。28 976-988. ·Zbl 1339.60011号
[27] Brockwell,P.J.、Davis,R.A.和Fienberg,S.E.(1991年)。时间序列:理论与方法:理论与方法纽约:Springer·Zbl 0709.62080号
[28] Bühlmann,P.和Künsch,H.R.(1999)。时间序列引导中的块长度选择。计算。统计师。数据分析。31 295-310. ·兹比尔1061.62528
[29] Bunea,F.和Xiao,L.(2015)。降阶有效秩总体矩阵的样本协方差矩阵估计及其在fPCA中的应用。伯努利21 1200-1230. ·Zbl 1388.62173号 ·doi:10.3150/14-BEJ602
[30] Cai,T.、Han,X.和Pan,G.(2020年)。样本协方差矩阵的发散峰值特征值和最大非峰值特征值的极限律。安。统计师。48 1255-1280. ·Zbl 1456.62113号
[31] Cai,T.、Liu,W.和Xia,Y.(2013)。双样本协方差矩阵测试,支持高维和稀疏设置中的恢复。J.艾默。统计师。协会。108 265至277页·Zbl 06158341号 ·doi:10.1080/01621459.2012.758041
[32] Cai,T.和Zhang,A.(2016)。不完全数据下高维协方差矩阵的极小极大率最优估计。《多元分析杂志》。150 55-74. ·Zbl 1347.62088号
[33] Callaert,H.和Janssen,P.(1978年)。(U)统计量的Berry-Esseen定理。安。统计师。6 417-421. ·Zbl 0393.60022号
[34] Chamberlain,G.和Rothschild,M.(1983年)。大型资产市场的套利、因子结构和均值-方差分析。计量经济学51 1281-1304. ·Zbl 0523.90017号 ·doi:10.2307/1912275
[35] Chan,Y.-K.和Wierman,J.(1977年)。关于(U)-统计量的Berry-Esseen定理。安·普罗巴伯。5 136-139. ·Zbl 0381.60022号
[36] Chen,L.,Wang,W.和Wu,W.B.(2021)。具有结构突变的动态半参数因子模型。J.总线。经济。统计师。39 757-771. ·doi:10.1080/07350015.2020.1730857
[37] Chen,L.H.和Shao,Q.-M.(2004)。局部依赖下的正规近似。安·普罗巴伯。32 1985-2028. ·Zbl 1048.60020号
[38] Chen,L.H.和Shao,Q.-M.(2007)。使用浓度不等式方法的非线性统计的正态近似。伯努利13 581-599. ·兹比尔1146.62310
[39] Chen,X.、Womersley,R.S.和Ye,J.J.(2011)。最小化Gram矩阵的条件数。SIAM J.Optim公司。21 127-148. ·Zbl 1220.65055号
[40] Choi,Y.、Taylor,J.和Tibshirani,R.(2017)。选择主成分的数量:估计噪声矩阵的真实秩。安。统计师。45 2590-2617. ·Zbl 1394.62073号
[41] Davis,C.和Kahan,W.M.(1970年)。扰动引起的特征向量的旋转。三、。SIAM J.数字。分析。7 1-46·Zbl 0198.47201号
[42] De Almeida,M.C.,Asada,E.N.和Garcia,A.V.(2008)。关于gram矩阵在可观测性分析中的应用。IEEE传输。电力系统。23 249-251.
[43] De Almeida,M.C.,Asada,E.N.和Garcia,A.V.(2008)。基于gram矩阵和最小范数解的电力系统可观性分析。IEEE传输。电力系统。23 1611-1618.
[44] Donath,W.E.和Hoffman,A.J.(1973年)。图划分的下限。IBM J.Res.Develop公司。17 420-425. ·Zbl 0259.05112号
[45] Drineas,P.和Mahoney,M.W.(2005年)。关于Nyström逼近Gram矩阵以改进基于核的学习的方法。J.马赫。学习。物件。6 2153-2175. ·Zbl 1222.68186号
[46] Fan,J.,Ke,Y.,Sun,Q.和Zhou,W.-X.(2019年)。FarmTest:具有近似错误发现控制的因子调整稳健多重测试。J.艾默。统计师。协会。114 1880-1893. ·Zbl 1428.62345号
[47] Fan,J.、Liao,Y.和Mincheva,M.(2013)。通过阈值化主正交补码进行大协方差估计。J.罗伊。统计师。Soc.序列号。B类75 603-680. ·Zbl 1411.62138号
[48] Fan,J.、Liao,Y.和Wang,W.(2016)。因子模型中的预测主成分分析。安。统计师。44 219-254. ·Zbl 1331.62295号 ·doi:10.1214/15-AOS1364
[49] Fan,J.、Sun,Q.、Zhou,W.和Zhu,Z.(2018)。大数据的主成分分析。Wiley StatsRef:在线统计参考。出现。 ·doi:10.1002/9781118445112.stat08122
[50] Fan,J.、Wang,W.和Zhong,Y.(2018)。特征向量扰动界及其在稳健协方差估计中的应用。J.马赫。学习。物件。18 1-42. ·Zbl 1473.15015号
[51] Florescu,L.和Perkins,W.(2016)。二分随机块模型中的谱阈值。程序。机器。学习。物件。49 943-959.
[52] Goldstein,L.和Shao,Q.-M.(2009)。坐标对称随机向量投影的Berry-Esseen界。电子。Commun公司。普罗巴伯。14 474-485·Zbl 1189.60051号
[53] Hall,P.、Horowitz,J.L.和Jing,B.(1995)。关于具有相关数据的引导程序的阻塞规则。生物特征82 561-574. ·Zbl 0830.62082号
[54] He,W.,Zhang,H.,Zhang,L.和Shen,H.(2015)。基于噪声调整迭代低阶矩阵逼近的高光谱图像去噪。IEEE J.选择。顶部。申请。地球观测遥感器。8 3050-3061.
[55] Hörmann,S.(2009)。经济计量时间序列的Berry-Esseen边界。ALEA Lat.Am.J.Probab公司。数学。斯达。6 377-397. ·Zbl 1276.60024号
[56] 霍斯特·P(1965)。数据矩阵的因子分析纽约:霍尔特、莱茵哈特和温斯顿·Zbl 0136.39204号
[57] Hotelling,H.(1933)。将复杂的统计变量分析为主成分。J.教育。精神病。24 417. ·JFM 59.1182.04号文件
[58] 詹姆斯·G和墨菲·G(1979)。Specht模的gram矩阵的行列式。J.代数59 222-235. ·Zbl 0417.20012号
[59] James,W.和Stein,C.(1961年)。二次损失估算。第四届伯克利数理统计与概率研讨会论文集,卷1:对统计学理论的贡献加利福尼亚大学校区·Zbl 1281.62026号
[60] Ji,H.、Huang,S.、Shen,Z.和Xu,Y.(2011)。通过联合稀疏和低秩矩阵近似实现稳健的视频恢复。SIAM J.成像科学。4 1122-1142. ·Zbl 1234.68451号
[61] Jirak,M.(2016)。弱依赖下的Berry-Esseen定理。安·普罗巴伯。44 2024-2063. ·兹比尔1347.60011
[62] Johnstone,I.M.(2001年)。关于主成分分析中最大特征值的分布。安。统计师。29 295-327. ·Zbl 1016.62078号 ·doi:10.1214/aos/1009210544
[63] Johnstone,I.M.和Lu,A.Y.(2009年)。关于高维主成分分析的一致性和稀疏性。J.艾默。统计师。协会。104 682-693. ·Zbl 1388.62174号
[64] Johnstone,I.M.和Paul,D.(2018年)。高维PCA:定向。程序。电气与电子工程师协会106 1277-1292.
[65] Jolliffe,I.(2002)。主成分分析第二版,纽约:施普林格出版社·Zbl 1011.62064号
[66] Jonsson,D.(1982)。样本协方差矩阵特征值的一些极限定理。《多元分析杂志》。12 1-38. ·Zbl 0491.62021号 ·doi:10.1016/0047-259X(82)90080-X
[67] Koltchinskii,V.和Lounici,K.(2016)。样本协方差双线性形式谱投影的渐近性和浓度界。亨利·彭加雷·普罗巴布(Henri PoincaréProbab)安·Inst。斯达。52 1976-2013. ·Zbl 1353.62053号 ·doi:10.1214/15-AIHP705
[68] Koltchinskii,V.和Lounici,K.(2017年)。样本协方差谱投影的正态近似和集中。安。统计师。45 121-157. ·Zbl 1367.62175号
[69] Lam,C.和Yao,Q.(2012年)。高维时间序列的因子建模:因子数量的推断。安。统计师。40 694-726. ·Zbl 1273.62214号 ·doi:10.1214/12-AOS970
[70] 劳利·D.N.和麦克斯韦·A.E.(1962)。因子分析作为一种统计方法。J.R.Stat.Soc公司.,序列号。D类12 209-229.
[71] Mandel,J.(1982)。奇异值分解在回归分析中的应用。阿默尔。统计师。36 15-24.
[72] Merlevède,F.、Peligrad,M.和Rio,E.(2011年)。弱相依序列的Bernstein型不等式和适度偏差。普罗巴伯。理论相关领域151 435-474. ·兹比尔1242.60020 ·doi:10.1007/s00440-010-0304-9
[73] Moon,H.R.和Weidner,M.(2017年)。具有交互固定效应的动态线性面板回归模型。计量经济学理论33 158-195. ·Zbl 1441.62816号
[74] Naumov,A.、Spokoiny,V.和Ulyanov,V.(2019)。样本协方差谱投影仪的自举置信集。普罗巴伯。理论相关领域174 1091-1132·Zbl 1420.62073号 ·doi:10.1007/s00440-018-0877-2
[75] Ng,A.Y.、Jordan,M.I.和Weiss,Y.(2002年)。关于谱聚类:分析和算法。神经信息处理系统研究进展849-856.
[76] Onatski,A.(2012)。具有弱影响因子的大因子模型主成分估计的渐近性。J.计量经济学168 244-258. ·Zbl 1443.62497号 ·doi:10.1016/j.jeconom.2012.01.034
[77] Pal,P.和Vaidyanathan,P.P.(2014)。通过低秩矩阵去噪实现欠定波达方向估计的无网格方法。IEEE信号处理。莱特。21 737-741.
[78] Pearson,K.(1901年)。第三章。在与空间中的点系统最接近的直线和平面上。菲洛斯。美格。2 559-572. ·JFM 32.0710.04号
[79] Ramona,M.、Richard,G.和David,B.(2012年)。基于核Gram-matrix准则的多类特征选择。IEEE传输。神经网络。学习。系统。23 1611-1623.
[80] Rummel,R.J.(1988)。应用因子分析伊利诺伊州埃文斯顿:西北大学出版社。
[81] Schölkopf,B.,Shawe-Taylor,J.,Smola,A.J.和Williamson,R.C.(1999)。通过Gram矩阵技术报告99-035 NeuroCOLT的特征值的泛化界限。
[82] Shawe-Taylor,J.、Williams,C.、Cristianini,N.和Kandola,J.(2002)。关于Gram矩阵的本征谱及其与算子本征谱的关系。算法学习理论国际会议23-40. 斯普林格·兹比尔1024.68538
[83] Shawe-Taylor,J.、Williams,C.K.、Cristianini,N.和Kandola,J.(2005)。关于Gram矩阵的特征谱和核PCA的泛化误差。IEEE传输。Inf.理论51 2510-2522. ·Zbl 1310.15076号
[84] 斯塔克,C.(2014)。状态测量Gram矩阵的自洽层析成像。物理。版次A89 052109.
[85] Stein,C.(1956年)。多元分析中的一些问题,第一部分技术报告,斯坦福大学。
[86] Stock,J.H.和Watson,M.W.(2002年)。使用来自大量预测因子的主成分进行预测。J.艾默。统计师。协会。97 1167-1179. ·Zbl 1041.62081号
[87] Wachter,K.W.(1978年)。独立元素样本矩阵的随机矩阵谱的强极限。安·普罗巴伯。6 1-18. ·Zbl 0374.60039号
[88] Wang,W.和Fan,J.(2017)。高维尖峰协方差经验特征结构的渐近性。安。统计师。45 1342-1374. ·Zbl 1373.62299号 ·doi:10.1214/16-AOS1487
[89] P.O.韦丁。(1972). 奇异值分解的扰动界。比特币12 99-111. ·Zbl 0239.15015号
[90] Yu,Y.,Wang,T.和Samworth,R.J.(2014)。对于统计学家来说,戴维斯-卡汉定理的一个有用变体。生物特征102 315-323. ·Zbl 1452.15010号
[91] Zhang,A.、Cai,T.T.和Wu,Y.(2019)。异方差主成分分析:算法、优化和应用。arXiv预印本,arXiv:1810.08316。
[92] Zhang,H.,He,W.,Zhang and L.,Shen,H.and Yuan,Q.(2013)。使用低秩矩阵恢复的高光谱图像恢复。IEEE传输。地质科学。远程传感器。52 4729-4743.
[93] Zhang,L.,Zhou,W.和Wang,H.(2022)。补充“大型Gram型矩阵谱分解的非共鸣特性及其应用”·doi:10.3150/21-BEJ1384SUPP文件
[94] Zhang,X.和Cheng,G.(2018)。物理依赖下高维向量的高斯近似。伯努利24 2640-2675. ·Zbl 1419.62257号 ·doi:10.3150/17-BEJ939
[95] Zou,H.、Hastie,T.和Tibshirani,R.(2006年)。稀疏主成分分析。J.计算。图表。统计师。15 265-286. ·doi:10.1198/106186006X113430
[96] 邹华和薛立(2018)。稀疏主成分分析的选择性概述。程序。电气与电子工程师协会106 1311-1320
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。