范建清;廖、袁;玛蒂娜·明切娃 [马克·哈林;Fryzlewicz,彼得;Na Huang;张文阳;彭亨;阿列克谢·奥纳茨基;克利福德·林;胡,查理;娜塔莉亚·贝利;佩萨兰,M.哈希姆;山形,高石;辛齐亚·维罗利;安吉拉·蒙塔纳里;Yu、Yi;理查德·萨姆沃思。;弗兰克·克里奇利;张健;约翰·T·肯特。;阿米尔·艾哈迈德;萨洛什·哈希米;萨米·哈拉瓦尼。;查尔斯·布维伦;科德·D.S。;马鲁里·阿吉拉尔,H。;Dang,Wei(魏丹);于克明;法纳,马特奥;Marco A.R.费雷拉。;弗洛里安·弗罗姆莱特;Gijbels,我。;Herrmann,K。;A.弗哈塞尔。;吉尔克斯,沃利;哈霍·霍尔兹曼;安娜,莱斯特;黄汉文;刘玉峰;马龙,J.S。;沈丹;沈海鹏;黄、健;周勇(Zhou,Yong);郑成玉;很好,杰森·P。;奥利弗·林顿;迈克尔·沃格特;刘,韩;王,李;豪尔赫·马图;潘光明;Pourahmadi,莫森;唐成勇;范莹莹;元,钟浩;旺彻·张;约翰·林;薛、凌州;邹慧] 通过阈值化主正交补码进行大协方差估计。经过讨论和作者回复。 (英语) Zbl 1411.62138号 J.R.Stat.Soc.,塞尔维亚。B、 统计方法。 75,第4期,603-680(2013). 摘要:本文研究具有条件稀疏结构和快速发散特征值的高维协方差的估计。通过在近似因子模型中假设稀疏的误差协方差矩阵,即使剔除了常见但不可观测的因子,我们也允许存在一些横截面相关性。我们引入主正交补码阈值法“POET”来探索这种具有稀疏性的近似因子结构。POET估计量包括样本协方差矩阵、基于因子的协方差矩阵,阈值估计量和自适应阈值估计量作为具体例子。当因子分析与高维数据的主成分分析大致相同时,我们提供数学见解。研究了稀疏残差协方差矩阵和条件稀疏协方差矩阵在不同范数下的收敛速度。结果表明,随着维数的增加,估计未知因素的影响消失。导出了未观测因子及其因子载荷的一致收敛速度。大量的仿真研究也验证了渐近结果。最后,给出了一个投资组合分配的实际数据应用。 引用于1审查引用于215文件 MSC公司: 62甲12 多元分析中的估计 62H25个 因子分析和主成分;对应分析 关键词:近似因子模型;横截面相关性;发散特征值;高维性;低秩矩阵;主要成分;稀疏矩阵;阈值化;未知因素 软件:ElemStatLearn(电子状态学习);项目管理局 PDF格式BibTeX公司 XML格式引用 \textit{J.Fan}等人,J.R.Stat.Soc.,Ser。B、 统计方法。75,第4号,603--680(2013;Zbl 1411.62138) 全文: 内政部 arXiv公司 参考文献: [1] Agarwal,A.、Negahban,S.和Wainwright,M.J.(2012)《通过凸松弛进行噪声矩阵分解:高维中的最佳速率》。安。统计师。, 40, 1171– 1197. ·兹比尔1274.62219 [2] Ahn,S.、Lee,Y.和Schmidt,P.(2001)具有时变个体效应的线性面板数据模型的GMM估计。《经济学杂志》。, 101, 219– 255. ·Zbl 0966.62091号 [3] Alessi,L.、Barigozzi,M.和Capassoc,M.(2010),改进了在近似因子模型中确定因子数量的惩罚。统计师。普罗巴伯。莱特。, 80, 1806– 1813. ·Zbl 1202.62081号 [4] Amini,A.A.和Wainwright,M.J.(2009)稀疏主成分半定松弛的高维分析。安。统计师。, 37, 2877– 2921. ·Zbl 1173.62049号 [5] Antoniadis,A.和Fan,J.(2001)正则化小波近似。美国统计学杂志。助理。, 96, 939– 967. ·Zbl 1072.62561号 [6] d'Aspremont,A.、Bach,F.和El Ghaoui,L.(2008)稀疏主成分分析的最佳解决方案。J.马赫。学习。物件。, 9, 1269– 1294. ·Zbl 1225.68170号 [7] Athreya,K.和Lahiri,S.(2006),测度理论和概率理论。纽约:斯普林格·Zbl 1125.60001号 [8] Bai,J.(2003)大维度因子模型的推理理论。计量经济学, 71, 135– 171. ·Zbl 1136.62354号 [9] Bai,J.和Ng,S.(2002)确定近似因子模型中的因子数。计量经济学, 70, 191– 221. ·Zbl 1103.91399号 [10] Bai,J.和Ng,S.(2008)大维度因子分析。已找到。经济趋势。, 3, 89– 163. [11] Bai,J.和Shi,S.(2011)估计高维协方差矩阵及其应用。《经济学年鉴》。财务。, 12, 199– 215. [12] Bickel,P.和Levina,E.(2008)通过阈值进行协方差正则化。安。统计师。, 36, 2577– 2604. ·兹比尔1196.62062 [13] Birnbaum,A.、Johnstone,I.、Nadler,B.和Paul,D.(2012)含噪高维数据的稀疏PCA的最小极大界。安。统计师。,待发布·兹比尔1292.62071 [14] Boivin,J.和Ng,S.(2006年)因子分析中数据越多越好吗?《经济学杂志》。, 132, 169– 194. ·Zbl 1337.62345号 [15] Cai,J.,Candès,E.和Shen,Z.(2008)矩阵补全的奇异值阈值算法。SIAM J.Optimizn公司, 20, 1956– 1982. ·Zbl 1201.90155号 [16] Cai,T.和Liu,W.(2011)稀疏协方差矩阵估计的自适应阈值。美国统计学杂志。助理。,106672–684·Zbl 1232.62086号 [17] Cai,T.和Zhou,H.(2012)稀疏协方差矩阵估计的最佳收敛速度。安.统计师。,40, 2389– 2420. ·Zbl 1373.62247号 [18] Candès,E.,Li,X.,Ma,Y.和Wright,J.(2011)稳健主成分分析?J.资产计算。机器。, 58, 3. ·Zbl 1327.62369号 [19] Carvalho,C.、Chang,J.、Lucas,J.和Nevins,J.,Wang,Q.和West,M.(2008)高维稀疏因子建模:在基因表达基因组学中的应用。美国统计学杂志。助理。, 103, 1438– 1456. ·Zbl 1286.62091号 [20] Chamberlain,G.和Rothschild,M.(1983)大型资产市场中的套利、因子结构和均值方差分析。计量经济学, 51, 1305– 1324. ·Zbl 0523.90017号 [21] Davis,C.和Kahan,W.(1970)特征向量的微扰旋转III。SIAM J.数字。分析。, 7, 1– 46. ·Zbl 0198.47201号 [22] Doz,C.、Giannone,D.和Reichlin,L.(2011)基于卡尔曼滤波的大型近似动态因子模型的两步估计。《经济学杂志》。, 164, 188– 205. ·Zbl 1441.62671号 [23] Efron,B.(2007)相关性和大规模同时显著性检验。美国统计学杂志。助理。, 102, 93– 103. ·Zbl 1284.62340号 [24] Efron,B.(2010)相关z值和大规模统计估计的准确性。美国统计学杂志。助理。, 105, 1042– 1055. ·Zbl 1390.62139号 [25] Fama,E.和French,K.(1992)预期股票收益的横截面。J.菲南。, 47, 427– 465. [26] Fan,J.、Fan,Y.和Lv,J.(2008)使用因子模型进行高维协方差矩阵估计。《经济学杂志》。, 147, 186– 197. ·Zbl 1429.62185号 [27] Fan,J.、Han,X.和Gu,W.(2012)任意协方差依赖下的错误发现率控制(含讨论)。美国统计学杂志。助理。, 107, 1019– 1048. [28] Fan,J.、Liao,Y.和Mincheva,M.(2011a)近似因子模型中的高维协方差矩阵估计。安。统计师。,393320–3356·Zbl 1246.62151号 [29] Fan,J.,Liao,Y.和Mincheva,M.(2011b)通过阈值化主正交补码进行大协方差估计。预印本arxiv.org/pdf/1201.0175.pdf. [30] Fan,J.、Zhang,J.和Yu,K.(2012)具有总风险敞口约束的大量投资组合选择。美国统计学杂志。助理。, 107, 592– 606. ·Zbl 1261.62091号 [31] Forni,M.、Hallin,M.,Lippi,M.和Reichlin,L.(2000)《广义动态因子模型:识别和估计》。经济收益率。统计师。, 82, 540– 554. [32] Forni,M.、Hallin,M.,Lippi,M.和Reichlin,L.(2004)广义动态因子模型的一致性和比率。《经济学杂志》。, 119, 231– 255. ·Zbl 1282.91267号 [33] Forni,M.和Lippi,M.(2001)广义动态因子模型:表征理论。经济计量学。西奥。, 17, 1113– 1141. ·Zbl 1181.62189号 [34] Fryzlewicz,P.(2012)通过小波和阈值进行高维波动率矩阵估计。手稿。伦敦政治经济学院,伦敦·Zbl 1452.62764号 [35] Hallin,M.和Liška,R.(2007)确定一般动态因子模型中的因子数。美国统计学杂志。助理。, 102, 603– 617. ·兹比尔1172.62339 [36] Hallin,M.和Liška,R.(2011)区块存在时的动态因素。《经济学杂志》。, 163, 29– 41. ·Zbl 1441.62716号 [37] Hastie,T.J.、Tibshirani,R.和Friedman,J.(2009)《统计学习的要素:数据挖掘、推断和预测》,第2版。纽约:斯普林格·兹比尔1273.62005 [38] James,W.和Stein,C.(1961)二次损失估计。程序中。伯克利第四交响乐团。《数理统计与概率》,第361-379页。伯克利:加利福尼亚大学出版社·Zbl 1281.62026号 [39] Johnstone,I.M.(2001)关于主成分分析中最大特征值的分布。安。统计师。, 29, 295– 327. ·Zbl 1016.62078号 [40] Johnstone,I.M.和Lu,A.Y.(2009)关于高维主成分分析的一致性和稀疏性。美国统计学杂志。助理。, 104, 682– 693. ·Zbl 1388.62174号 [41] Jung,S.和Marron,J.S.(2009)高维、低样本量背景下的主成分分析一致性。安。统计师。,374104–4130·Zbl 1191.62108号 [42] Kapetanios,G.(2010)用大数据集确定近似因子模型中因子数量的测试程序。J.总线。经济。统计师。,28397–409·Zbl 1214.62068号 [43] Lam,C.和Fan,J.(2009)大协方差矩阵估计中的稀疏性和收敛速度。安。统计师。, 37, 4254– 4278. ·Zbl 1191.62101号 [44] Lawley,D.和Maxwell,A.(1971),作为统计方法的因子分析,第2版。伦敦:巴特沃斯·Zbl 0251.62042号 [45] Leek,J.和Storey,J.(2008)多重测试依赖性的一般框架。程序。国家。阿卡德。科学。美国, 105, 18718– 18723. ·Zbl 1359.62202号 [46] Lin,Z.,Ganesh,A.,Wright,J.,Wu,L.,Chen,M.和Ma,Y.(2009)精确恢复损坏低秩矩阵的快速凸优化算法。《多传感器自适应处理中的国际Wrkshp计算进展》,阿鲁巴。 [47] Luo,X.(2011)基于凸极小化的高维低秩稀疏协方差矩阵估计。手稿。宾夕法尼亚大学,费城。 [48] Ma,Z.(2013)稀疏主成分分析和迭代阈值法。安.统计师。,待发布·Zbl 1267.62074号 [49] Meinshausen,N.和Bühlmann,P.(2006)高维图和拉索变量选择。安。统计师。, 34, 1436– 1462. ·Zbl 1113.62082号 [50] Onatski,A.(2010)根据特征值的经验分布确定因子的数量。经济收益率。统计师。, 92, 1004– 1016. [51] Pati,D.、Bhattacharya,A.、Pillai,N.和Dunson,D.(2012)海量协方差矩阵稀疏贝叶斯因子模型的后验收缩。手稿。达勒姆杜克大学·Zbl 1305.62124号 [52] Paul,D.(2007)大维尖峰协方差模型样本特征结构的渐近性。统计师。罪。, 17, 1617– 1642. ·Zbl 1134.62029号 [53] Pesaran,M.H.(2006)具有多因素误差结构的大型异质面板中的估计和推断。计量经济学, 74, 967– 1012. ·Zbl 1152.91718号 [54] Pesaran,M.H.和Yamagata,T.(2012)使用大量资产测试CAPM。美国金融协会圣地亚哥会议文件。(可从http://ssrn.com/abstracts。) [55] Phan,Q.(2012)关于特质误差协方差矩阵的稀疏性假设——来自富时100指数股票收益的支持。手稿。考文垂华威大学。 [56] Ross,S.A.(1976)资本资产定价的套利理论。《经济学杂志》。西奥。, 13, 341– 360. [57] Rothman,A.,Levina,E.和Zhu,J.(2009)大协方差矩阵的广义阈值化。美国统计学杂志。助理。,104,177–186·Zbl 1388.62170号 [58] Sentana,E.(2009)《均值-方差效率测试的计量经济学:一项调查》。计量经济学。J。, 12, 65– 101. ·Zbl 1178.91232号 [59] Sharpe,W.(1964)《资本资产价格:风险条件下的市场均衡理论》。J.菲南。, 19, 425– 442. [60] Shen,H.和Huang,J.(2008)通过正则化低秩矩阵近似进行稀疏主成分分析。J.Multiv.公司。分析。, 99, 1015– 1034. ·Zbl 1141.62049号 [61] Stock,J.和Watson,M.(1998)《扩散指数》。工作文件6702剑桥国家经济研究局。 [62] Stock,J.和Watson,M.(2002)使用大量预测因子的主成分进行预测。美国统计学杂志。助理。, 97, 1167– 1179. ·Zbl 1041.62081号 [63] Witten,D.M.、Tibshirani,R.和Hastie,T.(2009)惩罚矩阵分解,应用于稀疏主成分和典型相关分析。生物统计学, 10, 515– 534. ·Zbl 1437.62658号 [64] Wright,J.、Peng,Y.、Ma,Y.,Ganesh,A.和Rao,S.(2009)稳健主成分分析:通过凸优化精确恢复损坏的低秩矩阵。新增。通知。过程。系统。 [65] Xiong,H.、Goulding,E.H.、Carlson,E.J.、Tecott,L.H.、McCulloch,C.E.和Sen,S.(2011)《映射功能值性状的灵活估计方程方法》。遗传学, 189, 305– 316. [66] Yap,J.S.、Fan,J.和Wu,R.(2009)数量性状基因座功能定位中纵向协方差结构的非参数建模。生物计量学, 65, 1068– 1077. ·Zbl 1181.62186号 [67] 张,Y。 此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。