×

屏幕NOT:相关噪声中的精确MSE-最优奇异值阈值。 (英语) Zbl 07684007号

小结:我们推导了在相关加性噪声存在下奇异值分解的最优硬阈值公式;虽然它名义上涉及不可观测项,但我们展示了如何应用它,即使在噪声协方差结构未知或无法独立估计的情况下。我们称之为屏幕NOT是卡特尔1966年提出的广受欢迎但模糊的碎石图启发法的一个数学上可靠的替代方案。ScreeNOT有一个令人惊讶的预言属性:它通常可以实现确切地在大型有限样本中,在每个给定的问题实例上,矩阵恢复的最小可能MSE,即它选择的特定阈值正好给出了所有可能阈值选择中最小的可实现MSE损失那个噪声数据集和那个未知的真正的低秩模型。该方法计算效率高,对潜在协方差结构的扰动具有鲁棒性。我们的结果依赖于这样的假设:噪声的奇异值具有紧支撑的极限经验分布;这一特性是随机矩阵理论中的标准,许多显示出行间相关结构或列间相关结构的模型,以及许多具有更一般的元素间关联结构的情况都满足这一特性。仿真表明,即使在矩阵大小适中的情况下,该方法也是有效的。本文由实现所提算法的现成软件包进行补充:包屏幕NOT在里面蟒蛇(通过PyPI公司)以及R(右)(通过CRAN(起重机)).

MSC公司:

62C20个 统计决策理论中的Minimax过程
62H25个 因子分析和主成分;对应分析
90C22型 半定规划
90C25型 凸面编程
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] ACHLIOPTAS,D.和MCSHERRY,F.(2001)。低秩矩阵近似的快速计算。第三十三届ACM计算理论年会论文集611-618. 纽约ACM·Zbl 1311.94032号 ·数字对象标识代码:10.1145/380752.380858
[2] ALTER,O.,BROWN,P.O.和BOTSTEIN,D.(2000)。用于全基因组表达数据处理和建模的奇异值分解。程序。国家。阿卡德。科学。美国97 10101-10106. ·doi:10.1073/pnas.97.18.10101
[3] AZAR,Y.、FIAT,A.、KARLIN,A.R.、MCSHERRY,F.和SAIA,J.(2001)。数据的光谱分析。第三十三届ACM计算理论年会论文集619-626. ·Zbl 1323.68426号
[4] Bai,Z.和Silverstein,J.W.(2010)。大维随机矩阵的谱分析,第2版。统计学中的斯普林格系列。斯普林格,纽约·Zbl 1301.60002号 ·doi:10.1007/978-1-4419-0661-8
[5] BAI,Z.和YAO,J.(2008)。尖峰种群模型中特征值的中心极限定理。亨利·彭加雷·普罗巴布(Henri PoincaréProbab)安·Inst。斯达。44 447-474. ·Zbl 1274.62129号 ·doi:10.1214/07-AIHP118
[6] Bai,Z.D.和Silverstein,J.W.(1998年)。没有特征值超出大维样本协方差矩阵的极限谱分布的支持。安·普罗巴伯。26 316-345. ·Zbl 0937.60017号 ·doi:10.1214/aop/1022855421
[7] Bai,Z.D.和Silverstein,J.W.(2004)。CLT用于大维样本协方差矩阵的线性谱统计。安·普罗巴伯。32 553-605. ·Zbl 1063.60022号 ·doi:10.1214/aop/1078415845
[8] Baik,J.、Ben Arous,G.和Péché,S.(2005)。非零复样本协方差矩阵最大特征值的相变。安·普罗巴伯。33 1643-1697. ·Zbl 1086.15022号 ·doi:10.1214/00911790500000233
[9] Baik,J.和Silverstein,J.W.(2006)。尖峰种群模型大样本协方差矩阵的特征值。《多元分析杂志》。97 1382-1408. ·Zbl 1220.15011号 ·doi:10.1016/j.jmva.2005.08.003
[10] Benaych-Georges,F.和Nadakuditi,R.R.(2012)。大型矩形随机矩阵低秩扰动的奇异值和奇异向量。《多元分析杂志》。111 120-135. ·Zbl 1252.15039号 ·doi:10.1016/j.jmva.2012.04.019
[11] Bickel,P.J.和Levina,E.(2008)。通过阈值进行协方差正则化。安。统计师。36 2577-2604. ·Zbl 1196.62062号 ·doi:10.1214/08-AOS600
[12] 卡特尔,R.B.(1966年)。因子数量的筛选测试。多变量。行为。物件。1 245-276.
[13] Chatterjee,S.(2015)。基于广义奇异值阈值的矩阵估计。安。统计师。43 177-214. ·Zbl 1308.62038号 ·doi:10.1214/14-AOS1272
[14] Dobriban,E.和Owen,A.B.(2019年)。确定性平行分析:一种改进的因子和主成分选择方法。J.R.统计社会服务。B.统计方法。81 163-183. ·Zbl 1407.62216号
[15] DONOHO,D.、GAVISH,M.和ROMANOV,E.(2020年)。代码补充“屏幕NOT:相关噪声中的精确MSE-最优奇异值阈值”。可在https://purl.stanford.edu/py196rk3919。
[16] DONOHO,D.、GAVISH,M.和ROMANOV,E.(2023年)。补充“屏幕NOT:相关噪声中的精确MSE-最优奇异值阈值。”https://doi.org/10.1214/22-AOS2232SUPP网站
[17] EDFORS,O.和SANDELL,M.(1998年)。基于奇异值分解的OFDM信道估计。IEEE传输。Commun公司。46 931-939.
[18] FRANKLIN,S.B.、GIBSON,D.J.、ROBERTSON,P.A.、POHLMANN,J.T.和FRALISH,J.S.(1995)。平行分析:一种确定重要主成分的方法。J.素食。科学。6 99-106.
[19] GAVISH,M.和DONOHO,D.L.(2014)。奇异值的最佳硬阈值是\[4/\sqrt{3}\]。IEEE传输。Inf.理论60 5040-5053. ·Zbl 1360.94071号 ·doi:10.10109/TIT.2014.2323359
[20] HOFF,P.D.(2007)。奇异值分解的模型平均和维数选择。J.艾默。统计师。协会。102 674-685·Zbl 1172.62318号 ·doi:10.1198/0162145000001310
[21] HONG,D.、BALZANO,L.和FESSLER,J.A.(2018年)。PCA对高维异方差数据的渐近性能。《多元分析杂志》。167 435-452. ·Zbl 1395.62139号 ·doi:10.1016/j.jmva.2018.06.002
[22] 杰克逊,法学博士(1993年)。主成分分析中的停止规则:启发式和统计方法的比较。生态学.
[23] Johnstone,I.M.(2001)。关于主成分分析中最大特征值的分布。安。统计师。29 295-327. ·Zbl 1016.62078号 ·doi:10.1214/aos/1009210544
[24] JOLLIFFE,I.T.(2005)。主成分分析.统计学中的斯普林格系列纽约州施普林格·doi:10.1007/9781-4757-1904-8
[25] LAGERLUND,T.D.、SHARBROUGH,F.W.和BUSACKER,N.E.(1997年)。通过奇异值分解的主成分分析对多通道脑电图记录进行空间滤波。临床杂志。神经生理学。14 73-82. ·doi:10.1097/00004691-199701000-00007
[26] LEEB,W.和ROMANOV,E.(2021年)。异方差噪声下的最优谱收缩和主成分分析。IEEE传输。Inf.理论67 3009-3037. ·Zbl 1473.62205号 ·doi:10.1109/tit.2021.3055075
[27] Nadakuditi,R.R.(2014)。OptShrink:一种通过数据驱动的最优奇异值收缩来改进低阶信号矩阵去噪的算法。IEEE传输。Inf.理论60 3002-3018. ·Zbl 1360.62399号 ·doi:10.1109/TIT.2014.2311661
[28] OWEN,A.B.和PERRY,P.O.(2009年)。奇异值分解和非负矩阵分解的双交叉验证。附录申请。斯达。3 564-594. ·Zbl 1166.62047号 ·doi:10.1214/08-AOAS227
[29] Paul,D.(2007年)。大维尖峰协方差模型样本特征结构的渐近性。统计师。西尼卡17 1617-1642年·Zbl 1134.62029号
[30] 佩里,P.O.(2009)。无监督学习的交叉验证。斯坦福大学博士论文。
[31] PRICE,A.L.、PATTERSON,N.J.、PLENGE,R.M.、WEINBLATT,M.E.、SHADICK,N.A.和REICH,D.(2006)。主成分分析修正了全基因组关联研究中的分层。自然遗传学。38 904-909.
[32] SHABALIN,A.A.和NOBEL,A.B.(2013)。在存在高斯噪声的情况下重建低秩矩阵。《多元分析杂志》。118 67-76. ·Zbl 1280.15022号 ·doi:10.1016/j.jmva.2013.03.005
[33] SILVERSTEIN,J.W.和CHOI,S.-I.(1995年)。大维随机矩阵的极限谱分布分析。《多元分析杂志》。54 295-309. ·Zbl 0872.60013号 ·doi:10.1006/jmva.1995.1058
[34] WOLD,S.(1978年)。因子和主成分模型中成分数量的交叉验证估计。技术指标20 397-405 ·Zbl 0403.62032号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。