×

通过最小化(ell_{1})惩罚的对数决定元散度进行高维协方差估计。 (英语) 兹比尔1274.62190

小结:给定随机向量(X in\mathbb R^{p})的i.i.d.观测值,我们研究了估计其协方差矩阵(Sigma^{*})及其逆协方差或浓度矩阵(Theta^{*{=(Sigma ^{*neneneep)^{-1}的问题。当(X)为多元高斯时,(Theta^{*})的非零结构由相关高斯马尔可夫随机场的图指定;这种稀疏(Theta^{*})的一个流行估计是正则高斯MLE。该估计量即使对于非高斯(X)也是合理的,因为它对应于最小化(ell_{1})惩罚的对数决定Bregman散度。我们分析了它在高维缩放下的性能,其中图中的节点数(p)、边数(s)和最大节点度(d)可以随着样本大小(n)而增长。除了参数((p,s,d)之外,我们的分析还确定了控制速率的其他关键量:(a)真协方差矩阵(Sigma^{*})的算子范数;和(b)子矩阵(Gamma^{*}{SS})的算子范数,其中(S)索引图的边,和;和(c)矩阵(Gamma^{*})上的互不相干或不可表示测度;和(d)概率的衰减率(1/f(n,δ))^{无}_{ij}-\Sigma^{*}_{ij}|>\delta\}\),其中\(\hat\Sigma_{n}\)是基于\(n\)样本的样本协方差。我们的第一个结果建立了我们在元素最大范数中的估计(hat\Theta)的一致性。这反过来又允许我们导出Frobenius和谱范数的收敛速度,改进了具有最大节点度(d=o(sqrt{s}))的图的现有结果。在我们的第二个结果中,我们表明,当概率收敛到1时,估计(Theta)正确地指定了浓度矩阵(Theta^{*})的零模式。我们通过对各种图形和问题参数的模拟来说明我们的理论结果,显示了理论预测与模拟中的行为之间的良好对应。

MSC公司:

2012年12月62日 参数估计量的渐近性质
62层30 约束条件下的参数化推理

软件:

玻璃制品
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] P.J.Bickel和E.Levina。基于阈值的协方差正则化。,安.统计师,36(6) :2577-2604, 2008. ·Zbl 1196.62062号 ·doi:10.1214/08-AOS600
[2] P.J.Bickel和E.Levina。大协方差矩阵的正则化估计。,安.统计师,36(1):199-227, 2008. ·兹比尔1132.62040 ·doi:10.1214/009053607000000758
[3] S.Boyd和L.Vandenberghe。,凸优化。剑桥大学出版社,英国剑桥,2004年·Zbl 1058.90049号
[4] L.M.布雷格曼。求凸集公共点的松弛方法及其在凸规划问题求解中的应用。,苏联计算数学和数学物理,7:191-2041967·Zbl 0186.23807号
[5] L.D.Brown。,统计指数族基础。数理统计研究所,加利福尼亚州海沃德,1986年·Zbl 0685.6202号
[6] V.V.Buldygin和Y.V.Kozachenko。,随机变量和随机过程的度量特征。美国数学学会,普罗维登斯,RI,2000年·Zbl 0998.60503号
[7] 蔡洪涛、张春晖和周春晖。协方差矩阵估计的最优收敛速度。,《统计年鉴》,2010年·Zbl 1202.62073号 ·doi:10.1214/09-AOS752
[8] Y.Censor和S.A.Zenios。,并行优化:理论、算法和应用。数值数学和科学计算。牛津大学出版社,1988年。
[9] A.d'Asprémont、O.Banerjee和L.El Ghaoui。稀疏协方差选择的一阶方法。,SIAM J.矩阵分析。申请,30(1):56-662008·兹比尔1156.90423 ·数字对象标识代码:10.1137/060670985
[10] N.El Karoui。大维稀疏协方差矩阵的算子范数一致估计。,安.统计师,将于2008年面世·Zbl 1196.62064号 ·doi:10.1214/07-AOS559
[11] J.Friedman、T.Hastie和R.Tibshirani。图形Lasso.的稀疏逆协方差估计。,生物统计,9(3):432-441, 2007. ·Zbl 1143.62076号 ·doi:10.1093/biostatistics/kxm045
[12] R.Furrer和T.Bengtsson。卡尔曼滤波变量中高维先验和后验协方差矩阵的估计。,J.多变量。分析,98(2):227-255, 2007. ·Zbl 1105.62091号 ·doi:10.1016/j.jmva.2006.08.003
[13] C.吉拉德。通过模型选择估计高斯图。,《电子统计杂志》,2008年,2:542-563·Zbl 1320.62094号 ·doi:10.1214/08-EJS228
[14] R.A.Horn和C.R.Johnson。,矩阵分析。剑桥大学出版社,剑桥,1985年·Zbl 0576.15001号
[15] J.Z.Huang、N.Liu、M.Pourahmadi和L.Liu。通过惩罚正态似然选择协方差矩阵和估计。,《生物特征》,93(1):85-982006·Zbl 1152.62346号 ·doi:10.1093/biomet/93.1.85
[16] I.M.约翰斯通。关于主成分分析中最大特征值的分布。,安.统计师,29(2):295-327, 2001. ·Zbl 1016.62078号 ·doi:10.1214/aos/1009210544
[17] I.M.Johnstone和A.Y.Lu.稀疏主成分分析。,未出版手稿,2004年。
[18] C.Lam和J.Fan。大协方差矩阵估计的稀疏性和收敛速度。,《统计年鉴》,37:4254-42782009·Zbl 1191.62101号 ·doi:10.1214/09-AOS720
[19] O.Ledoit和M.Wolf。大维协方差矩阵的条件良好估计。,J.多变量。分析,88:365-411, 2003. ·Zbl 1032.62050 ·doi:10.1016/S0047-259X(03)00096-4
[20] 勒杜先生。,测量集中现象。数学调查和专著。美国数学学会,普罗维登斯,RI,2001·Zbl 0995.60002号
[21] N.明绍森。图形高斯模型选择的拉索注记。,《统计与概率快报》,78(7):880-8842008·Zbl 1144.62326号 ·doi:10.1016/j.spl.2007.09.014
[22] N.Meinshausen和P.Bühlmann。高维图和用Lasso.选择变量。,安.统计师,34(3) :1436-1462, 2006. ·Zbl 1113.62082号 ·doi:10.1214/0090536000000281
[23] J.M.Ortega和W.G.Rheinboldt。,多元非线性方程的迭代解法。纽约学术出版社,1970年·Zbl 0241.65046号
[24] V.V.Petrov。,概率论极限定理:独立随机变量序列。牛津大学出版社,英国牛津,1995年·Zbl 0826.60001号
[25] P.Ravikumar、M.J.Wainwright、G.Raskutti和B.Yu。高维协方差估计:1正则化对数决定散度的收敛速度。技术报告,统计部,加州大学伯克利分校,2008年9月·兹比尔1274.62190
[26] H.P.罗森塔尔。在由独立随机变量序列跨越的lp(p>2)的子空间上。以色列J.Math,8:1546-15701970·Zbl 0213.19303号 ·doi:10.1007/BF02771562
[27] A.J.Rothman、P.J.Bickel、E.Levina和J.Zhu。稀疏置换不变协方差估计。,电子。统计学杂志,2008年2月494-515日·Zbl 1320.62135号 ·doi:10.1214/08-EJS176
[28] J.A.特罗普。放松:识别稀疏信号的凸编程方法。,IEEE传输。信息。理论,51(3):1030-10512006·Zbl 1288.94025号 ·doi:10.1109/TIT.2005.864420
[29] M.J.温赖特。使用1约束二次规划(Lasso)实现高维和噪声稀疏恢复的锐化阈值。IEEE传输。信息理论,55:2183-22022009年5月·兹比尔1367.62220 ·doi:10.1109/TIT.2009.2016018
[30] W.B.Wu和M.Pourahmadi。纵向数据大协方差矩阵的非参数估计。,《生物特征》,90(4):831-8442003·Zbl 1436.62347号 ·doi:10.1093/biomet/90.4.831
[31] 袁敏洪、林毅。高斯图形模型中的模型选择与估计。,《生物特征》,94(1):19-352007·Zbl 1142.62408号 ·doi:10.1093/biomet/asm018
[32] P.Zhao和B.Yu。关于拉索模型选择的一致性。,机器学习研究杂志,7:2541-25672006·Zbl 1222.62008年
[33] S.Zhou、J.Lafferty和L.Wasserman。时间维无向图。2008年7月,芬兰赫尔辛基,第21届学习理论年会(COLT)。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。