×

基于凸优化的潜在变量图形模型选择。 (英语) Zbl 1257.62061号

小结:假设我们观察随机变量集合的子集的样本。没有提供关于潜在变量数量以及潜在变量和观测变量之间关系的额外信息。有可能发现潜在成分的数量,并学习整个变量集合的统计模型吗?我们在潜在变量和观测变量共同为高斯的情况下解决这个问题,观测变量的条件统计取决于图形模型中指定的潜在变量。
作为第一步,我们给出了这样的隐变量高斯图形模型在仅给定观测变量的边际统计的自然条件下是可识别的。本质上,这些条件要求观测变量之间的条件图形模型是稀疏的,而潜在变量的影响“扩散”到大多数观测变量上。接下来,我们提出了一个基于正则极大似然的可处理凸规划,用于此隐变量设置下的模型选择;正则化子同时使用\(\ell{1}\)范数和核范数。我们的建模框架可以被视为降维(识别潜在变量)和图形建模(捕获不属于潜在变量的剩余统计结构)的组合,它一致地估计了观测变量中潜在成分的数量和条件图形模型的结构。这些结果适用于高维设置,其中潜在/观察到的变量的数量随着观察到的变量的样本数量而增长。稀疏矩阵和低秩矩阵的代数簇的几何性质在我们的分析中起着重要作用。

理学硕士:

62甲12 多元分析中的估计
90C25型 凸面编程
05C90年 图论的应用
2012年12月62日 参数估计量的渐近性质
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Bickel,P.J.和Levina,E.(2008)。大协方差矩阵的正则化估计。Ann.Statist公司。36 199-227. ·Zbl 1132.62040号 ·doi:10.1214/009053607000000758
[2] Bickel,P.J.和Levina,E.(2008)。通过阈值进行协方差正则化。Ann.Statist公司。36 2577-2604. ·Zbl 1196.62062号 ·doi:10.1214/08-AOS600
[3] Candès,E.J.、Li,X.、Ma,Y.和Wright,J.(2011)。稳健的主成分分析?J.ACM 58第11、37条·Zbl 1327.62369号
[4] Candès,E.J.和Recht,B.(2009年)。通过凸优化实现精确矩阵补全。已找到。计算。数学。9 717-772. ·Zbl 1219.90124号 ·doi:10.1007/s10208-009-9045-5
[5] Candès,E.J.、Romberg,J.和Tao,T.(2006年)。鲁棒不确定性原理:从高度不完整的频率信息中精确重建信号。IEEE传输。通知。理论52 489-509·Zbl 1231.94017号 ·doi:10.1109/TIT.2005.862083
[6] Chandrasekaran,V.、Parrilo,P.A.和Willsky,A.S.(2011年)。补充“通过凸优化选择潜在变量图形模型”·Zbl 1288.62085号
[7] Chandrasekaran,V.、Sanghavi,S.、Parrilo,P.A.和Willsky,A.S.(2011年)。矩阵分解的秩稀疏不相干。SIAM J.Optim公司。21 572-596·Zbl 1226.90067号 ·数字对象标识代码:10.1137/090761793
[8] Davidson,K.R.和Szarek,S.J.(2001年)。局部算子理论、随机矩阵和Banach空间。《巴拿赫空间几何手册》,第一卷317-366。荷兰北部,阿姆斯特丹·Zbl 1067.46008号 ·doi:10.1016/S1874-5849(01)80010-3
[9] Dempster,A.P.、Laird,N.M.和Rubin,D.B.(1977年)。通过EM算法从不完整数据中获得最大似然。J.罗伊。统计人员。Soc.序列号。B 39 1-38·Zbl 0364.62022号
[10] Donoho,D.L.(2006)。对于大多数大型欠定线性方程组,最小(l_1)范数解也是最稀疏解。普通纯应用程序。数学。59 797-829. ·Zbl 1113.15004号 ·doi:10.1002/cpa.20132年
[11] Donoho,D.L.(2006)。压缩传感。IEEE传输。通知。理论52 1289-1306·Zbl 1288.94016号 ·doi:10.1109/TIT.2006.871582
[12] El Karoui,N.(2008年)。大维稀疏协方差矩阵的算子范数一致估计。Ann.Statist公司。36 2717-2756. ·Zbl 1196.62064号 ·doi:10.1214/07-AOS559
[13] Elidan,G.、Nachman,I.和Friedman,N.(2007年)。连续变量贝叶斯网络的“理想父”结构学习。J.马赫。学习。1799-1833年第8号决议·Zbl 1222.68191号
[14] Fan,J.、Fan,Y.和Lv,J.(2008)。使用因子模型进行高维协方差矩阵估计。《计量经济学杂志》147 186-197·Zbl 1429.62185号 ·doi:10.1016/j.jeconom.2008.09.017
[15] Fazel,M.(2002)。矩阵秩最小化及其应用。斯坦福大学电子工程系博士论文。
[16] Horn,R.A.和Johnson,C.R.(1990年)。矩阵分析。剑桥大学出版社,剑桥·Zbl 0704.15002号
[17] Johnstone,I.M.(2001)。关于主成分分析中最大特征值的分布。Ann.Statist公司。29 295-327. ·Zbl 1016.62078号 ·doi:10.1214/aos/1009210544
[18] Lam,C.和Fan,J.(2009年)。大协方差矩阵估计中的稀疏性和收敛速度。Ann.Statist公司。37 4254-4278. ·兹比尔1191.62101 ·doi:10.1214/09-AOS720
[19] Lauritzen,S.L.(1996)。图形模型。牛津统计科学系列17。牛津大学出版社,纽约·Zbl 0907.62001
[20] Ledoit,O.和Wolf,M.(2004)。大维协方差矩阵的条件良好估计。《多元分析杂志》。88 365-411. ·Zbl 1032.62050 ·doi:10.1016/S0047-259X(03)00096-4
[21] Löfberg,J.(2004)。YALMIP:MATLAB中用于建模和优化的工具箱。在CACSD会议记录中,台湾。可从获取。
[22] Marčenko,V.A.和Pastur,L.A.(1967年)。特征值在某些随机矩阵集合中的分布。材料编号:72 507-536·Zbl 0152.16101号
[23] Meinshausen,N.和Bühlmann,P.(2006)。高维图和用套索选择变量。Ann.Statist公司。34 1436-1462. ·Zbl 1113.62082号 ·doi:10.1214/0090536000000281
[24] Meinshausen,N.和Bühlmann,P.(2010年)。稳定性选择。J.R.统计社会服务。B统计方法。72 417-473. ·文件编号:10.1111/j.1467-9868.2010.00740.x
[25] Ortega,J.M.和Rheinboldt,W.C.(1970年)。多元非线性方程的迭代解法。纽约学术出版社·Zbl 0241.65046号
[26] Ravikumar,P.、Wainwright,M.J.、Raskutti,G.和Yu,B.(2011年)。通过最小化受(ell_1)惩罚的对数决定散度进行高维协方差估计。电子。《美国联邦法律大全》第4卷第935-980页·Zbl 1274.62190号 ·doi:10.1214/11-EJS631
[27] Recht,B.、Fazel,M.和Parrilo,P.A.(2010年)。通过核范数最小化保证线性矩阵方程的最小秩解。SIAM版本52 471-501·Zbl 1198.90321号 ·数字对象标识代码:10.1137/070697835
[28] Rockafellar,R.T.(1996年)。凸分析。普林斯顿大学出版社,新泽西州普林斯顿·兹比尔0878.49012
[29] Rothman,A.J.、Bickel,P.J.、Levina,E.和Zhu,J.(2008)。稀疏置换不变协方差估计。电子。《美国联邦法律大全》第2卷第494-515页·Zbl 1320.62135号 ·doi:10.1214/08-EJS176
[30] Speed,T.P.和Kiiveri,H.T.(1986年)。有限图上的高斯马尔可夫分布。Ann.Statist公司。14 138-150. ·Zbl 0589.62033号 ·doi:10.1214/aos/1176349846
[31] Toh,K.C.、Todd,M.J.和Tutuncu,R.H.(1999)。SDPT3-用于半定二次线性编程的MATLAB软件包。可从获取·Zbl 0997.90060号
[32] Wainwright,M.J.(2009)。使用(ell_1)约束二次规划(Lasso)恢复高维和噪声稀疏性的锐化阈值。IEEE传输。通知。理论55 2183-2202·Zbl 1367.62220号 ·doi:10.1109/TIT.2009.2016018
[33] Wang,C.、Sun,D.和Toh,K.C.(2010年)。用Newton-CG原始近点算法求解对数决定优化问题。SIAM J.Optim公司。20 2994-3013. ·Zbl 1211.90130号 ·doi:10.1137/090772514
[34] Watson,G.A.(1992年)。一些矩阵范数的次微分的特征。线性代数应用。170 33-45. ·Zbl 0751.15011号 ·doi:10.1016/0024-3795(92)90407-2
[35] Witten,D.M.、Tibshirani,R.和Hastie,T.(2009年)。一种惩罚矩阵分解,应用于稀疏主成分和正则相关分析。生物统计学10 515-534。
[36] Wu,W.B.和Pourahmadi,M.(2003)。纵向数据大协方差矩阵的非参数估计。生物特征90 831-844·Zbl 1436.62347号 ·doi:10.1093/biomet/90.4.831
[37] Zhao,P.和Yu,B.(2006)。关于拉索模型选择的一致性。J.马赫。学习。第7 2541-2563号决议·Zbl 1222.62008年
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。