×

(L_{1})正则化稀疏协方差选择的一种非精确内点方法。 (英语) Zbl 1208.90131号

摘要:稀疏协方差选择问题可以表示为具有大量线性约束的对数决定(log-det)半定规划(SDP)问题。基于求解Schur补码方程的标准原对偶内点方法如果用于求解这些SDP,将遇到严重的计算瓶颈。在本文中,我们考虑了一种定制的不精确原始-对偶路径内点算法,用于解决由稀疏协方差选择问题引起的大规模对数集SDP问题。我们的不精确算法通过预处理迭代求解器在每次迭代中求解大型线性方程组。通过利用稀疏协方差选择问题中的结构,我们能够设计高效的预条件器来有效地求解大型和病态线性系统。对合成和实际协方差选择问题的数值实验表明,我们的算法效率很高,优于其他现有算法。

MSC公司:

90C22型 半定规划
90摄氏51度 内部点方法
90C06型 数学规划中的大尺度问题
90C25型 凸面编程
65层10 线性系统的迭代数值方法
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Banerjee O.,El Ghaoui L.,d'Aspremont A.:通过多元高斯或二进制数据的稀疏最大似然估计进行模型选择。J.马赫。学习。第9号决议,485–516(2008年)·Zbl 1225.68149号
[2] Bilmes,J.A.:自动语音识别的自然统计模型。加州大学伯克利分校博士论文(1999年)
[3] Burer S.、Monteiro R.D.C.、Zhang Y.:一类大规模SDP基于梯度的对数-载波算法的计算研究。数学。程序。95, 359–379 (2003) ·Zbl 1030.90076号 ·doi:10.1007/s10107-002-0353-7
[4] Chen,S.S.,Gopinath,R.A.:声学建模中的模型选择。In:程序。EUROSPEECH’99,第1087–1090页,匈牙利布达佩斯(1999)
[5] Dahl J.,Vandenberghe L.,Roychowdhury V.:通过弦嵌入对非弦图进行协方差选择。优化。方法软件。23, 501–520 (2008) ·Zbl 1151.90514号 ·网址:10.1080/1055678080202693
[6] d'Aspremont,A.:识别小额均值回复投资组合。数量。《金融》(2010年出版)
[7] d'Aspremont A.,Banerjee O.,El Ghaoui L.:稀疏协方差选择的一阶方法。SIAM J.矩阵分析。申请。30, 56–66 (2008) ·Zbl 1156.90423号 ·数字对象标识代码:10.1137/060670985
[8] Dempster A.P.:协方差选择。生物统计学28,157–175(1972)·doi:10.2307/2528966
[9] Dobra A.:全基因组数据的变量选择和依赖网络。生物统计学10,621–639(2009)·doi:10.1093/biostatistics/kxp018
[10] Edwards D.:图形建模导论,第二版。施普林格,纽约(2000年)·Zbl 0952.62003号
[11] Fan J.、Feng Y.、Wu Y.:通过自适应LASSO和SCAD惩罚进行网络探索。附录申请。统计数据3521–541(2009年)·Zbl 1166.62040号 ·doi:10.1214/08-AOAS215
[12] Freund,R.,Nachtigal,N.:对称不定线性系统的新Krylov子空间方法。摘自:美国亚特兰大第十四届IMACS计算与应用数学世界大会论文集,第1253-1256页(1994)
[13] Friedman J.、Hastie T.、Tibshirani R.:用图形套索进行稀疏逆协方差估计。生物统计9,432–441(2008)·兹比尔1143.62076 ·doi:10.1093/biostatistics/kxm045
[14] Golub T.R.、Slonim D.K.、Tamayo P.、Huard C.、Gaasenbeek M.、Mesirov J.P.、Coller H.、Loh M.L.、Downing J.R.、Caligiuri M.A.、Bloomfield C.D.:癌症的分子分类:通过基因表达监测进行类别发现和预测。《科学》286、531–537(1999)·doi:10.1126/science.286.5439.531
[15] Hedenfalk I.、Duggan D.、Chen Y.、Radmacher M.、Bittner M.、Simon R.、Meltzer P.、Gusterson B.、Esteller M.、Raffeld M.、Yakhini Z.、Ben-Dor A.、Dougherty E.、Kononen J.、Bubendorf L.、Fehrle W.、Pittaluga S.、Gruvberger S.、Loman N.、Johansson O.、Olsson H.、Wilfond B.、Sauter G.、Kallioniemi O.-P.、Borg A.、。,Trent J.:遗传性乳腺癌的基因表达谱。北英格兰。《医学杂志》344、539–548(2001)·doi:10.1056/NEJM200102223440801
[16] Jarre F.,Rendl F.:线性二次规划的一种增广原对偶方法。SIAM J.Optim公司。2008年8月19日至823日·兹比尔1173.90497 ·doi:10.1137/070687128
[17] Krishnamurthy,V.,d'Aspremont,A.:协方差选择的路径算法。预印本(2009年)
[18] Lan,G.,Lu,Z.,Monterio,R.D.:锥规划的具有({\mathcal{O}(1/\epsilon)})迭代复杂性的原对偶一阶方法。数学。程序。(2010年,待发布)
[19] Lauritzen,S.L.:图形模型。收录于:《牛津统计科学丛书》,第17卷。克拉伦登出版社/牛津大学出版社/牛津科学出版物,纽约(1996)·Zbl 0907.62001
[20] Lu Z.:稀疏协方差选择的平滑优化方法。SIAM J.Optim公司。19, 1807–1827 (2008) ·Zbl 1179.90257号 ·doi:10.1137/070695915
[21] 陆志:一般稀疏逆协方差选择的自适应一阶方法。SIAM J.矩阵分析。申请。31, 2000–2016 (2010) ·Zbl 1206.90115号 ·doi:10.1137/080742531
[22] Meinshausen N.,Bühlmann P.:用套索选择高维图和变量。Ann.Stat.34,1436–1462(2006)·Zbl 1113.62082号 ·doi:10.1214/0090536000000281
[23] Nesterov Y.:非光滑函数的平滑最小化。数学。程序。103, 127–152 (2005) ·Zbl 1079.90102号 ·doi:10.1007/s10107-004-0552-5
[24] Nesterov Y.,Todd M.J.:自缩放锥体的原始-对偶内点方法。SIAM J.Optim公司。8, 324–364 (1998) ·Zbl 0922.90110号 ·doi:10.1137/S1052623495290209
[25] Pittman J.,Huang E.,Dressman H.,Hong C.-F.,Cheng S.H.,Tsou M.-H.,Chen C.-M.,Bild A.,Iversen E.S.,Hung A.T.,Nevins J.R.,West M.:临床和基因表达信息的集成建模,用于个性化预测疾病结果。程序。国家。阿卡德。科学。美国101(22),8431–8436(2004)·doi:10.1073/pnas.0401736101
[26] Rockafellar R.T.:增广拉格朗日和近点算法在凸规划中的应用。数学。操作。第1号决议,97–116(1976年)·Zbl 0402.90076号 ·doi:10.1287/门1.2.97
[27] Saad,Y.:稀疏线性系统的迭代方法,第2版。费城工业和应用数学学会(2003年)·Zbl 1031.65046号
[28] Sachs K.、Perez O.、Peer D.、Lauffenburger D.A.、Nolan G.P.:源自多参数单细胞数据的因果蛋白信号网络。《科学》308、523–529(2005)·doi:10.1126/science.1105809
[29] Scheinberg,K.,Rish,I.:使用贪婪坐标上升法学习稀疏高斯马尔可夫网络。收录:Balcázar,J.、Bonchi,F.、Gionis,A.、Sebag,M.(编辑)《数据库中的机器学习和知识发现》,计算机科学讲义6323。第196-212页(2010年)
[30] Storey J.D.,Tibshirani R.:全基因组研究的统计意义。程序。国家。阿卡德。科学。美国100(16),9440–9445(2003)·Zbl 1130.62385号 ·doi:10.1073/pnas.1530509100
[31] Sturm J.F.:使用SeDuMi 1.02,一个用于对称锥体优化的MATLAB工具箱。优化。方法软件。11/12, 625–653 (1999) ·兹伯利0973.90526 ·doi:10.1080/10556789908805766
[32] Toh K.-C.:在增广系统上通过迭代求解器求解大规模半定程序。SIAM J.Optim公司。14670–698(2003年)·Zbl 1071.90026号 ·doi:10.1137/S10526234024119
[33] Toh K.C.:凸二次SDP的不精确原对偶路径跟踪算法。数学。程序。112, 221–254 (2008) ·Zbl 1136.90027号 ·doi:10.1007/s10107-006-0088-y
[34] Toh K.C.、Todd M.J.、TüTüncüR.H.:SDPT3–半定编程的MATLAB软件包,1.3版。优化。方法软件。11/12, 545–581 (1999) ·Zbl 0997.90060号 ·doi:10.1080/10556789908805762
[35] Tsuchiya T.,Xia Y.:标准多项式时间原始-对偶路径允许算法对具有半定约束的加权行列式最大化问题的扩展。派克靴。J.优化。3, 165–182 (2007) ·Zbl 1137.65044号
[36] 上野U.,津谷T.:逆空间中的协方差正则化。Q.J.R.Meteorol公司。Soc.135、1133–1156(2009年)·doi:10.1002/qj.445
[37] Vandenberghe L.,Boyd S.,Wu S.-P.:线性矩阵不等式约束下的行列式最大化。SIAM J.矩阵分析。申请。19, 499–533 (1998) ·Zbl 0959.90039号 ·doi:10.1137/S0895479896303430
[38] Wang C.,Sun D.,Toh K.-C.:用牛顿-克近似点算法求解对数确定性优化问题。SIAM J.Optim公司。20, 2994–3013 (2010) ·Zbl 1211.90130号 ·doi:10.1137/090772514
[39] Whittaker,J.:应用多元统计中的图形模型。收录于:概率与数理统计威利系列:概率与数学统计。奇切斯特·威利(1990)·Zbl 0732.62056号
[40] Wille,A.、Zimmermann,P.、Vranová,E.、Fürholz,A.、Laule,O.、Bleuler,S.、Hennig,L.、Prelić,A.、von Rohr,P.,Thiele,L.,Zitzler,E.、Gruissem,W.、Bühlmann,P:拟南芥类异戊二烯基因网络的稀疏高斯图形建模。基因组生物学。5,R92(2004)
[41] Wong F.,Carter C.K.,Kohn R.:协方差选择模型的有效估计。生物特征90、809–830(2003)·Zbl 1436.62346号 ·doi:10.1093/biomet/90.4.809
[42] Wu W.B.,Pourahmadi M.:纵向数据大协方差矩阵的非参数估计。《生物特征》90,831–844(2003)·Zbl 1436.62347号 ·doi:10.1093/biomet/90.4.831
[43] Yeung K.Y.,Bumgarner R.E.,Raftery A.E.:贝叶斯模型平均:为微阵列数据开发改进的多类、基因选择和分类工具。生物信息学21,2394–2402(2005)·doi:10.1093/bioinformatics/bti319
[44] 袁明、林毅:高斯图形模型中的模型选择和估计。《生物特征》94,19-35(2007)·Zbl 1142.62408号 ·doi:10.1093/biomet/asm018
[45] Yuan,X.:稀疏协方差选择的交替方向方法。预印本(2009年)
[46] Zhang Y.:关于将一些原对偶内点算法从线性规划扩展到半定规划。SIAM J.Optim公司。8,365–386(1998年)·Zbl 0913.6500号 ·doi:10.1137/S1052623495296115
[47] 赵X.Y.,Sun D.,Toh K.C.:半定规划的Newton-CG增广拉格朗日方法。SIAM J.Optim公司。20, 1737–1765 (2010) ·Zbl 1213.90175号 ·数字对象标识代码:10.1137/080718206
[48] 周刚,托克强:半定规划不精确不可行内点算法的多项式性。数学。程序。99, 261–282 (2004) ·邮编1098.90051 ·doi:10.1007/s10107-003-0431-5
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。