×

微分网络分析的高效计算及其在二次判别分析中的应用。 (英语) Zbl 1504.62083号

摘要:差分网络分析是一个应用广泛的重要统计问题。许多统计学家关注二进制问题,并建议通过获得精度矩阵之间差异的稀疏估计来进行此类分析。这些方法得到了良好的理论特性和实际性能的支持。然而,这些方法的有效计算仍然是一个具有挑战性的问题。提出了一种用于差分网络分析的新算法SMORE算法。SMORE算法具有较低的存储成本和较高的计算速度,特别是在存在强稀疏性的情况下。同时,SMORE算法为二进制和多个网络问题提供了统一的框架。此外,SMORE算法还可以应用于高维二次判别分析问题,为多类高维二阶判别分析提供了一种新的方法。数值研究证实了所提出的SMORE算法在微分网络分析和二次判别分析中的稳定性和效率。

MSC公司:

62H30型 分类和区分;聚类分析(统计方面)
第62页第10页 统计学在生物学和医学中的应用;元分析
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Bandyopadhyay,S。;梅塔,M。;郭,D。;Sung,M.-K。;庄,R。;Jaehnig,E.J。;博登米勒,B。;Licon,K。;科普兰,W。;页岩,M。;费德勒,D。;Dutkowski,J。;盖诺莱,A。;van Attikum,H。;Shokat,K.M。;R.D.科洛德纳。;嗯,W.-K。;Aebersold,R。;基奥,M.-C。;新泽西州科罗根。;Ideker,T.,《DNA损伤后基因网络的重组》,《科学》,33060091385-1389(2010)
[2] 班纳吉,O。;El Ghaoui,L。;d'Aspremont,A.,《通过多元高斯或二进制数据的稀疏最大似然估计进行模型选择》,J.Mach。学习。第9485-516号决议(2008年)·Zbl 1225.68149号
[3] 巴拉巴西,A.-L。;北卡罗来纳州古尔巴切。;Loscalzo,J.,《网络医学:基于网络的人类疾病治疗方法》,《自然遗传学评论》。,12, 1, 56 (2011)
[4] Barabasi,A.-L。;Oltvai,Z.N.,《网络生物学:理解细胞的功能组织》,《自然遗传学评论》。,5, 2, 101 (2004)
[5] 巴索,K。;Margolin,A。;斯托洛维茨基,G。;克莱因,美国。;Dalla-Favera,R。;Califano,A.,《人类B细胞调控网络的逆向工程》,《自然遗传学》。,37, 382-390 (2005)
[6] 贝克,A。;Teboulle,M.,线性反问题的快速迭代收缩阈值算法,SIAM J.成像科学。,2, 1, 183-202 (2009) ·兹比尔1175.94009
[7] Bertsekas,D.P.,非线性规划(2016),Athena Scientific·兹比尔1360.90236
[8] Boik,R.J.,协方差矩阵的谱模型,生物统计学,89,1,159-182(2002)·Zbl 0997.62046号
[9] Bonneau,R。;法西奥蒂,M。;赖斯,D。;施密德,A。;潘,M。;Kaur,A。;托尔森,V。;Shannon,P。;约翰逊,M。;Bare,J.C。;西龙堡。;Vuthoori,M。;怀特黑德,K。;Madar,A。;铃木,L。;Mori,T。;Chang,D.-E。;Diruggiero,J。;H Johnson,C。;Baliga,N.,自由活细胞中生理转录控制的预测模型,细胞,1311354-1365(2008)
[10] 博伊德,S。;北卡罗来纳州帕里赫。;朱,E。;Peleato,B。;Eckstein,J.,《通过交替方向乘数法进行分布式优化和统计学习》,Found。趋势马赫数。学习。,3, 1, 1-122 (2011) ·Zbl 1229.90122号
[11] Breiman,L.,《随机森林》,马赫。学习。,45, 1, 5-32 (2001) ·Zbl 1007.68152号
[12] 蔡,T。;Liu,W.,稀疏协方差矩阵估计的自适应阈值,J.Amer。统计师。协会,106,494,672-684(2011)·Zbl 1232.62086号
[13] Cai,T.T。;刘伟。;Luo,X.,稀疏精度矩阵估计的约束\(\ell_1\)最小化方法,J.Amer。统计师。协会,106,494,594-607(2011)·Zbl 1232.62087号
[14] 坎迪斯,E。;Tao,T.,Dantzig选择器:当p远大于n时的统计估计,Ann.Statist。,35, 6, 2313-2351 (2007) ·Zbl 1139.62019号
[15] Chiquet,J。;Grandvalet,Y。;Ambroise,C.,推断多重图形结构,统计计算。,21, 4, 537-553 (2011) ·Zbl 1221.62085号
[16] 克莱门森,L。;哈斯蒂,T。;维滕,D。;Ersbøll,B.,稀疏判别分析,Technometrics,53,4406-413(2011)
[17] 库克·R·D。;Forzani,L.,协方差减少模型:协方差矩阵谱建模的替代方法,生物统计学,95,4,799-812(2008)·Zbl 1437.62428号
[18] 科尔特斯,C。;Vapnik,V.,支持向量网络,马赫。学习。,20, 3, 273-297 (1995) ·Zbl 0831.68098号
[19] Dimitriadou,E。;霍尼克,K。;Leisch,F。;梅耶,D。;Weingessel,A.,E1071:统计部门的其他功能(E1071),TU Wien(2009),R包版本1.5-24
[20] 埃夫隆,B。;哈斯蒂,T。;约翰斯通,I。;Tibshirani,R.,最小角回归,Ann.Statist。,32, 2, 407-499 (2004) ·Zbl 1091.62054号
[21] 范,J。;Feng,Y。;Tong,X.,《高维空间中的分类之路:正则化最优仿射鉴别算子》,J.R.Stat.Soc.Ser。B统计方法。,74, 4, 745-771 (2012) ·Zbl 1411.62167号
[22] 范,J。;Ke,Z.T。;刘,H。;Xia,L.,QUADRO:一种基于瑞利商优化的监督降维方法,Ann.Statist。,431498(2015年)·Zbl 1317.62054号
[23] Flury,B.N.,《k群中的常见主成分》,J.Amer。统计师。协会,79,388,892-898(1984)
[24] Flury,B.K.,通用主成分模型的两种推广,Biometrika,74,1,59-69(1987)·Zbl 0613.62076号
[25] Franks,A。;Hoff,P.,多组协方差估计的共享子空间模型(2016),arXiv预印本arXiv:1607.03045
[26] 弗里德曼,J。;哈斯蒂,T。;Höfling,H。;Tibshirani,R.,路径坐标优化,Ann.Appl。统计,1,2,302-332(2007)·Zbl 1378.90064号
[27] 弗里德曼,J。;哈斯蒂,T。;Tibshirani,R.,《利用图形LASSO进行稀疏逆协方差估计》,生物统计学(英国牛津),第9期,第432-441页(2008年)·兹比尔1143.62076
[28] Friedman,J.、Hastie,T.、Tibshirani,R.,2009年。在:统计学习的要素。收录:Springer统计系列,第1卷。美国纽约·Zbl 1273.62005年
[29] 弗里德曼,J。;哈斯蒂,T。;Tibshirani,R.,通过坐标下降广义线性模型的正则化路径,J.Stat.Softw。,33, 1, 1-22 (2010)
[30] Goldstein,T。;Osher,S.,《L1正则化问题的分裂bregman方法》,SIAM J.成像科学。,2, 2, 323-343 (2009) ·Zbl 1177.65088号
[31] 郭杰。;莱维纳,E。;Michailidis,G。;Zhu,J.,多图形模型的联合估计,Biometrika,98,1,1-15(2011)·Zbl 1214.62058号
[32] 哈,M.J。;巴拉丹达尤塔帕尼,V。;Do,K.-A.,DINGO:基因组学中的差异网络分析,生物信息学,31,21,3413-3420(2015)·Zbl 1335.46011号
[33] 新泽西州哈德森。;整流器,A。;Dalrymple,B.P.,表达数据的差异接线分析正确识别了包含因果突变的基因,PLoS-Comput。生物学,5840-845(2009)
[34] 江,B。;王,X。;Leng,C.,稀疏二次判别分析的直接方法,J.Mach。学习。第19号、第1号、第1098-1134号决议(2018年)·兹比尔1466.62353
[35] Lam,C。;Fan,J.,大协方差矩阵估计中的稀疏性和收敛速度,Ann.Statist。,37、6B、4254-4278(2009)·Zbl 1191.62101号
[36] Ledoit,O。;Wolf,M.,《大维协方差矩阵的良好估计》,《多元分析杂志》。,88, 2, 365-411 (2004) ·兹比尔1032.62050
[37] Leiserson,M。;范丁,F。;吴,H.-T。;多布森,J。;V Eldridge,J。;L Thomas,J。;Papoutsaki,A。;Kim,Y。;牛,B。;麦克莱伦,M。;劳伦斯,M。;Gonzalez-Perez,A。;Tamborero,D。;Cheng,Y。;A Ryslik,G。;勒佩兹·比加斯,N。;盖茨,G。;丁·L。;Raphael,B.,《泛癌网络分析》,《自然遗传学》,识别跨通路和蛋白质复合物的罕见体细胞突变组合。(2014)
[38] 李,Q。;邵,J.,高维数据的稀疏二次判别分析,统计学。Sinica,25,2,457-473(2015)·Zbl 06503804号
[39] 李,X。;Zhao,T。;袁,X。;Liu,H.,R,J.Mach中高维线性回归和精确矩阵估计的flare包。学习。研究,16553-557(2015)·Zbl 1337.62007号
[40] Liaw,A。;Wiener,M.,“随机森林”包:Breiman和Cutler的分类和回归随机森林,第4卷,6-10(2014),R开发核心团队
[41] 刘伟,多稀疏高斯图形模型的结构相似性和差异性检验,Ann.Statist。,45, 6, 2680-2707 (2017) ·兹比尔1486.62178
[42] 刘伟。;Luo,X.,通过稀疏列逆算子进行高维稀疏精度矩阵估计(2012),arXiv预印本
[43] Mai,Q。;Yang,Y。;邹,H.,多类稀疏判别分析,统计学。Sinica,29,97-111(2019)·Zbl 1412.62081号
[44] Mai,Q。;邹,H。;Yuan,M.,超高维稀疏判别分析的直接方法,Biometrika,99,1,29-42(2012)·Zbl 1437.62550号
[45] Meier,L。;Van De Geer,S。;Bühlmann,P.,logistic回归的组套索,J.R.Stat.Soc.Ser。B统计方法。(2007年)
[46] 明绍森,N。;Bühlmann,P.,《高维图与套索变量选择》,Ann.Statist。,34, 3, 1436-1462 (2006) ·Zbl 1113.62082号
[47] 莫汉,K。;钟,M。;韩,S。;维滕,D。;Lee,S。;Fazel,M.,《高斯图形模型的结构化学习》(Pereira,F.;Burges,C.J.C.;Bottou,L.;Weinberger,K.Q.,《神经信息处理系统的进展》,第25卷(2012年),Curran Associates,Inc.),620-628
[48] 奥尔特加,J.M。;Rheinboldt,W.C.,《多变量非线性方程的迭代解法》(2000年),工业和应用数学学会:美国宾夕法尼亚州费城·Zbl 0949.65053号
[49] 潘,Y。;Mai,Q。;Zhang,X.,高维协变调整张量分类,J.Amer。统计师。协会,1141305-1319(2019)·Zbl 1428.62291号
[50] 帕特里克·D。;裴,W。;M.,W.D.,《跨多类协方差逆估计的联合图形套索》,J.R.Stat.Soc.Ser。B统计方法。,76, 2, 373-397 (2013) ·Zbl 07555455号
[51] Pereira-Leal,J.B。;恩赖特,A.J。;Ouzounis,C.A.,《从蛋白质相互作用网络中检测功能模块》,《蛋白质》,54,1,49-57(2004)
[52] Schott,J.R.,部分公共主成分子空间,生物统计学,86,4,899-908(1999)·Zbl 0942.62066号
[53] 沙·F。;Saul,L.K。;Lee,D.D.,支持向量机中非负二次规划的乘法更新,(Becker,S.;Thrun,S.,Obermayer,K.,《神经信息处理系统的进展》,第15卷(2003),麻省理工出版社),1065-1072
[54] 沙列夫·施瓦茨,S。;Tewari,A.,《L1调节损失最小化的随机方法》,J.Mach。学习。第12号决议,1865-1892年(2011年)·兹比尔1280.62081
[55] 邵,J。;Wang,Y。;邓,X。;王珊,高维数据的阈值稀疏线性判别分析,Ann.Statist。,39, 2, 1241-1265 (2011) ·Zbl 1215.62062号
[56] Sun,T。;Zhang,C.-H.,用定标拉索反演稀疏矩阵,J.Mach。学习。第14、1、3385-3418号决议(2013年)·Zbl 1318.62184号
[57] Tibshirani,R.,通过Lasso,J.R.Stat.Soc.Ser.回归收缩和选择。B统计方法。,58, 267-288 (1996) ·Zbl 0850.62538号
[58] Tseng,P.,不可微极小化块坐标下降法的收敛性,J.Optim。理论应用。,109, 475-494 (2001) ·Zbl 1006.65062号
[59] Wang,W。;张,X。;Li,L.,公共归约子空间模型和网络交替分析,生物计量学(2019)·Zbl 1448.62193号
[60] Wille,A。;齐默尔曼,P。;弗拉诺娃,E。;Fürholz,A。;Laule,O。;布鲁勒,S。;Hennig,L。;Prelić,A。;冯·罗尔,P。;Thiele,L。;Zitzler,E。;格鲁森,W。;Bühlmann,P.,拟南芥类异戊二烯基因网络的稀疏图形高斯建模,基因组生物学。,5、11、R92(2004)
[61] Witten,D.M。;Tibshirani,R。;Hastie,T.,A惩罚矩阵分解,应用于稀疏主成分和典型相关分析,生物统计学,10,3,515-534(2009)·Zbl 1437.62658号
[62] Wu,Y.,基于常微分方程的求解路径算法,J.Nonparametr。统计,23,1,185-199(2011)·Zbl 1359.62300号
[63] Wu,T.T。;Lange,K.,套索惩罚回归的坐标下降算法,Ann.Appl。《法律总汇》,2,1224-244(2008)·Zbl 1137.62045号
[64] 徐,P。;朱,J。;朱,L。;Li,Y.,协方差增强判别分析,生物统计学,102,1,33-45(2015)·Zbl 1345.62091号
[65] 杨,J。;Zhang,Y.,压缩传感中(ell_1)问题的交替方向算法,SIAM J.Sci。计算。,33, 1, 250-278 (2011) ·Zbl 1256.65060号
[66] 尹,W。;奥舍,S。;Goldfarb,D。;Darbon,J.,Bregman迭代算法在压缩传感中的应用,《成像科学》。,1, 1, 143-168 (2008) ·Zbl 1203.90153号
[67] 袁,M.,通过线性规划进行高维逆协方差矩阵估计,J.Mach。学习。第11号决议,2261-2286(2010年)·Zbl 1242.62043号
[68] 袁,M。;Lin,Y.,《分组变量回归中的模型选择和估计》,J.R.Stat.Soc.Ser。B统计方法。,68, 1, 49-67 (2006) ·Zbl 1141.62030号
[69] 袁,M。;Lin,Y.,高斯图形模型中的模型选择和估计,生物统计学,94,1,19-35(2007)·Zbl 1142.62408号
[70] 袁,H。;Xi,R。;陈,C。;Deng,M.,通过套索惩罚的D-痕迹丢失进行的差分网络分析,Biometrika,104,4,755-770(2017)·Zbl 07072326号
[71] 张,T。;Zou,H.,通过套索惩罚的D轨迹损失进行稀疏精度矩阵估计,Biometrika,101,1,103-120(2014)·Zbl 1285.62063号
[72] 赵S.D。;Cai,T.T。;Li,H.,微分网络的直接估计,Biometrika,101,2,253-268(2014)·Zbl 1452.62865号
[73] 周,H。;Wu,Y.,正则化统计估计的通用路径算法,J.Amer。统计师。协会,109,506,686-699(2014)·Zbl 1367.62223号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。