×

拟合约束拉索的算法。 (英语) Zbl 07498997号

摘要:我们比较了解决约束套索问题的各种计算策略。顾名思义,约束套索扩展了广泛使用的套索来处理线性约束,这允许用户将先验信息合并到模型中。除了二次规划外,我们还采用了交替方向乘数法(ADMM),并推导出了一种有效的求解路径算法。通过仿真和基准数据示例,我们比较了不同的算法,并就不同大小数据的效率和准确性提供了实用建议。我们还证明了,对于任意罚矩阵,广义套索可以转化为约束套索,反之则不成立。因此,我们的方法也可以用于估计具有广泛应用的广义套索。实现算法的代码可以在Matlab工具箱SparseReg和Julia包ConstrainedLass中免费获得。本文的补充材料可在网上获得。

MSC公司:

62至XX 统计
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Altenbuchinger,M。;Rehberg,T。;扎卡里亚斯,H.U。;Stämmler,F。;Dettmer,K。;韦伯,D。;Hiergiest,A。;盖斯纳,A。;霍勒,E。;Oefner,P.J。;Sprang,R.,参考点不敏感分子数据分析,生物信息学,33,219-226(2017)
[2] 阿诺德·T·B。;Tibshirani,R.J.,genlasso:广义Lasso问题的路径算法(2014)
[3] ---,《广义Lasso双路径算法的高效实现》,《计算与图形统计杂志》,25,1-27(2016)
[4] 博伊德,S。;北卡罗来纳州帕里赫。;朱,E。;佩莱托,B。;Eckstein,J.,《通过乘数交替方向方法进行分布式优化和统计学习,机器学习的基础和趋势》,3,1-122(2011)·兹比尔1229.90122
[5] 布雷德尔,M。;布雷德尔,C。;Juric,D。;Harsh,G.R。;沃格尔,H。;雷希特,L.D。;Sikic,B.I.,《人类胶质脑肿瘤遗传改变的高分辨率全基因组定位》,癌症研究,65,4088-4096(2005)
[6] 陈,J。;Chen,Z.,大模型空间模型选择的扩展贝叶斯信息准则,生物特征,95759-771(2008)·Zbl 1437.62415号
[7] ---《小n大P稀疏GLM的扩展BIC》,《统计》,22,555-574(2012)·Zbl 1238.62080号
[8] De Cock,D.,Ames,Iowa:作为学期末回归项目的波士顿住房数据替代方案,《统计教育杂志》,19(2011)
[9] 埃夫隆,B。;哈斯蒂,T。;约翰斯通,I。;Tibshirani,R.,最小角度回归,《统计学年鉴》,32407-499(2004)·Zbl 1091.62054号
[10] El-Arini,K。;徐,M。;福克斯·E·B。;Guestrin,C.,《通过读者代表文件》,《第19届计算机械协会知识发现和数据挖掘国际会议论文集》,14-22(2013),纽约州纽约市:纽约州纽约州计算机械协会
[11] 晚安,J.H.,《SWEEP算子教程》,《美国统计学家》,第33期,第149-158页(1979年)·Zbl 0439.62047号
[12] He,T.,Lasso和线性等式和不等式约束下的一般L1-正则化回归(2011)
[13] 霍勒,E。;Butzhammer,P。;施密德,K。;Hundsrucker,C。;Koestler,J。;Peter,K。;朱伟。;Sporrer,D。;Hehlgans,T。;Kreutz,M。;霍勒,B。;沃尔夫·D·。;爱丁格尔,M。;安德烈森,R。;莱文,J.E。;费拉拉,J.L。;Gessner,A。;斯潘,R。;Oefner,P.J.,异基因干细胞移植患者粪便微生物组的宏基因组分析:多样性丧失与系统性抗生素的使用相关,在胃肠道移植物抗宿主病中更为显著,血液和骨髓移植生物学,20,640-645(2014)
[14] 胡,Q。;曾,P。;Lin,L.,线性约束广义拉索的对偶和自由度,计算统计与数据分析,86,13-26(2015)·Zbl 1468.62084号
[15] 胡,Z。;Follmann,D.A。;Miura,K.,《通过基于非阴性拉索的变量选择进行疫苗设计》,《医学统计学》,341791-1798(2015)
[16] 黄,H。;严,J。;聂,F。;黄,J。;蔡伟(Cai,W.)。;Saykin,A.J。;Shen,L.,脑解剖和遗传网络分析的新型稀疏单纯形模型,医学图像计算和计算机辅助干预国际会议,625-632(2013),柏林,海德堡:施普林格,柏林,德国海德堡,柏林,美国海德堡
[17] 黄,T。;龚,H。;杨,C。;He,Z.,《蛋白质拉索:Shotgun蛋白质组学中蛋白质推断问题的拉索回归方法》,计算生物学和化学,43,46-54(2013)
[18] 詹姆斯·G·M。;保尔森,C。;Rusmevichienton,P.,《惩罚与约束回归》(2013年)
[19] P.D.琼斯。;帕克·D·E。;奥斯本,T.J。;Briffa,K.R.,《全球和半球温度异常——陆地和海洋仪器记录,趋势:全球变化数据概要》(2016年)
[20] Kump,P。;Bai,E.-W。;Chan,K.-S。;艾辛格,B。;Li,K.,通过RIVAL(在拉索迭代中删除无关变量)选择变量及其在核材料检测中的应用,Automatica,482107-2115(2012)·Zbl 1257.93091号
[21] Lange,K.,Optimization(2013),纽约州纽约市:Springer-Verlag,纽约州·Zbl 1273.90002号
[22] Li,H.,微生物学、宏基因组学和高维成分数据分析,《统计及其应用年度回顾》,273-94(2015)
[23] Lin,W。;Shi,P。;冯·R。;Li,H.,《成分协变量回归中的变量选择》,《生物统计学》,101785-797(2014)·Zbl 1306.62164号
[24] 米歇尔斯,E。;De Preter,K。;Van Roy,N。;Speleman,F.,通过阵列比较基因组杂交检测癌症中的DNA拷贝数变化,医学遗传学,9,574-584(2007)
[25] 墨菲,S。;Nguyen,V.H.,肠道微生物在移植物抗宿主病、白血病和淋巴瘤中的作用,52,1844-1856(2011)
[26] R核心团队,R:A Language and Environment for Statistical Computing(2018),奥地利维也纳:R统计计算基金会,奥地利维也纳
[27] Rosset,S。;朱军,分段线性正则解路径,《统计学年鉴》,351012-1030(2007)·兹比尔1194.62094
[28] Shi,P。;张,A。;李宏,微生物组分数据的回归分析,应用统计学年鉴,1019-1040(2016)·Zbl 1398.62346号
[29] Stein,C.M.,多元正态分布平均值的估计,《统计年鉴》,第9期,第1135-1151页(1981年)·Zbl 0476.62035号
[30] Taur,Y。;泽维尔,J.B。;利普玛,L。;乌贝达,C。;Goldberg,J。;A.戈本。;Lee,Y.J。;Dubin,K.A。;新墨西哥州索契。;Viale,A。;Perales,医学硕士。;Jenq,R.R。;布林克,M.R.M。;Pamer,E.G.,异基因造血干细胞移植患者的肠道支配和菌血症风险,临床传染病,55,905-914(2012)
[31] Tibshirani,R.,《通过拉索进行回归收缩和选择》,《皇家统计学会杂志》,58267-288(1996)·Zbl 0850.62538号
[32] Tibshirani,R。;桑德斯,M。;Rosset,S。;朱,J。;K.奈特(K.K.Knight),《通过融合套索实现的稀疏与平滑》(Sparsity and Smoothness via the Fused Lasso),《皇家统计学会杂志》,第67期,第91-108页(2005年)·Zbl 1060.62049号
[33] Tibshirani,R。;Suo,X.,《有序拉索和稀疏时间标记回归》,《技术计量学》,58415-423(2016)
[34] Tibshirani,R。;Wang,P.,使用融合拉索对CGH数据进行空间平滑和热点检测,生物统计学,9,18-29(2008)·Zbl 1274.62886号
[35] Tibshirani,R.J。;Hoefling,H。;Tibshirani,R.,《近等渗回归》,技术计量学,53,54-61(2011)
[36] Tibshirani,R.J。;Taylor,J.,《广义拉索解的路径》,《统计学年鉴》,第39期,第1335-1371页(2011年)·Zbl 1234.62107号
[37] ---《拉索问题中的自由度》,《统计年鉴》,第40期,第1198-1232页(2012年)·Zbl 1274.62469号
[38] Waikar,S.S。;Sabbisetti,V.S。;Bonvente,J.V.,肾小球滤过率变化期间尿生物标记物对肌酐的标准化,《肾脏国际》,78486-494(2010)
[39] 韦伯,D。;Oefner,P.J。;Hiergeist,A。;Koestler,J。;Gessner,A。;韦伯,M。;哈恩,J。;沃尔夫·D·。;Stämmler,F。;斯潘,R。;W.先生。;Dettmer,K。;Holler,E.,移植后早期尿液中不含氧硫酸盐水平低反映出微生物组被破坏,与不良预后相关,《血液》,1261723-1728(2015)
[40] Wickham,H.,ggplot2:《数据分析的优雅图形》(2009),纽约:Springer-Verlag,纽约·Zbl 1170.62004号
[41] Wu,L。;Yang,Y。;Liu,H.,非负Lasso及其在指数跟踪中的应用,计算统计与数据分析,70116-126(2014)·Zbl 1471.62220号
[42] Wu,W.B。;Woodroof,M。;Mentz,G.,《等渗回归:改变点问题的另一种观点》,《生物特征》,88,793-804(2001)·兹比尔0985.62076
[43] 周,H。;Lange,K.,《约束估计的路径算法》,《计算与图形统计杂志》,22,261-283(2013)
[44] 周,H。;Wu,Y.,正则化统计估计的通用路径算法,美国统计协会杂志,109,686-699(2014)·Zbl 1367.62223号
[45] 邹,H。;哈斯蒂,T。;Tibshirani,R.,《论拉索的自由度》,《统计年鉴》,352173-2192(2007)·Zbl 1126.62061号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。