×

分组惩罚分位数回归。 (英语) 兹伯利07596110

摘要:分位数回归模型已成为遗传学和组学领域广泛使用的统计工具,因为它们可以提供预测因子对结果的影响的丰富描述,而无需对结果-医生关系施加严格的参数假设。这项工作考虑了高维线性分位数回归模型中分组变量的选择问题。我们引入了一个同时具有群-lasso和群非凸惩罚的群惩罚伪分位数回归(GPQR)框架。我们使用伪分位数检查函数近似分位数回归检查函数。然后,利用优化最小原理,我们推导出一种简单且计算效率高的分组下降算法来解决分组惩罚分位数回归问题。我们用群Lasso罚建立了算法的收敛速度特性,并在高维环境中使用模拟来说明GPQR方法的性能。此外,我们证明了GPQR方法在阿尔茨海默病神经成像倡议研究数据的基于基因的关联分析和DNA甲基化数据的表观遗传学分析中的应用。

MSC公司:

62至XX 统计
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Alhamzawi,R。;Yu,K。;Benoit,DF,贝叶斯自适应套索分位数回归,统计模型,12,3,279-297(2012)·Zbl 07257880号 ·doi:10.1177/1471082X1101200304
[2] Aravkin AY、Kambadur A、Lozano AC、Luss R(2014)《有效稳健估计的稀疏分位数huber回归》。arXiv预打印arXiv:1402.4624
[3] 贝洛尼,A。;Chernozhukov,V.,高维稀疏模型中的l1-惩罚分位数回归,Ann Stat,39,1,82-130(2011)·Zbl 1209.62064号 ·doi:10.1214/10-AOS827
[4] 贝洛尼,A。;切尔诺朱科夫,V。;Wang,L.,方形套索:通过圆锥编程实现稀疏信号的关键恢复,Biometrika,98,4,791-806(2011)·Zbl 1228.62083号 ·doi:10.1093/biomet/asr043
[5] PJ Bickel;Ritov,Y。;Tsybakov,AB,套索和dantzig选择器的同时分析,Ann Stat,37,4,1705-1732(2009)·兹比尔1173.62022 ·doi:10.1214/08-AOS620
[6] 邦德尔,HD;雷奇,BJ;Wang,H.,非交叉分位数回归曲线估计,Biometrika,97,4,825-838(2010)·Zbl 1204.62061号 ·doi:10.1093/biomet/asq048
[7] Breheny,P.,grpreg:分组协变量回归模型的正则化路径,R Package Version,21-8(2015)
[8] Breheny,P。;Huang,J.,非凸惩罚回归的坐标下降算法,及其在生物特征选择中的应用,Ann Appl Stat,5,1,232(2011)·Zbl 1220.62095号 ·doi:10.1214/10-AOAS388
[9] Breheny,P。;Huang,J.,带分组预测因子的非凸惩罚线性和logistic回归模型的群下降算法,Stat-Comput,25,2,173-187(2015)·Zbl 1331.62359号 ·doi:10.1007/s11222-013-9424-2
[10] Briollais,L。;Durrieu,G.,分位数回归在最近遗传和组织学研究中的应用,《人类遗传学》,133,8,951-966(2014)·doi:10.1007/s00439-014-1440-6
[11] Ciuperca,G.,分位数模型中的自适应组套索选择,Stat Pap,60,1,173-197(2019)·兹比尔1411.62185 ·doi:10.1007/s00362-016-0832-1
[12] Durinck,S。;斯派曼,PT;伯尼,E。;Huber,W.,《基因组数据集与r/生物导体包集成的映射标识符》,《国家协议》,4,8,1184(2009)·doi:10.1038/nprot.2009.97
[13] 埃夫隆,B。;哈斯蒂,T。;Tibshirani,R.,讨论:dantzig选择器:当p远大于n时的统计估计,Ann Stat,35,6,2358-2364(2007)·doi:10.1214/009053607000000433
[14] 范,J。;Li,R.,《基于非一致惩罚似然的变量选择及其预言属性》,美国统计协会,96,456,1348-1360(2001)·Zbl 1073.62547号 ·doi:10.1198/016214501753382273
[15] 范,J。;范,Y。;Barut,E.,自适应稳健变量选择,Ann Stat,42,1,324(2014)·Zbl 1296.62144号 ·数字对象标识代码:10.1214/13-AOS1191
[16] 范,J。;薛,L。;Zou,H.,折叠凹惩罚估计的强预言优化,Ann Stat,42,3,819(2014)·Zbl 1305.62252号
[17] 北芬斯克。;Kneib,T。;Hothorn,T.,《通过增强加性分位数回归确定儿童严重营养不良的风险因素》,美国统计协会杂志,106,494,494-510(2011)·Zbl 1232.62146号 ·doi:10.1198/jasa.2011.ap09272
[18] Friedman J,Hastie T,Tibshirani R(2010)关于群套索和稀疏群套索的注释。arXiv预打印arXiv:1001.0736
[19] 顾毅。;Zou,H.,非对称最小二乘回归的高维推广及其应用,Ann Stat,44,6,2661-2694(2016)·Zbl 1364.62185号 ·doi:10.1214/15-AOS1431
[20] 哈希姆,H。;文西奥蒂,V。;Alhamzawi,R。;Yu,K.,使用组套索进行分类的分位数回归,高级数据分析分类,10,3,375-390(2016)·Zbl 1414.62318号 ·文件编号:10.1007/s11634-015-0206-x
[21] 赫兹,JM;谢尔,G。;Doerfler,W.,《影响小鼠胚胎干细胞外源DNA从头甲基化的因素》,《生物化学杂志》,274,34,24232-24240(1999)·doi:10.1074/jbc.274.34.24232文件
[22] 霍夫纳,B。;Mayr,A。;罗宾佐诺夫,N。;Schmid,M.,《R中基于模型的增强:使用R包mboost的实践教程》,《计算统计》,29,1-2,3-35(2014)·Zbl 1306.65069号 ·doi:10.1007/s00180-012-0382-5
[23] 霍曼,TJ;《古兰经》,MEI;Thornton Wells,TA,磷酸化tau与神经退行性变之间关系的基因修饰,阿尔茨海默氏症和痴呆症J阿尔茨海默氏症协会,10,637-645(2014)·doi:10.1016/j.jalz.2013.12.022
[24] 亨特博士;Lange,K.,通过MM算法进行分位数回归,J Compute Gr Stat,9,1,60-77(2000)
[25] 亨特博士;Lange,K.,《MM算法教程》,《美国统计》,58,1,30-37(2004)·doi:10.1198/0003130042836
[26] 詹宁斯,L。;Wong,K。;Teo,K.,考虑偏心运动的最优控制计算,ANZIAM J,38,2182-193(1996)·Zbl 0870.49017号
[27] 纪毅。;Lin,N。;Zhang,B.,使用Gibbs采样器进行二元和tobit分位数回归的模型选择,计算统计数据分析,56,4,827-839(2012)·Zbl 1243.62033号 ·doi:10.1016/j.csda.2011.10.003
[28] 朱班,R。;Ohlsson,H。;Maasoumy,M。;普瓦里埃,L。;Kolter,JZ,《2014年gefcom风力、太阳能和价格轨迹的多重分位数回归方法》,《国际J预测》,32,3,1094-1102(2016)·doi:10.1016/j.ij预测.2015.12.002
[29] Kato K(2011)高维稀疏分位数回归模型的组套索。arXiv预打印arXiv:1103.1458
[30] Kim,S。;Swaminathan,S。;沈,L。;Risacher,S。;Nho,K。;Foroud,T。;Shaw,L。;特洛伊亚诺夫斯基,J。;波特金,S。;Huentelman,M.,ADNI队列中脑脊液生物标记物a(β1-42)、t-tau和p-tau181p的全基因组关联研究,神经病学,76,1,69-79(2011)·doi:10.1212/WNL.0b013e318204a397
[31] Koenker,R.,线性模型l-估计的注释,Stat Prob Lett,2,6,323-325(1984)·Zbl 0626.62029号 ·doi:10.1016/0167-7152(84)90040-3
[32] Koenker,R.,纵向数据的分位数回归,《多元分析杂志》,91,1,74-89(2004)·Zbl 1051.62059号 ·doi:10.1016/j.jmva.2004.05.006
[33] Koenker R,Bassett G Jr(1978)回归分位数。经济计量学46(1):33-50·Zbl 0373.62038号
[34] Koenker,R。;Hallock,KF,分位数回归,《经济展望杂志》,15,4,143-156(2001)·doi:10.1257/jep.15.4.143
[35] Kozumi,H。;Kobayashi,G.,Gibbs Bayesian分位数回归抽样方法,J Stat Comput Simul,81,11,1565-1578(2011)·Zbl 1431.62018年 ·doi:10.1080/00949655.2010.496117
[36] Lakhal Chaieb,L.公司。;格林伍德,CM;Ouhourane,M。;Zhao,K。;Abdous,B。;Oualkacha,K.,《细胞系或单个细胞类型中基于序列分析方法的DNA甲基化图谱的平滑EM算法》,《Stat Appl Genet Mol Biol》,16,5-6,333-347(2017)·Zbl 1396.92060号
[37] 兰格,K。;帕普,JC;辛希默,JS;Sobel,EM,《下一代统计遗传学:高维数据的建模、惩罚和优化》,《年度修订统计应用》,第1期,第279-300页(2014年)·doi:10.1146/annurev-statistics-022513-115638
[38] 李毅。;Zhu,J.,L 1-范数分位数回归,J Comput Gr Stat,17,1,163-185(2008)·doi:10.1198/106186008X289155
[39] Li,J.等人。;张,Q。;陈,F。;X孟。;刘伟。;陈,D。;严,J。;Kim,S。;Wang,L。;Feng,W.,ADNI队列中脑脊液t-tau/a(β42)比率的全基因组关联和相互作用研究,神经生物老化,57,247-e1(2017)·doi:10.1016/j.neurobiolaging.2017.05.007
[40] 刘,Y。;Wu,Y.,使用非交叉约束的逐步多重分位数回归估计,Stat Interface,2,3,299-310(2009)·Zbl 1245.62039号 ·doi:10.4310/SII.2009.v2.n3.a4
[41] Mayr A、Binder H、Gefeller O、Schmid M(2014)推进算法的演变——从机器学习到统计建模。arXiv预打印arXiv:1403.1452
[42] Meier,L。;Van De Geer,S。;Bühlmann,P.,logistic回归的组套索,J R Stat Soc Ser B(Stat Methodol),70,1,53-71(2008)·Zbl 1400.62276号 ·文件编号:10.1111/j.1467-9868.2007.00627.x
[43] Mkhadri,A。;Ouhourane,M.,相关变量的扩展变量包含和收缩算法,《计算统计数据分析》,57,1,631-644(2013)·Zbl 1365.62282号 ·doi:10.1016/j.csda.2012.07.023
[44] Mkhadri,A。;Ouhourane,M。;Oualkacha,K.,用于计算惩罚平滑分位数回归的坐标下降算法,《统计计算》,27,4,865-883(2017)·Zbl 1384.62261号 ·doi:10.1007/s11222-016-9659-9
[45] Ogutu JO,Piepho H-P(2014)用于基因组预测的正则化组回归方法:Bridge,MCP,SCAD,group Bridge,group lasso,sparse group lassa,group MCP和group SCAD。BMC程序8(补充5):S7
[46] 哦,H-S;Lee,TC;Nychka,DW,使用任意平滑方法的快速非参数分位数回归,J Comput Gr Stat,20,2,510-526(2011)·doi:10.1198/jcgs.2010.10063
[47] 彭,B。;Wang,L.,高维非凸惩罚分位数回归的迭代坐标下降算法,J Comput Gr Stat,24,3,676-694(2015)·doi:10.1080/10618600.2014.913516
[48] 罗伯茨,S。;Nowak,G.,《稳定套索对抗交叉验证变异性》,《计算统计数据分析》,70198-211(2014)·Zbl 1471.62171号 ·doi:10.1016/j.csda.2013.09.008
[49] 西蒙,N。;弗里德曼,J。;哈斯蒂,T。;Tibshirani,R.,《稀疏群套索》,J Comput Gr Stat,22,2,231-245(2013)·doi:10.1080/10618600.2012.681250
[50] Tibshirani R(1996)通过套索回归收缩和选择。罗伊统计学会J Roy Stat Soc B 58(1):267-288·Zbl 0850.62538号
[51] Tibshirani,R。;比恩,J。;弗里德曼,J。;哈斯蒂,T。;西蒙,N。;泰勒,J。;Tibshirani,RJ,套索型问题中丢弃预测因子的强规则,J R Stat Soc Ser B(Stat Methodol),74,2,245-266(2012)·Zbl 1411.62213号 ·文件编号:10.1111/j.1467-9868.2011.01004.x
[52] Turgeon M、Oualkacha K、Ciampi A、Miftah H、Dehghan G、Zanke BW、Benedet AL、Rosa-Neto P、Greenwood CM、Labbe A;阿尔茨海默病神经成像倡议(2018)解释方差的主要成分:关联研究的有效和最佳数据降维框架。统计方法医学研究27(5):1331-1350。doi:10.1177/0962280216660128
[53] Waldmann,E。;Kneib,T。;YR Yue;朗·S。;Flexeder,C.,贝叶斯半参数加性分位数回归,统计模型,13,3,223-252(2013)·Zbl 07257456号 ·doi:10.1177/1471082X13480650
[54] Wang,L.,高维线性回归的l1惩罚LAD估计量,J Multivar Anal,120135-151(2013)·Zbl 1279.62144号 ·doi:10.1016/j.jmva.2013.04.001
[55] Wang,L。;Wu,Y。;Li,R.,用于分析超高维异质性的分位数回归,美国统计学会杂志,107,497,214-222(2012)·兹比尔1328.62468 ·doi:10.1080/01621459.2012.656014
[56] 王,H。;BJ Lengerich;Aragam,B。;Xing,EP,Precision lasso:解释高维基因组数据中的相关性和线性依赖性,生物信息学,35,7,1181-1187(2019)·doi:10.1093/bioinformatics/bty750
[57] 魏,F。;Zhu,H.,非凸惩罚回归的群坐标下降算法,计算统计数据分析,56,2,316-326(2012)·Zbl 1239.62082号 ·doi:10.1016/j.csda.2011.08.007
[58] 吴,TT;Lange,K.,套索惩罚回归的坐标下降算法,Ann Appl Stat,2,1,224-244(2008)·Zbl 1137.62045号 ·doi:10.1214/07-AOAS147
[59] Xu QF,Ding XH,Jiang CX,Yu KM,Shi L(2020)弹性网惩罚期望回归及其应用。《应用统计杂志》doi:10.1080/02664763.2020.1787355·Zbl 1521.62526号
[60] 杨,Y。;Zou,H.,计算HHSVM的有效算法及其推广,J Compute Gr Stat,22,2,396-415(2013)·doi:10.1080/101816600.2012.680324
[61] 杨,Y。;Zou,H.,解决群-随机惩罚学习问题的快速统一算法,统计计算,25,6,1129-1141(2015)·Zbl 1331.62343号 ·doi:10.1007/s11222-014-9498-5
[62] Yi,C。;Huang,J.,弹性网惩罚Huber损失回归和分位数回归的半光滑牛顿坐标下降算法,J Comput Gr Stat,26,3,547-557(2017)·doi:10.1080/10618600.2016.256816
[63] 袁,M。;Lin,Y.,分组变量回归中的模型选择和估计,J R Stat Soc Ser B(Stat Methodol),68,1,49-67(2006)·Zbl 1141.62030号 ·doi:10.1111/j.1467-9868.2005302.x
[64] Zhang,C-H,最小最大凹惩罚下的几乎无偏变量选择,Ann Stat,38,2,894-942(2010)·Zbl 1183.62120号 ·doi:10.1214/09-AOS729
[65] 赵,G。;特奥,吉隆坡;Chan,K.,通过非对称损失函数的新平滑近似估计条件分位数,统计计算,15,1,5-11(2005)·doi:10.1007/s11222-005-4785-9
[66] Zhou H,Alexander DH,Sehl ME,Sinsheimer JS,Sobel EM,Lange K(2011),序列数据全基因组关联筛选的惩罚回归。Pac-Symp Biocomput 2011:106-117。doi:10.1142/9789814335058_0012。PMID:21121038;预防性维修识别码:PMC5049883
[67] 邹,H。;Li,R.,非冲突惩罚似然模型中的一步稀疏估计,Ann Stat,36,4,1509(2008)·Zbl 1142.62027号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。