×

稀疏高维多元回归中的正则化估计,应用于DNA甲基化研究。 (英语) Zbl 1371.92014年

摘要:在本文中,我们将相关高维DNA甲基化标记物的变量选择视为多变量结果。提出了一种新的加权平方根LASSO方法来估计回归系数矩阵。该方法的一个关键特点是调谐灵敏度,通过避免惩罚参数选择的交叉验证,大大简化了计算。通过约束(ell_1)最小化方法获得的精度矩阵用于解释多变量结果之间的受试者内相关性。导出了正则化估计的Oracle不等式。我们提出的方法的性能通过广泛的仿真研究进行了说明。我们应用我们的方法在正常年龄研究(NAS)中研究吸烟与高维DNA甲基化标记物之间的关系。

MSC公司:

92B15号机组 普通生物统计学
62甲12 多元分析中的估计
62J12型 广义线性模型(逻辑模型)
62页第10页 统计学在生物学和医学中的应用;元分析
PDF格式BibTeX公司 XML格式引用
全文: 内政部 链接

参考文献:

[1] Basu,S.和G.Michailidis(2015):“稀疏高维时间序列模型中的正则化估计”,Ann.Stat.,43,1535-1567。;巴苏,S。;Michailidis,G.,稀疏高维时间序列模型中的正则化估计,Ann.Stat,43,1535-1567(2015)·Zbl 1317.62067号
[2] Belloni,A.、V.Chernozhukov和L.Wang(2011):“正方形LASSO:通过圆锥编程实现稀疏信号的关键恢复”,《生物统计学》,98,791-806。;贝洛尼,A。;切尔诺朱科夫,V。;Wang,L.,Square-root LASSO:通过圆锥编程实现稀疏信号的关键恢复,Biometrika,98,791-806(2011)·Zbl 1228.62083号
[3] Belloni,A.、V.Chernozhukov和L.Wang(2014):“通过非参数回归中的平方根LASSO进行枢轴估计”,《Ann.Stat.》,42,757-788。;贝洛尼,A。;切尔诺朱科夫,V。;Wang,L.,非参数回归中基于LASSO平方根的枢轴估计,Ann.Stat,42,757-788(2014)·Zbl 1321.62030号
[4] Bickel,P.J.,Y.Ritov和A.Tsybakov(2009):“LASSO和Dantzig选择器的同时分析”,Ann.Stat.,371705-1732。;Bickel,P.J。;Ritov,Y。;Tsybakov,A.,LASSO和Dantzig选择器的同时分析,Ann.Stat,371705-1732(2009)·Zbl 1173.62022号
[5] Bishop,C.、D.Spiegelhalter和J.Winn(2003):“VIBES:贝叶斯网络的变分推理引擎”,《神经信息处理系统进展》第15卷(S.Becker、S.Thrun和K.Obermayer编辑)。麻省理工学院出版社,马萨诸塞州剑桥,777-784。;Bishop,C。;Spiegelhalter,D。;Winn,J。;贝克尔,S。;特隆,S。;Obermayer,K.,VIBES:贝叶斯网络的变分推理引擎。,神经信息处理系统进展15,MA,777-784(2003)
[6] Bradic,J.,J.Fan和J.Jiang(2011):“具有NP维的考克斯比例风险模型的正则化”,《美国统计年鉴》,39,3092-3120。;Bradic,J。;范,J。;Jiang,J.,带NP维的Cox比例风险模型正则化,《统计年鉴》,39,3092-3120(2011)·Zbl 1246.62202号
[7] Bühlmann,P.和S.van de Geer(2011):高维数据统计:方法、理论和应用,Springer。;Bühlmann,P。;van de Geer,S.,《高维数据统计:方法》(2011)·Zbl 1273.62015年
[8] Cai,T.和M.Yuan(2012):“基于块阈值的自适应协方差矩阵估计”,Ann.Stat.,40,2014-2042。;蔡,T。;袁,M.,基于块阈值的自适应协方差矩阵估计,Ann.Stat,402014-2042(2012)·Zbl 1257.62060号
[9] Cai,T.,W.Liu和X.Luo(2011):“稀疏精度矩阵估计的约束最小化方法”,美国统计协会,106,594-607。;蔡,T。;刘伟。;Luo,X.,稀疏精度矩阵估计的约束最小化方法,美国统计协会,106,594-607(2011)·Zbl 1232.62087号
[10] Fan,J.和R.Li(2001):“通过非一致惩罚可能性及其预言属性进行变量选择”,《美国统计协会期刊》,第96期,第1348-1360页。;范,J。;Li,R.,《通过非冲突惩罚似然进行变量选择及其预言属性》,美国统计协会,96,1348-1360(2001)·Zbl 1073.62547号
[11] Fan,J.和R.Li(2002):“考克斯比例风险模型和脆弱性模型的变量选择”,《美国统计年鉴》,30,74-99。;范,J。;Li,R.,考克斯比例风险模型和脆弱性模型的变量选择,《统计年鉴》,30,74-99(2002)·Zbl 1012.62106号
[12] Fan,Y.和J.Lv(2014):“组合(L_1)和凹正则化的渐近性质”,生物统计学,101,57-70。;范,Y。;Lv,J.,组合(L_1)和凹正则化的渐近性质,生物统计学,101,57-70(2014)·Zbl 1285.62074号
[13] Fan,J.,Y.Liao和M.Mincheva(2013):“通过阈值化主正交补码进行大协方差估计(讨论)”,J.R.Stat.Soci。序列号。B、 75603-680。;范,J。;Liao,Y。;Mincheva,M.,通过阈值化主正交补码进行大协方差估计(讨论),J.R.Stat.Soci。序列号。B、 75603-680(2013)·Zbl 1411.62138号
[14] Friedman,J.、T.Hastie和R.Tibshirani(2010):“通过坐标下降法实现广义线性模型的正则化路径”,J.Stat.Software,33,1-22。;弗里德曼,J。;哈斯蒂,T。;Tibshirani,R.,通过坐标下降的广义线性模型的正则化路径,J.Stat.软件,33,1-22(2010)·Zbl 1109.62302号
[15] Gao,X.,M.Jia,Y.Zhang,L.Breitling和H.Brenner(2015):“成人主动吸烟暴露后全血细胞的DNA甲基化变化:DNA甲基化研究的系统综述”,《临床表观遗传学》,7113。;高,X。;贾,M。;Zhang,Y。;百年灵,L。;Brenner,H.,《成年人主动吸烟暴露后全血细胞的DNA甲基化变化:DNA甲基化研究的系统综述》,《临床表观遗传学》,7113(2015)
[16] Huang,J.,S.Ma,H.Li和C.-H.Zhang(2011):“高维回归的稀疏拉普拉斯收缩估计量”,《Ann.Stat.》,第39期,2021-2046页。;黄,J。;马,S。;李,H。;Zhang,C.-H.,《高维回归的稀疏拉普拉斯收缩估计量》,《Ann.Stat》,第39期,2021-2046页(2011年)·Zbl 1227.62049号
[17] Huang,J.,T.Sun,Z.Ying,Yu和C.-H.Zhang(2013):“考克斯模型中LASSO的Oracle不等式”,《Ann.Stat.》,41,1142-1165。;黄,J。;Sun,T。;Ying,Z。;Yu,Y。;Zhang,C.-H.,《考克斯模型中LASSO的Oracle不等式》,Ann.Stat,41,1142-1165(2013)·Zbl 1292.62135号
[18] 姜瑜、何瑜和张浩(2016):“基于先验套索方法的广义线性模型的先验信息变量选择”,美国统计协会,111,355-376。;姜瑜。;他,Y。;Zhang,H.,通过先验套索方法对广义线性模型进行先验信息变量选择,美国统计协会,111,355-376(2016)
[19] Laurent,B.和P.Massart(2000):“通过模型选择对二次函数的自适应估计”,《Ann.Stat.》,第28期,第1302-1338页。;Laurent,B。;Massart,P.,《通过模型选择对二次函数的自适应估计》,《Ann.Stat》,第28期,第1302-1338页(2000年)·Zbl 1105.62328号
[20] Li,X.,T.Zhao,X.Yuan和H.Liu(2015a):“R中高维线性回归和精确矩阵估计的flare包”,J.Mach。学习。决议,第16553-557号。;李,X。;Zhao,T。;袁,X。;Liu,H.,R,J.Mach中高维线性回归和精确矩阵估计的flare包。学习。研究,16553-557(2015)·Zbl 1337.62007号
[21] Li,Y.,B.Nan和J.Zhu(2015b):“具有任意群结构的多元多元线性回归的多元稀疏群套索”,《生物计量学》,71,354-363。;李毅。;Nan,B。;Zhu,J.,具有任意群结构的多元多元线性回归的多元稀疏群套索,生物统计学,71,354-363(2015)·Zbl 1390.62285号
[22] Lin,W.和J.Lv(2013):“高维稀疏加性风险回归”,美国统计协会,108,247-264。;Lin,W。;Lv,J.,高维稀疏加性风险回归,美国统计协会,108,247-264(2013)·兹伯利06158340
[23] Lin,W.,R.Feng和H.Li(2015):“高维工具变量回归的正则化方法及其在遗传基因组学中的应用”,美国统计协会,110,270-288。;林,W。;冯·R。;Li,H.,高维工具变量回归的正则化方法及其在遗传基因组学中的应用,美国统计协会,110,270-288(2015)·兹比尔1373.62371
[24] Liu,H.和L.Wang(2017):“TIGER:优化估计高斯图形模型的调谐敏感方法”,电子。《美国联邦法律大全》第11卷第241-294页。;刘,H。;Wang,L.,TIGER:最佳估计高斯图形模型的调谐敏感方法,电子。J.Stat,11,241-294(2017)·Zbl 1395.62007号
[25] Liu,H.,L.Wang和T.Zhao(2015):“应用于神经语义基础发现的校准多元回归”,J.Mach。学习。第16号决议,1579-1606。;刘,H。;Wang,L。;Zhao,T.,校准多元回归及其在神经语义基础发现中的应用,J.Mach。学习。Res,16,1579-1606(2015)·Zbl 1351.62135号
[26] Moen,E.,X.Zhang,W.Mu,S.Delaney,C.Wing,J.McQuade,J.Myers,L.Godley,M.Dolan和W.Zhangs(2013):“欧洲和非洲人群之间胞嘧啶修饰的基因组变异及其对复杂性状的影响”,《遗传学》,194987-996。;Moen,E。;张,X。;穆伟(Mu,W.)。;德莱尼,S。;翼,C。;McQuade,J。;迈尔斯,J。;Godley,L。;多兰,M。;Zhang,W.,欧洲和非洲人群之间胞嘧啶修饰的全基因组变异及其对复杂性状的影响,遗传学,194987-996(2013)
[27] Mukherjee,R.、N.Pillai和X.Lin(2015):“高维稀疏二元回归的假设检验”,《Ann.Stat.》,43,352-381。;穆克吉,R。;北卡罗来纳州皮莱。;Lin,X.,高维稀疏二元回归的假设检验,Ann.Stat,43,352-381(2015)·Zbl 1308.62094号
[28] Rothman,A.、E.Levina和J.Zhu(2010):“具有协方差估计的稀疏多元回归”,J.Compute。图表。《统计》,第19卷,947-962页。;Rothman,A。;莱维纳,E。;朱,J.,具有协方差估计的稀疏多元回归,J.Compute。图表。统计,1947-962(2010)·Zbl 1195.62089号
[29] Sofer,T.,L.Dicker和X.Lin(2014):“高维多变量结果的变量选择”,《中国科学院学报》,241633-1654。;索弗,T。;Dicker,L.公司。;Lin,X.,高维多元结果的变量选择,《统计》,中国,241633-1654(2014)·Zbl 1480.62048号
[30] Tibshirani,R.(1996):“通过LASSO进行回归收缩和选择”,J.Royal Stat.Soci。序列号。B、 58、267-288。;Tibshirani,R.,《通过LASSO回归收缩和选择》,J.Royal Stat.Soci。序列号。B、 58、267-288(1996)·Zbl 0850.62538号
[31] van de Geer,S.(2008):“高维广义线性模型和套索”,《Ann.Stat.》,36614-645。;van de Geer,S.,《高维广义线性模型和套索》,《Ann.Stat》,36614-645(2008)·Zbl 1138.62323号
[32] Wang,H.和C.Leng(2007):“通过最小二乘近似法进行统一LASSO估计”,《美国统计协会期刊》,第102期,第1039-1048页。;Wang,H。;Leng,C.,《通过最小二乘近似法进行统一LASSO估计》,美国统计协会,1021039-1048(2007)·Zbl 1306.62167号
[33] Wilms,I.和C.Croux(2017):“具有协方差估计的多元群套索算法”,J.Appl。状态,已接受。;威尔姆斯,I。;Croux,C.,具有协方差估计的多元群套索算法,J.Appl。统计(2017)·Zbl 1516.62663号
[34] Yuan,M.和Y.Lin(2007):“高斯图形模型中的模型选择和估计”,《生物统计学》,95,19-35。;袁,M。;Lin,Y.,高斯图形模型中的模型选择和估计,生物统计学,95,19-35(2007)·Zbl 1142.62408号
[35] Zhang,C.-H.(2010):“最小最大凹惩罚下的几乎无偏变量选择”,《Ann.Stat.》,38,894-942。;Zhang,C.-H.,最小最大凹惩罚下的几乎无偏变量选择,《统计年鉴》,38,894-942(2010)·Zbl 1183.62120号
[36] Zhang,H.、Y.Zheng、Z.Zhang、T.Gao、B.Joyce、G.Yoon、W.Zhangs、J.Schwartz、A.Just、E.Colicino、P.Vokonas、L.Zhao、J.Lv、A.Baccarelli、L.Hou和L.Liu(2016):“表观遗传学研究中高维中介效应的评估和测试”,生物信息学,32,3150-3154。;张,H。;郑毅。;张,Z。;高,T。;乔伊斯,B。;Yoon,G。;张伟。;施瓦茨,J。;只是,A。;大肠杆菌。;沃科纳斯,P。;赵,L。;吕杰。;Baccarelli,A。;Hou,L。;Liu,L.,表观遗传学研究中的高维中介效应的估计和测试,生物信息学,32,3150-3154(2016)·Zbl 1371.92014年
[37] Zou,H.(2006):“自适应LASSO及其预言属性”,《美国法律总汇汇编》,1011418-1429。;Zou,H.,自适应LASSO及其oracle属性,美国统计协会,101,1418-1429(2006)·Zbl 1171.62326号
[38] Zou,H.和T.Hastie(2005):“通过弹性网进行规则化和可变选择”,《皇家统计学会期刊》。序列号。B、 67301-320。;邹,H。;Hastie,T.,《通过弹性网进行规则化和可变选择》,J.Royal Stat.Soci。序列号。B、 67301-320(2005)·Zbl 1069.62054号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。