×

具有收缩的最佳子集选择:具有分组效应的稀疏加性风险回归。 (英语) Zbl 07792819号

摘要:稀疏建模在现代统计回归中发挥着普遍的作用。特别是,由于涉及生存数据的微阵列研究的普及,高维生存分析引起了很多关注。在这篇文章中,我们关注的是一个预测因子强相关的场景,也称为分组效应,这在分析高维微阵列数据时非常理想。为了在这种情况下同时进行变量选择和估计,我们在可加风险模型框架下基于多项式算法提出了(l_2)正则化最佳子集估计。此外,我们还建立了该估计量在估计损失下的综合统计性质,包括oracle不等式。通过仿真研究证明了该方法的有效性,并以实际数据为例进行了说明。

MSC公司:

62至XX 统计
62号02 生存分析和删失数据中的估计
62J07型 岭回归;收缩估计器(拉索)

软件:

L0学习
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Tibshirani,R.,通过Lasso回归收缩和选择,J R Stat Soc Ser B Stat Methodol,58,1,267-288(1996)·Zbl 0850.62538号 ·doi:10.1111/j.2517-6161.1996.tb02080.x
[2] 范,J。;Li,R.,通过非一致惩罚似然进行变量选择及其预言性质,J Amer Stat Assoc,96,456,1348-1360(2001)·Zbl 1073.62547号 ·doi:10.1198/016214501753382273
[3] 邹,H。;Hastie,T.,通过弹性网的正则化和变量选择,J R Stat Soc Ser B Stat Methodol,67,5768-768(2005)·文件编号:10.1111/j.1467-9868.200527.x
[4] 坎迪斯,E。;Tao,T.,The Dantzig selector:当p远大于n时的统计估计,Ann Stat,35,62333-2351(2007)·Zbl 1139.62019号 ·doi:10.1214/00905360000001523
[5] 吕杰。;Fan,Y.,使用正则化最小二乘法进行模型选择和稀疏恢复的统一方法,Ann Stat,37,6,3498-3528(2009)·Zbl 1369.62156号 ·doi:10.1214/09-AOS683
[6] Zhang,C.,最小最大凹惩罚下的几乎无偏变量选择,Ann Stat,38,2,894-942(2010)·Zbl 1183.62120号 ·doi:10.1214/09-AOS729
[7] 贝洛尼,A。;切尔诺朱科夫,V。;Wang,L.,Square-root Lasso:通过圆锥编程实现稀疏信号的关键恢复,Biometrika,98,4,791-806(2011)·Zbl 1228.62083号 ·doi:10.1093/biomet/asr043
[8] Sun,T。;Zhang,C.,标度稀疏线性回归,Biometrika,99,4,879-898(2012)·Zbl 1452.62515号 ·doi:10.1093/biomet/ass043
[9] 郑,Z。;范,Y。;Lv,J.,高维阈值回归和收缩效应,J R Stat Soc Ser B Stat Methodol,76,3,627-649(2014)·Zbl 1411.62049号 ·doi:10.1111/rssb.12037
[10] Bertsimas博士。;金·A。;Mazumder,R.,《通过现代优化透镜选择最佳子集》,Ann Stat,44,2813-852(2016)·Zbl 1335.62115号 ·doi:10.1214/15-AOS1388
[11] 黄,J。;焦,Y。;Liu,Y.,《(####)惩罚回归的建设性方法》,J Mach Learn Res,19,10,1-37(2018)·Zbl 1444.62091号
[12] 朱,J。;温,C。;Zhu,J.,最佳子集选择问题的多项式算法,美国国家科学院院刊,117,52,33117-33123(2020)·Zbl 1485.68322号 ·doi:10.1073/pnas.2014241117
[13] Cox,D.,回归模型和生命表,J R Stat Soc Ser B Stat Methodol,34,2,187-220(1972)·Zbl 0243.62041号 ·doi:10.1111/j.2517-6161.1972.tb00899.x
[14] 范,J。;吕杰。;Qi,L.,《经济学中的稀疏高维模型》,《经济评论年鉴》,3,1,291-317(2011)·doi:10.1146/economics.2011.3.第1期
[15] Tibshirani,R.,《考克斯模型中变量选择的LASSO方法》,《统计医学》,16,4,385-395(1997)·doi:10.1002/(ISSN)1097-0258
[16] 范,J。;Li,R.,考克斯比例风险模型和虚弱模型的变量选择,Ann Stat,30,174-99(2002)·doi:10.1214/aos/1015362185
[17] 布雷迪克,J。;范,J。;Jiang,J.,带NP维的cox比例风险模型正则化,Ann Stat,39,6,3092-3120(2011)·Zbl 1246.62202号 ·doi:10.1214/11-AOS911
[18] 黄,J。;Sun,T。;Ying,Z.,《考克斯模型中拉索的Oracle不等式》,《Ann Stat》,41,3,1142-1165(2013)·Zbl 1292.62135号 ·doi:10.1214/13-AOS1098
[19] 罗,S。;徐,J。;Chen,Z.,高维特征空间cox模型中的扩展贝叶斯信息准则,Ann Inst Stat Math,67,2,287-311(2015)·Zbl 1341.62093号 ·doi:10.1007/s10463-014-0448-y
[20] Lin,D。;Ying,Z.,加性风险模型的半参数分析,Biometrika,81,1,61-71(1994)·Zbl 0796.62099号 ·doi:10.1093/biomet/81.1.61
[21] 马,S。;黄,J.,微阵列数据的加性风险生存模型,生物信息学,8,192,1-10(2007)·doi:10.1186/1471-2105-8-192
[22] 冷,C。;Ma,S.,通过Lasso在加性风险模型中的路径一致性模型选择,Stat Med,26,20,3753-3770(2007)·doi:10.1002/(ISSN)1097-0258
[23] Martinussen,T。;Scheike,T.,半参数加性风险模型的协变量选择,Scand J Stat,36,4,602-619(2009)·Zbl 1224.62104号 ·doi:10.1111/sjos.2009.36第4期
[24] Lin,W。;Lv,J.,高维稀疏加性风险回归,美国统计协会,108,501,247-264(2013)·Zbl 06158340号 ·doi:10.1080/01621459.2012.746068
[25] 张,H。;Sun,L。;Zhou,Y.,高维加性风险模型中加权Lasso的Oracle不等式和选择一致性,Stat Sinica,27,4,1903-1920(2017)·Zbl 1392.62221号 ·doi:10.5705/ss.202015.0075
[26] 范,Y。;Lv,J.,组合正则化和凹正则化的渐近性质,生物统计学,101,1,57-70(2014)·Zbl 1285.62074号 ·doi:10.1093/biomet/ast047
[27] Hazimeh,H,Mazumder,R,Radchenko,P.离散优化分组变量选择:计算和统计视角。Ann Stat.2022年版+;即将推出·兹比尔07684003
[28] 哈齐梅,H。;Mazumder,R.,《快速最佳子集选择:坐标下降和局部组合优化算法》,Oper Res,68,5,1517-1537(2020)·兹比尔1457.90153 ·doi:10.1287/opre.2019.1919
[29] Mazumder,R。;拉德琴科,P。;Dedieu,A.,《带收缩的子集选择:低信噪比时的稀疏线性建模》,Oper Res,71,1,129-147(2023)·Zbl 07809599号 ·doi:10.1287/opre.2022.2276
[30] 刘,L。;苏·W。;Zhao,X.,Bi-高维加性风险回归模型中的选择,Electron J Stat,15,1,748-772(2021)·Zbl 1512.62088号 ·doi:10.1214/21-EJS1799
[31] 郑,Z。;张,J。;Li,Y.,\(####)-高维加性风险回归的正则化学习,INFORMS J Compute,34,5,2762-2775(2022)·Zbl 07625902号 ·doi:10.1287/ijoc.2022.1208
[32] 罗森瓦尔德,A。;赖特,G。;Wiestner,A.,《增殖基因表达特征是预测套细胞淋巴瘤生存率的致癌事件的定量积分》,《癌症细胞》,3,2,185-197(2003)·doi:10.1016/S1535-6108(03)00028-X
[33] 黄,J。;Ma,S.,通过桥接法在加速失效时间模型中选择变量,寿命数据分析,16,2,176-195(2010)·Zbl 1322.62189号 ·doi:10.1007/s10985-009-9144-2
[34] FE哈雷尔;加州,RM;Pryor,DB,《评估医学检验的结果》,美国医学协会杂志,247,18,2543-2546(1982)·doi:10.1001/jama.1982.03320430047030
[35] Uno,H。;蔡,T。;Pencina,MJ,《关于使用经审查的生存数据评估风险预测程序总体充分性的c-统计》,《统计医学》,30,10,1105-1117(2011)·doi:10.1002/sim.4154
[36] 霍恩,R。;Johnson,C.,矩阵分析(1985),纽约:剑桥大学出版社,纽约·Zbl 0576.15001号
[37] 黄,J。;PJ Breheny;Lee,S.,《变量选择的记忆法》,中国统计局,26,903-923(2016)·Zbl 1356.62091号 ·doi:10.5705/ss.202014.0011
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。