×

具有发散协变量数的多元失效时间模型的自适应双层变量选择。 (英文) Zbl 1502.62042号

总结:在本研究中,我们提出了一种自适应双层变量选择方法来分析多变量失效时间数据。在回归设置中,我们将同一预测变量对应的系数视为一个自然组,然后同时考虑组水平和个人水平的变量选择。通过模拟具有自适应双层惩罚的组变量选择过程,所提出的变量选择方法可以在两个不同的水平上选择一个预测变量,从而对不同的事件类型产生不同的协变量影响:预测对所有故障类型都很重要的组水平,以及预测器仅对某些故障类型重要的单个级别。开发了一种基于循环坐标下降的算法来实现所提出的方法。基于仿真结果,我们的方法优于经典的惩罚方法,特别是在去除不同故障类型的不重要变量方面。在协变量数目发散的情况下,我们得到了所提出的变量选择方法的渐近预言性质。我们构造了一种用于调谐参数选择的广义交叉验证方法,并使用模型误差评估模型性能。我们还使用实际数据集说明了所提出的方法。

MSC公司:

62G08号 非参数回归和分位数回归
62J07型 岭回归;收缩估计器(拉索)
62号02 生存分析和删失数据中的估计
6220国集团 非参数推理的渐近性质
62页第10页 统计学在生物学和医学中的应用;元分析
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] AM Bouvier;Launoy,G。;鲍维尔,V。;罗洛特,F。;曼弗雷迪,S。;Faivre,J。;科特特,V。;Jooste,V.,结肠癌患者晚期复发的发生率和模式,《国际癌症杂志》,137,9,2133-2138(2015)·文件编号:10.1002/ijc.29578
[2] Breheny,P。;Huang,J.,二级变量选择的惩罚方法,Stat Interface,2,3,369-380(2009)·Zbl 1245.62034号 ·doi:10.4310/SII.2009.v2.n3.a10
[3] 蔡,J。;范,J。;李,R。;Zhou,H.,多元失效时间数据的变量选择,Biometrika,92,2,303-316(2005)·Zbl 1094.62123号 ·doi:10.1093/biomet/92.2.303
[4] 蔡,K。;沈,H。;Lu,X.,Andersen-Gill模型中重复事件数据的组变量选择,J Stat Plan Inference,20799-112(2020)·Zbl 1437.62166号 ·doi:10.1016/j.jspi.2019.11.005
[5] 克莱顿,D。;Cuzick,J.,比例风险模型的多元推广,J R Stat Soc Ser A(Gen),148,2,82-108(1985)·Zbl 0581.62086号 ·doi:10.2307/2981943
[6] 克莱格,LX;蔡,J。;Sen,PK,多变量失效时间数据的边际混合基线风险模型,生物计量学,55,3805-812(1999)·Zbl 1059.62632号 ·doi:10.1111/j.0006-341X.1999.0805.x
[7] 克雷文,P。;Wahba,G.,用样条函数平滑噪声数据,数值数学,31,4,377-403(1978)·Zbl 0377.65007号 ·doi:10.1007/BF01404567
[8] Dawber,TR,《Framingham研究:动脉粥样硬化疾病的流行病学》(1980年),剑桥:哈佛大学出版社,剑桥·doi:10.4159/harvard.9780674492097
[9] 范,J。;Li,R.,《基于非一致惩罚似然的变量选择及其预言属性》,美国统计协会,96,456,1348-1360(2001)·Zbl 1073.62547号 ·doi:10.1198/016214501753382273
[10] 范,J。;Li,R.,Cox比例风险模型和脆弱性模型的变量选择,Ann Stat,30,1,74-99(2002)·Zbl 1012.62106号 ·doi:10.1214/aos/1015362185
[11] 风扇,Z。;Wang,XF,具有辅助协变量的多变量故障时间数据的边际风险模型,非参数统计杂志,21,771-786(2009)·Zbl 1172.62033号 ·doi:10.1080/10485250902915903
[12] 黄,J。;马,S。;谢浩。;Zhang,CH,A group bridge approach for variable selection,生物统计学,96,2,339-355(2009)·Zbl 1163.62050 ·doi:10.1093/biomet/asp020
[13] Kim,S。;Woo Ahn,K.,《使用群体变量进行病例组研究的双水平变量选择》,《统计方法医学研究》,28,10-11,3404-3414(2019)·doi:10.1177/0962280218803654
[14] Lawless,JF,泊松过程数据的回归方法,美国统计协会杂志,82,399,808-815(1987)·Zbl 0657.62103号 ·doi:10.1080/0162145.1987.10478502
[15] Lin,DY,多元失效时间数据的Cox回归分析:边际方法,Stat Med,13,21,2233-2247(1994)·doi:10.1002/sim.4780132105
[16] 刘杰。;张,R。;赵伟。;Lv,Y.,多变量生存数据半参数风险回归中的变量选择,《多变量分析杂志》,142,26-40(2015)·Zbl 1325.62091号 ·doi:10.1016/j.jmva.2015.07.015
[17] 刘杰。;张,R。;赵伟。;Lv,Y.,多元失效时间数据部分线性风险回归中的变量选择,《非参数统计杂志》,28,2,375-394(2016)·Zbl 1338.62114号 ·doi:10.1080/10485252.2016.1163355
[18] 刘,X。;宋,X。;谢S。;周瑜,脆弱性转换模型的变量选择及其在糖尿病并发症中的应用,Can J Stat,44,3,375-394(2016)·Zbl 1357.62177号 ·doi:10.1002/cjs.11291
[19] Lounici,K。;庞蒂尔,M。;Van De Geer,S。;Tsybakov,AB,Oracle不等式与群稀疏下的最优推理,Ann Stat,39,4,2164-2204(2011)·Zbl 1306.62156号 ·doi:10.1214/11-AOS896
[20] Meier,L。;Van De Geer,S。;Bühlmann,P.,逻辑回归的群体套索,J R Stat Soc Ser B(Stat Methodol),70,1,53-71(2008)·Zbl 1400.62276号 ·文件编号:10.1111/j.1467-9868.2007.00627.x
[21] 莫特尔,CG;弗莱明,TR;麦克唐纳,JS;Haller,DG;JA劳里;切线,CM;昂格莱德,JS;华盛顿州艾默生;Tormey,DC;Glick,JH,氟尿嘧啶加左旋咪唑作为III期结肠癌切除术后的有效辅助治疗:最终报告,Ann Intern Med,122,50321-326(1995)·doi:10.7326/0003-4819-122-5-199503010-00001
[22] 牛,Y。;Peng,Y.,用治愈分数对集群失效时间数据进行边际回归分析,J Multivar Ana,123,129-142(2014)·Zbl 1278.62097号 ·doi:10.1016/j.jmva.2013.09.003
[23] Oakes,D.,脆弱性诱发的双变量生存模型,美国统计学会杂志,84,406,487-493(1989)·Zbl 0677.62094号 ·doi:10.1080/01621459.1989.10478795
[24] Poignard,B.,自适应稀疏群套索的渐近理论,Ann Inst Stat Math,72,1,297-328(2020)·Zbl 1436.62342号 ·doi:10.1007/s10463-018-0692-7
[25] Ruszczynski,A.,非线性优化(2006),普林斯顿:普林斯顿大学出版社,普林斯顿·Zbl 1108.90001号 ·doi:10.1515/9781400841059
[26] 西蒙,N。;弗里德曼,J。;哈斯蒂,T。;Tibshirani,R.,《稀疏群套索》,《计算机图形统计杂志》,22,2,231-245(2013)·doi:10.1080/10618600.2012.681250
[27] 斯皮克曼,CF;Lin,DY,多元失效时间数据的边际回归模型,美国统计协会杂志,93,443,1164-1175(1998)·Zbl 1064.62572号 ·数字标识代码:10.1080/01621459.1998.10473777
[28] Tibshirani,R.,通过套索进行回归收缩和选择,J R Stat Soc Ser B(Methodol),58,1,267-288(1996)·Zbl 0850.62538号
[29] Tseng,P.,不可微极小化的块坐标下降法的收敛性,最优化理论应用杂志,109,3475-494(2001)·Zbl 1006.65062号 ·doi:10.1023/A:1017501703105
[30] Wang,H。;Leng,C.,关于自适应组套索的注释,计算统计数据分析,52,12,5277-5286(2008)·Zbl 1452.62524号 ·doi:10.1016/j.csda.2008.05.006
[31] 王,S。;楠,B。;朱,N。;Zhu,J.,带分组变量的分层惩罚Cox回归,Biometrika,96,2,307-322(2009)·Zbl 1163.62089号 ·doi:10.1093/biomet/asp016
[32] 魏,LJ;Lin,DY;Weissfeld,L.,通过建模边际分布对多元不完全失效时间数据进行回归分析,美国统计协会杂志,84,408,1065-1073(1989)·doi:10.1080/01621459.1989.10478873
[33] Wu,TT,Lasso通过坐标下降对高维复发事件数据的半参数回归进行惩罚,J Stat Comput Simul,83,6,1145-1155(2013)·Zbl 1431.62302号 ·doi:10.1080/00949655.2011.652114
[34] 吴,TT;Lange,K.,套索惩罚回归的坐标下降算法,Ann Appl Stat,2,1,224-244(2008)·Zbl 1137.62045号 ·doi:10.1214/07-AOAS147
[35] 袁,M。;Lin,Y.,分组变量回归中的模型选择和估计,J R Stat Soc Ser B(Stat Methodol),68,1,49-67(2006)·兹比尔1141.62030 ·doi:10.1111/j.1467-9868.2005302.x
[36] Zhang,CH,最小最大凹惩罚下的几乎无偏变量选择,Ann Stat,38,2,894-942(2010)·Zbl 1183.62120号 ·doi:10.1214/09-AOS729
[37] Zhao P,Rocha G,Yu B(2006)通过组合绝对惩罚进行分组和分层模型选择。加州大学伯克利分校统计系,《技术报告》,第703页
[38] 周,N。;Zhu,J.,通过分层套索及其oracle属性选择组变量,Stat Interface,3557-574(2010)·Zbl 1245.62183号 ·doi:10.4310/SII.2010.v3.n4.a13
[39] Zou,H.,《自适应套索及其预言属性》,美国统计学会期刊,101,476,1418-1429(2006)·Zbl 1171.62326号 ·doi:10.19198/016214506000000735
[40] 邹,H。;Hastie,T.,《通过弹性网进行正则化和变量选择》,J R Stat Soc Ser B(Stat Methodol),67,2,301-320(2005)·兹比尔1069.62054 ·数字对象标识代码:10.1111/j.1467-9868.2005.0050.x
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。