×

\(\ell0\)-正则化高维加速失效时间模型。 (英语) Zbl 07512626号

摘要:我们为具有高维协变量的稀疏加速失效时间(AFT)模型中的(ell_0)惩罚估计开发了一种构造性方法。该方法基于Stute的加权最小二乘准则并结合(ell_0)惩罚。该方法是一种计算算法,基于从原始和对偶信息导出的活动集,并根据Karush-Kuhn-Tucker(KKT)条件进行寻根,迭代生成一系列解。我们将该方法称为AFT-SDAR(用于支持检测和根查找)。我们的理论结果的一个重要方面是,我们直接关注基于AFT-SDAR算法生成的解序列。我们证明,只要协变矩阵满足一个温和的正则性条件,即使在高维线性回归的情况下,模型辨识也是必要的和充分的,那么解序列的估计误差将以指数形式以高概率衰减到最优误差界。还提出了AFT-SDAR的自适应版本,即AFT-ASDAR,它以数据驱动的方式确定估计系数的支持大小。仿真研究表明,该方法在精度和速度方面优于套索和MCP。通过对实际数据集的分析,说明了该方法的应用。

MSC公司:

62至XX 统计学
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Breheny,P。;Huang,J.,非凸惩罚回归的坐标下降算法,及其在生物特征选择中的应用,Ann.Appl。《法律总汇》,5,1232(2011)·Zbl 1220.62095号
[2] 巴克利,J。;James,I.,《截尾数据线性回归》,《生物统计学》,第66、3、429-436页(1979年)·Zbl 0425.62051号
[3] 蔡,T。;Huang,J。;Tian,L.,加速失效时间模型的正则化估计,生物统计学,65,2,394-404(2009)·Zbl 1274.62736号
[4] Cox,D.R.,回归模型和生命表,J.R.Stat.Soc.,Ser。B、 统计方法。,34, 2, 187-202 (1972) ·Zbl 0243.62041号
[5] 范,J。;Li,R.,《通过非一致惩罚似然进行变量选择及其预言属性》,美国统计协会,96,456,1348-1360(2001)·Zbl 1073.62547号
[6] 范,J。;Lv,J.,超高维特征空间的确定独立筛选,J.R.Stat.Soc.,Ser。B、 统计方法。,70, 5, 849-911 (2008) ·Zbl 1411.62187号
[7] 洪,D。;张,F.,质谱成像处理的加权弹性网模型,数学。模型。自然现象。,5, 3, 115-133 (2010) ·Zbl 1187.92040号
[8] 胡,J。;Chai,H.,具有高维协变量的加速失效时间模型中的调整正则化估计,J.Multivar。分析。,122, 96-114 (2013) ·Zbl 1349.62481号
[9] Huang,J。;Ma,S.,通过桥接法在加速失效时间模型中选择变量,寿命数据分析。,16, 2, 176-195 (2010) ·Zbl 1322.62189号
[10] Huang,J。;马,S。;Xie,H.,高维协变量加速失效时间模型中的正则化估计,生物统计学,62,3,813-820(2006)·Zbl 1111.62090号
[11] Huang,J。;焦,Y。;刘,Y。;Lu,X.,《(\ell_0)惩罚回归的建设性方法》,J.Mach。学习。Res.,19,1403-439(2018年)·Zbl 1444.62091号
[12] Johnson,B.A.,《截尾数据半参数线性回归中的变量选择》,J.R.Stat.Soc.,Ser。B、 统计方法。,70, 2, 351-370 (2008) ·兹比尔1148.62052
[13] 约翰逊,B.A。;Lin,D。;Zeng,D.,半参数回归模型中的惩罚估计函数和变量选择,美国统计协会,103,482,672-680(2008)·Zbl 1471.62330号
[14] Kalbfleisch,J.D。;Prentice,R.L.,《失效时间数据的统计分析》,第360卷(2011年),John Wiley&Sons
[15] Khan,M.H.R.先生。;Shaw,J.E.H.,用一类自适应弹性网技术选择生存数据的变量,统计计算。,26, 3, 725-741 (2016) ·Zbl 1505.62220号
[16] 科尔,H。;苏萨拉,V.V。;Van Ryzin,J.,《随机右偏数据的回归分析》,《Ann.Stat.》,第9、6、1276-1288页(1981年)·Zbl 0477.62046号
[17] Stute,W.,存在协变量时随机审查下的分布收敛,Scand。J.Stat.,461-471(1996)·Zbl 0903.62045号
[18] 斯图特,W。;Wang,J.-L.,《随机审查下的强势法律》,《美国统计年鉴》,第21、3、1591-1607页(1993年)·Zbl 0785.60020号
[19] 斯图特,W。;Wang,J.-L.,《随机审查下的强势法律》,《美国统计年鉴》,第21、3、1591-1607页(1993年)·Zbl 0785.60020号
[20] Tibshirani,R.,《通过套索进行回归收缩和选择》,J.R.Stat.Soc.,Ser。B、 统计方法。,58, 1, 267-288 (1996) ·Zbl 0850.62538号
[21] Van De Vijver,M.J。;何,Y.D。;范特维尔,L.J。;戴,H。;哈特,A.A。;Voskuil,D.W。;施赖伯,G.J。;彼得斯,J.L。;罗伯茨,C。;Marton,M.J.,基因表达特征作为乳腺癌生存率的预测因素,新英格兰。《医学杂志》,347,251999-2009(2002)
[22] 范德法特,A.W。;Wellner,J.A.,《弱收敛与经验过程:统计学应用》,斯普林格统计学系列(1996),斯普林格出版社:斯普林格出版社,纽约·Zbl 0862.60002号
[23] Wainwright,M.J.,《高维统计:非症状观点》,第48卷(2019年),剑桥大学出版社·Zbl 1457.62011年
[24] Wang,L。;Kim,Y。;Li,R.,《校准超高维非凸惩罚回归》,《Ann.Stat.》,41,5,2505(2013)·兹比尔1281.62106
[25] Wei,L.-J.,《加速失效时间模型:生存分析中Cox回归模型的有用替代品》,《统计医学》,11,14-151871-1879(1992)
[26] Ying,Z.,删失回归数据秩估计的大样本研究,《统计年鉴》,76-99(1993)·Zbl 0773.62048号
[27] 张,C.-H。;黄,J.,高维线性回归中套索选择的稀疏性和偏差,《统计年鉴》,36,4,1567-1594(2008)·Zbl 1142.62044号
[28] 张,C.-H。;张涛,高维稀疏估计问题凹正则化的一般理论,统计科学。,27, 4, 576-593 (2012) ·兹比尔1331.62353
[29] Zhang,C.-H.,最小最大凹惩罚下的几乎无偏变量选择,《美国统计年鉴》,38,2,894-942(2010)·Zbl 1183.62120号
[30] Zhou,M.,删失线性模型中的M估计,Biometrika,79,4,837-841(1992)·Zbl 0764.62056号
[31] Zou,H.,《自适应套索及其预言属性》,美国统计协会,101,476,1418-1429(2006)·Zbl 1171.62326号
[32] 邹,H。;Zhang,H.H.,关于参数发散的自适应弹性网,《统计年鉴》,37,4,1733(2009)·Zbl 1168.62064号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。