×

具有高维协变量的Cox模型的正向回归。 (英语) Zbl 1422.62302号

摘要:前向回归是一种经典的变量筛选方法,在协变量数量相对较少的情况下被广泛用于建模。然而,由于计算繁琐和未知的理论性质,前向回归很少用于高维设置。最近的一些工作表明,前向回归与基于扩展贝叶斯信息准则(EBIC)的停止规则相结合,可以在高维线性回归设置中一致地识别所有相关预测因子。然而,结果基于线性模型的残差平方和,尚不清楚正向回归是否可以应用于更一般的回归设置,例如Cox比例风险模型。我们介绍了Cox模型的前向变量选择过程。它根据部分似然的增量顺序选择重要变量,并具有EBIC停止规则。据我们所知,这是首次研究高维生存环境中基于部分似然的正向回归,并建立选择一致性结果。我们表明,如果真实模型的维数是有限的,则前向回归可以在有限步数内发现所有相关预测因子,并且它们的进入顺序由部分似然增量的大小决定。由于部分似然不是基于密度的常规似然,我们发展了一些关于部分似然的新理论结果,并使用这些结果来确定所需的可靠筛选特性。通过对波士顿肺癌生存队列研究子集的广泛模拟和分析,检验了所提方法的实用性,该研究是一项基于医院的研究,旨在确定与肺癌患者生存相关的生物标记物。

MSC公司:

62N01号 截尾数据模型
62页第10页 统计学在生物学和医学科学中的应用;元分析
62-07 数据分析(统计)(MSC2010)
PDF格式BibTeX公司 XML格式引用
全文: 内政部 链接

参考文献:

[1] 贝洛尼,A。;Chernozhukov,V.,高维稀疏模型中的惩罚分位数回归,Ann.Statist。,39, 82-130 (2011) ·Zbl 1209.62064号
[2] Bousquet,O.,A bennett浓度不等式及其在经验过程上的应用,C.R.Math。,334, 495-500 (2002) ·Zbl 1001.60021号
[3] Bradic,J。;范,J。;姜杰,具有NP维的Cox比例风险模型的正则化,Ann.Statist。,39, 3092-3120 (2011) ·Zbl 1246.62202号
[4] 陈,J。;Chen,Z.,《大模型空间模型选择的扩展贝叶斯信息准则》,Biometrika,95759-771(2008)·Zbl 1437.62415号
[5] Cheng,M.-Y。;本田,T。;Zhang,J.-T.,稀疏超高维变系数模型的正向变量选择,J.Amer。统计师。协会,1111209-1221(2016)
[6] 范,J。;Li,R.,通过非冲突惩罚似然进行变量选择及其预言性质,J.Amer。统计师。协会,96,1348-1360(2001)·Zbl 1073.62547号
[7] 范,J。;Lv,J.,超高维特征空间的确定独立筛选(含讨论),J.R.Stat.Soc.Ser。B、 70849-911(2008)·Zbl 1411.62187号
[9] 范,J。;Song,R.,具有NP维的广义线性模型中的确定独立筛选,Ann.Statist。,38, 3567-3604 (2010) ·兹比尔1206.68157
[10] Fine,J.,比较非嵌套Cox模型,Biometrika,89635-648(2002)·Zbl 1036.62009年
[11] Friedman,J.,《贪婪函数近似:梯度提升机》,Ann.Statist。,29, 1189-1232 (2001) ·Zbl 1043.62034号
[12] van de Geer,S.A.,高维广义线性模型和Lasso,Ann.Statist。,36, 614-645 (2008) ·Zbl 1138.62323号
[13] Gorst-Rasmussen,A。;Scheike,T.,《具有超高维特征的单指标风险率模型的独立筛选》,J.R.Stat.Soc.Ser。B、 75217-245(2013)·Zbl 07555446号
[14] 郝,N。;Zhang,H.H.,超高维数据的交互筛选,J.Amer。统计师。协会,1091285-1301(2014)·Zbl 1368.62193号
[15] 何,X。;Wang,L。;Hong,H.G.,高维异质数据的分位数自适应无模型变量筛选,Ann.Statist。,41, 342-369 (2013) ·Zbl 1295.62053号
[16] Hong,H.G。;陈,X。;哥伦比亚特区克里斯蒂安尼。;Li,Y.,《综合功率密度:筛选与生存结果相关的超高维协变量》,生物统计学,74421-429(2017)·Zbl 1415.62101号
[17] Hong,H.G。;Kang,J。;Li,Y.,超高维协变量与生存结果的条件性筛选,寿命数据分析。,24, 45-71 (2018) ·Zbl 1468.62386号
[18] Hong,H.G。;Li,Y.,超高维协变量的特征选择与生存结果:选择性综述,应用。数学。序列号。B、 32379-396(2017)·Zbl 1399.62178号
[19] 黄,J。;Sun,T。;Ying,Z。;Yu,Y。;Zhang,C.-H.,Cox模型中Lasso的Oracle不等式,Ann.Statist。,41, 1142-1165 (2013) ·Zbl 1292.62135号
[20] Ing,C.-K.公司。;Lai,T.L.,高维稀疏线性模型的逐步回归方法和一致模型选择,Statist。Sinica,21,1473-1513(2011)·Zbl 1225.62095号
[23] Lin,D.Y。;Wei,L.-J.,Cox比例风险模型的鲁棒推理,J.Amer。统计师。协会,84,1074-1078(1989)·Zbl 0702.62042号
[25] 罗,S。;徐,J。;Chen,Z.,高维特征空间Cox模型中的扩展贝叶斯信息准则,Ann.Inst.Statist。数学。,67, 287-311 (2015) ·兹比尔1341.62093
[26] Schmidt,K.D.,《关于随机变量单调函数的协方差》(2003),数学研究所教授。随机
[27] 宋,R。;卢·W。;马,S。;Jeng,X.J.,高维生存数据的删失秩独立筛选,Biometrika,101799-814(2014)·Zbl 1306.62207号
[28] Talagrand,M.,高斯过程和经验过程的Sharper界,Ann.Probab。,22, 28-76 (1994) ·Zbl 0798.60051号
[29] Tibshirani,R.J.,通过Lasso,J.R.Stat.Soc.Ser.回归收缩和选择。B统计方法。,58, 267-288 (1996) ·Zbl 0850.62538号
[30] Tibshirani,R.J.,《考克斯模型中变量选择的拉索方法》,Stat.Med.,16,385-395(1997)
[31] 范德法特,A.W。;Wellner,J.A.,《弱收敛》(1996),Springer:Springer New York·Zbl 0862.60002号
[32] 维廷霍夫,E。;McCulloch,C.E.,放松逻辑回归和Cox回归中每个变量十个事件的规则,美国流行病学杂志。,165, 710-718 (2007)
[33] 沃林斯基,C.T。;Raftery,A.E.,删失生存模型的贝叶斯信息标准,生物统计学,56,256-262(2000)·Zbl 1060.62557号
[34] Wang,H.,超高维变量筛选的正向回归,J.Amer。统计师。协会,104,1512-1524(2009)·Zbl 1205.62103号
[35] Xu,R。;Vaida,F。;Harrington,D.P.,《使用剖面似然进行半参数模型选择并应用于比例风险混合模型》,Statist。Sinica,19,819-842(2009)·Zbl 1166.62030号
[36] 张春华,极小极大凹惩罚下的几乎无偏变量选择,安统计学家。,38, 894-942 (2010) ·Zbl 1183.62120号
[37] 赵S.D。;Li,Y.,超高维协变量Cox模型的原则确定独立性筛选,《多元分析杂志》。,105, 397-411 (2012) ·Zbl 1233.62173号
[38] 郑琦。;彭,L。;He,X.,超高维数据的全球自适应分位数回归,Ann.Statist。,43, 2225 (2015) ·Zbl 1327.62424号
[39] 钟伟。;张,T。;Zhu,Y。;Liu,J.S.,相关性追求:指数模型的正向逐步变量选择,J.R.Stat.Soc.Ser。B统计方法。,74849-870(2012年)·Zbl 1411.62050号
[40] Zöchbauer-Müller,S。;Minna,J.D。;Gazdar,A.F.,《肺癌中的异常DNA甲基化:生物学和临床意义》,Oncol。,7451-457(2002年)
[41] Zou,H.,关于惩罚比例风险模型中基于路径的变量选择的注释,Biometrika,95241-247(2008)·Zbl 1437.62681号
此参考列表基于出版商或数字数学图书馆提供的信息。它的项目与zbMATH标识符启发式匹配,并且可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。