Hong,Hyokyoung G。;郑琦;李毅 具有高维协变量的Cox模型的正向回归。 (英语) Zbl 1422.62302号 《多元分析杂志》。 173, 268-290 (2019). 摘要:前向回归是一种经典的变量筛选方法,在协变量数量相对较少的情况下被广泛用于建模。然而,由于计算繁琐和未知的理论性质,前向回归很少用于高维设置。最近的一些工作表明,前向回归与基于扩展贝叶斯信息准则(EBIC)的停止规则相结合,可以在高维线性回归设置中一致地识别所有相关预测因子。然而,结果基于线性模型的残差平方和,尚不清楚正向回归是否可以应用于更一般的回归设置,例如Cox比例风险模型。我们介绍了Cox模型的前向变量选择过程。它根据部分似然的增量顺序选择重要变量,并具有EBIC停止规则。据我们所知,这是首次研究高维生存环境中基于部分似然的正向回归,并建立选择一致性结果。我们表明,如果真实模型的维数是有限的,则前向回归可以在有限步数内发现所有相关预测因子,并且它们的进入顺序由部分似然增量的大小决定。由于部分似然不是基于密度的常规似然,我们发展了一些关于部分似然的新理论结果,并使用这些结果来确定所需的可靠筛选特性。通过对波士顿肺癌生存队列研究子集的广泛模拟和分析,检验了所提方法的实用性,该研究是一项基于医院的研究,旨在确定与肺癌患者生存相关的生物标记物。 引用于7文件 MSC公司: 62N01号 截尾数据模型 62页第10页 统计学在生物学和医学科学中的应用;元分析 62-07 数据分析(统计)(MSC2010) 关键词:正向选择;部分似然;确定筛选属性;扩展贝叶斯信息准则;高维预测因子 PDF格式BibTeX公司 XML格式引用 \textit{H.G.Hong}等人,《多元分析杂志》。173268--290(2019年;Zbl 1422.62302) 全文: 内政部 链接 参考文献: [1] 贝洛尼,A。;Chernozhukov,V.,高维稀疏模型中的惩罚分位数回归,Ann.Statist。,39, 82-130 (2011) ·Zbl 1209.62064号 [2] Bousquet,O.,A bennett浓度不等式及其在经验过程上的应用,C.R.Math。,334, 495-500 (2002) ·Zbl 1001.60021号 [3] Bradic,J。;范,J。;姜杰,具有NP维的Cox比例风险模型的正则化,Ann.Statist。,39, 3092-3120 (2011) ·Zbl 1246.62202号 [4] 陈,J。;Chen,Z.,《大模型空间模型选择的扩展贝叶斯信息准则》,Biometrika,95759-771(2008)·Zbl 1437.62415号 [5] Cheng,M.-Y。;本田,T。;Zhang,J.-T.,稀疏超高维变系数模型的正向变量选择,J.Amer。统计师。协会,1111209-1221(2016) [6] 范,J。;Li,R.,通过非冲突惩罚似然进行变量选择及其预言性质,J.Amer。统计师。协会,96,1348-1360(2001)·Zbl 1073.62547号 [7] 范,J。;Lv,J.,超高维特征空间的确定独立筛选(含讨论),J.R.Stat.Soc.Ser。B、 70849-911(2008)·Zbl 1411.62187号 [9] 范,J。;Song,R.,具有NP维的广义线性模型中的确定独立筛选,Ann.Statist。,38, 3567-3604 (2010) ·兹比尔1206.68157 [10] Fine,J.,比较非嵌套Cox模型,Biometrika,89635-648(2002)·Zbl 1036.62009年 [11] Friedman,J.,《贪婪函数近似:梯度提升机》,Ann.Statist。,29, 1189-1232 (2001) ·Zbl 1043.62034号 [12] van de Geer,S.A.,高维广义线性模型和Lasso,Ann.Statist。,36, 614-645 (2008) ·Zbl 1138.62323号 [13] Gorst-Rasmussen,A。;Scheike,T.,《具有超高维特征的单指标风险率模型的独立筛选》,J.R.Stat.Soc.Ser。B、 75217-245(2013)·Zbl 07555446号 [14] 郝,N。;Zhang,H.H.,超高维数据的交互筛选,J.Amer。统计师。协会,1091285-1301(2014)·Zbl 1368.62193号 [15] 何,X。;Wang,L。;Hong,H.G.,高维异质数据的分位数自适应无模型变量筛选,Ann.Statist。,41, 342-369 (2013) ·Zbl 1295.62053号 [16] Hong,H.G。;陈,X。;哥伦比亚特区克里斯蒂安尼。;Li,Y.,《综合功率密度:筛选与生存结果相关的超高维协变量》,生物统计学,74421-429(2017)·Zbl 1415.62101号 [17] Hong,H.G。;Kang,J。;Li,Y.,超高维协变量与生存结果的条件性筛选,寿命数据分析。,24, 45-71 (2018) ·Zbl 1468.62386号 [18] Hong,H.G。;Li,Y.,超高维协变量的特征选择与生存结果:选择性综述,应用。数学。序列号。B、 32379-396(2017)·Zbl 1399.62178号 [19] 黄,J。;Sun,T。;Ying,Z。;Yu,Y。;Zhang,C.-H.,Cox模型中Lasso的Oracle不等式,Ann.Statist。,41, 1142-1165 (2013) ·Zbl 1292.62135号 [20] Ing,C.-K.公司。;Lai,T.L.,高维稀疏线性模型的逐步回归方法和一致模型选择,Statist。Sinica,21,1473-1513(2011)·Zbl 1225.62095号 [23] Lin,D.Y。;Wei,L.-J.,Cox比例风险模型的鲁棒推理,J.Amer。统计师。协会,84,1074-1078(1989)·Zbl 0702.62042号 [25] 罗,S。;徐,J。;Chen,Z.,高维特征空间Cox模型中的扩展贝叶斯信息准则,Ann.Inst.Statist。数学。,67, 287-311 (2015) ·兹比尔1341.62093 [26] Schmidt,K.D.,《关于随机变量单调函数的协方差》(2003),数学研究所教授。随机 [27] 宋,R。;卢·W。;马,S。;Jeng,X.J.,高维生存数据的删失秩独立筛选,Biometrika,101799-814(2014)·Zbl 1306.62207号 [28] Talagrand,M.,高斯过程和经验过程的Sharper界,Ann.Probab。,22, 28-76 (1994) ·Zbl 0798.60051号 [29] Tibshirani,R.J.,通过Lasso,J.R.Stat.Soc.Ser.回归收缩和选择。B统计方法。,58, 267-288 (1996) ·Zbl 0850.62538号 [30] Tibshirani,R.J.,《考克斯模型中变量选择的拉索方法》,Stat.Med.,16,385-395(1997) [31] 范德法特,A.W。;Wellner,J.A.,《弱收敛》(1996),Springer:Springer New York·Zbl 0862.60002号 [32] 维廷霍夫,E。;McCulloch,C.E.,放松逻辑回归和Cox回归中每个变量十个事件的规则,美国流行病学杂志。,165, 710-718 (2007) [33] 沃林斯基,C.T。;Raftery,A.E.,删失生存模型的贝叶斯信息标准,生物统计学,56,256-262(2000)·Zbl 1060.62557号 [34] Wang,H.,超高维变量筛选的正向回归,J.Amer。统计师。协会,104,1512-1524(2009)·Zbl 1205.62103号 [35] Xu,R。;Vaida,F。;Harrington,D.P.,《使用剖面似然进行半参数模型选择并应用于比例风险混合模型》,Statist。Sinica,19,819-842(2009)·Zbl 1166.62030号 [36] 张春华,极小极大凹惩罚下的几乎无偏变量选择,安统计学家。,38, 894-942 (2010) ·Zbl 1183.62120号 [37] 赵S.D。;Li,Y.,超高维协变量Cox模型的原则确定独立性筛选,《多元分析杂志》。,105, 397-411 (2012) ·Zbl 1233.62173号 [38] 郑琦。;彭,L。;He,X.,超高维数据的全球自适应分位数回归,Ann.Statist。,43, 2225 (2015) ·Zbl 1327.62424号 [39] 钟伟。;张,T。;Zhu,Y。;Liu,J.S.,相关性追求:指数模型的正向逐步变量选择,J.R.Stat.Soc.Ser。B统计方法。,74849-870(2012年)·Zbl 1411.62050号 [40] Zöchbauer-Müller,S。;Minna,J.D。;Gazdar,A.F.,《肺癌中的异常DNA甲基化:生物学和临床意义》,Oncol。,7451-457(2002年) [41] Zou,H.,关于惩罚比例风险模型中基于路径的变量选择的注释,Biometrika,95241-247(2008)·Zbl 1437.62681号 此参考列表基于出版商或数字数学图书馆提供的信息。它的项目与zbMATH标识符启发式匹配,并且可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。