×

高维生存数据的无模型特征筛选。 (英语) Zbl 1401.35081号

摘要:随着各个学科中快速增长的科学数据,特征筛选在许多科学领域发挥着重要作用,可以将高维性降低到中等规模。本文介绍了一种用于高维生存数据的带删失的统一且稳健的无模型特征筛选方法,该方法具有以下优点:它是一种通用模型框架下的无模型方法,因此避免了指定具有大量候选变量的实际模型形式的复杂性;在温和的条件下,不需要任何时刻的响应,它在超高维上具有排序一致性和确定的筛选特性。特别是,我们在给定每个协变量的情况下,对响应和审查变量进行了条件独立性假设,而不是假设审查变量独立于响应和协变量。此外,我们还为新程序提出了一个更稳健的变种,该变种具有理想的理论性质,而不需要任何预测因子和响应的有限矩条件。新提出的方法的计算不需要任何复杂的数值优化,而且速度快,易于实现。大量的数值研究表明,所提出的方法对各种配置具有竞争力。通过对遗传数据集的分析来说明其应用。

MSC公司:

35J60型 非线性椭圆方程
35J70型 退化椭圆方程

软件:

uniCox公司
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Beran R.随机截尾生存数据的非参数回归。技术报告。伯克利:加利福尼亚大学,1981年
[2] 布拉迪奇,J;风扇,J;蒋,J,具有NP维的cox比例风险模型的正则化,Ann Statist,393092-3120,(2011)·Zbl 1246.62202号 ·doi:10.1214/11-AOS911
[3] 坎迪斯,E;Tao,T,无文章标题,Dantzig选择器:当p远大于n时的统计估计:Ann Statist,352313-2351,(2007)·Zbl 1139.62019号
[4] 崔,H;李,R;Zhong,W,超高维判别分析的无模型特征筛选,J Amer Statist Assoc,110,630-641,(2015)·Zbl 1373.62305号 ·doi:10.1080/01621459.2014.920256
[5] Dave,S S;赖特,G;Tan,B;等。,根据肿瘤浸润免疫细胞的分子特征预测滤泡性淋巴瘤的生存率,《英国医学杂志》,351,2159-2169,(2004)·doi:10.1056/NEJMoa041869
[6] 风扇,J;Li,R,通过非冲突惩罚似然选择变量及其预言性质,J Amer Statist Assoc,96,1348-1360,(2001)·Zbl 1073.62547号 ·doi:10.1198/016214501753382273
[7] 风扇,J;Li,R,考克斯比例风险模型和脆弱性模型的变量选择,Ann Statist,30,74-99,(2002)·Zbl 1012.62106号 ·doi:10.1214/aos/1015362185
[8] 风扇,J;Lv,J,超高维特征空间的确定独立筛选,J R Stat Soc Ser B Stat Methodol,70,849-911,(2008)·Zbl 1411.62187号 ·doi:10.1111/j.1467-9868.2008.00674.x
[9] 风扇,J;桑沃斯,R;Wu,Y,超高维特征选择:超越线性模型,J Mach Learn Res,102013-2038,(2009)·Zbl 1235.62089号
[10] 风扇,J;Song,R,具有NP维的广义线性模型中的确定独立性筛选,Ann Statist,38,3567-3604,(2010)·Zbl 1206.68157号 ·doi:10.1214/10-AOS798
[11] 戈斯特·拉斯穆森,A;Scheike,T,具有超高维特征的单指数风险率模型的独立筛选,J R Stat Soc Ser B Stat Methodol,75,217-245,(2013)·Zbl 07555446号 ·文件编号:10.1111/j.1467-9868.2012.01039.x
[12] 他,X;王,L;Hong,H G,高维异质数据的分位数自适应无模型变量筛选,Ann Statist,41,342-369,(2013)·Zbl 1295.62053号 ·doi:10.1214/13-AOS1087
[13] Hoeffing,W,有界随机变量和的概率不等式,J Amer Statist Assoc,58,13-30,(1963)·Zbl 0127.10602号 ·doi:10.1080/01621459.1963.10500830
[14] 黄,J;太阳,T;Ying,Z;等。,考克斯模型中套索的Oracle不等式,Ann Statist,411142-1165,(2013)·Zbl 1292.62135号 ·doi:10.1214/13-AOS1098
[15] Iglewicz B,Hoaglin D C.如何检测和处理异常值。密尔沃基:美国质量控制学会,1993年
[16] Kosorok M R.经验过程和半参数推断导论。纽约:Springer,2006·兹比尔1180.62137
[17] 李,G;彭,H;张,J;等。,基于稳健秩相关的筛选,Ann Statist,401846-1877,(2012)·Zbl 1257.62067号 ·doi:10.1214/12-AOS1024
[18] 李,R;钟,W;Zhu,L,通过距离相关学习进行特征筛选,J Amer Statist Assoc,107,1129-1139,(2012)·Zbl 1443.62184号 ·doi:10.1080/01621459.2012.695654
[19] Massart,P,关于经验过程的塔拉格兰德浓度不等式中的常数,Ann Probab,28,863-884,(2000)·Zbl 1140.60310号 ·doi:10.1214/aop/1019160263
[20] 宋,R;卢,W;Ma,S,高维生存数据的删失秩独立筛选,Biometrika,104,799-814,(2014)·Zbl 1306.62207号 ·doi:10.1093/biomet/asu047
[21] Tibshirani,R,通过套索进行回归收缩和选择,J R Stat Soc Ser B Stat Methodol,58,267-288,(1996)·Zbl 0850.62538号
[22] Tibshirani,R,Cox模型中变量选择的套索方法,Stat Med,16385-395,(1997)·doi:10.1002/(SICI)1097-0258(19970228)16:4<385::AID-SIM380>3.0.CO;2-3
[23] Tibshirani,R,高维数据Cox模型中的单变量收缩,Stat-Appl-Genet Mol Biol,8,1-18,(2009)·兹比尔1276.62096 ·数字对象标识代码:10.2202/1544-6115.1438
[24] Uno,H;蔡,T;Pencina,M J;等。,关于用截尾生存数据评估风险预测程序总体充分性的C统计量,Stat Med,301105-1117,(2011)
[25] 吴,Y;Yin,G,超高维异质数据中的条件分位数筛选,Biometrika,102,65-76,(2015)·Zbl 1345.62097号 ·doi:10.1093/biomet/asu068
[26] 元,M;Lin,Y,分组变量回归中的模型选择和估计,J R Stat Soc Ser B Stat Methodol,68,49-67,(2006)·Zbl 1141.62030号 ·doi:10.1111/j.1467-9868.2005302.x
[27] 张,H H;Lu,W,考克斯比例风险模型的自适应套索,生物统计学,94,691-703,(2007)·Zbl 1135.62083号 ·doi:10.1093/biomet/asm037
[28] 赵,S D;Li,Y,超高维协变量Cox模型的原则确定独立性筛选,《多元分析杂志》,105,397-411,(2012)·Zbl 1233.62173号 ·doi:10.1016/j.jmva.2011.08.002
[29] Zhong,W,超高维非正态数据的稳健确定独立性筛选,《数学学报》,第30期,1885-1896页,(2014)·Zbl 1305.62092号 ·doi:10.1007/s10114-014-3694-2
[30] 周,T;Zhu,L,超高维删失回归的无模型特征筛选,统计计算,27947-961,(2017)·Zbl 1384.62144号 ·doi:10.1007/s11222-016-9664-z
[31] 朱,L;李,L;李,R;等。,超高维数据的无模型特征筛选,J Amer Statist Assoc,106,1464-1474,(2011)·Zbl 1233.62195号 ·doi:10.1198/jasa.2011.tm10563
[32] Zou,H,自适应套索及其预言属性,J Amer Statist Assoc,101,1418-1429,(2006)·Zbl 1171.62326号 ·doi:10.1198/016214500000735
此参考列表基于出版商或数字数学图书馆提供的信息。它的项目与zbMATH标识符启发式匹配,并且可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。