×

超高维删失回归的无模型特征筛选。 (英语) Zbl 1384.62144号

摘要:在本文中,我们设计了一个确定的具有超高维协变量的删失回归(cSIRS)的独立排序和筛选程序。逆概率加权cSIRS程序是无模型的,因为它没有指定响应变量和协变量之间的参数或半参数回归函数。因此,它对模型误定具有鲁棒性。这种无模型特性在超高维数据分析中非常有吸引力,尤其是在缺乏基本回归结构信息的情况下。cSIRS程序在存在异常值或极值的情况下也是稳健的,因为它只使用截尾响应变量的秩。当协变量的个数满足(p=o{exp(an)})时,我们建立了cSIRS过程的确定筛选和排序一致性性质,其中(a)是一个正常数,(n)是可用样本量。cSIRS相对于现有竞争对手的优势是通过综合模拟和对弥漫性大B细胞淋巴瘤数据集的应用证明。

MSC公司:

62G08号 非参数回归和分位数回归
62J12型 广义线性模型(逻辑模型)
62N01号 审查数据模型
62页第10页 统计学在生物学和医学中的应用;元分析
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Fan,J.,Feng,Y.,Wu,Y.:考克斯比例风险模型的高维变量选择。IMS收集。6, 70-86 (2010)
[2] Fan,J.,Li,R.:考克斯比例风险模型和脆弱性模型的变量选择。Ann.Stat.30,74-99(2002)·Zbl 1012.62106号 ·doi:10.1214/aos/1015362185
[3] Fan,J.,Lv,J.:超高维特征空间的确定独立筛选(讨论)。J.R.Stat.Soc.B 70,849-911(2008)·Zbl 1411.62187号 ·doi:10.1111/j.1467-9868.2008.00674.x
[4] Fan,J.、Samworth,R.、Wu,Y.:超高维特征选择:超越线性模型。J.马赫。学习。1829-1853年第10号决议(2009年)·Zbl 1235.62089号
[5] Fan,J.,Song,R.:具有NP维的广义线性模型中的确定独立筛选。《美国年鉴》第38卷第3567-3604页(2010年)·Zbl 1206.68157号 ·doi:10.1214/10-AOS798
[6] Fang,K.T.,Kotz,S.,Ng,K.W.:对称多元及相关分布。查普曼和霍尔,伦敦(1989)·Zbl 0699.62048号
[7] Gorst-Rasmussen,A.,Scheike,T.:具有超高维特征的单指标风险率模型的独立筛选。J.R.Stat.Soc.B 75,217-245(2013)·Zbl 07555446号 ·文件编号:10.1111/j.1467-9868.2012.01039.x
[8] He,X.,Wang,L.,Hong,H.:高维异质数据的分位数自适应无模型变量筛选。Ann.Stat.41,342-369(2013)·Zbl 1295.62053号 ·doi:10.1214/13-AOS1087
[9] Li,G.,Peng,H.,Zhang,J.,Zhu,L.:基于稳健秩相关的筛选。Ann.Stat.40,1846-1877(2012年a)·Zbl 1257.62067号 ·doi:10.1214/12-AOS1024
[10] Li,R.,Zhong,W.,Zhu,L.:通过距离相关学习进行特征筛选。《美国统计协会期刊》107,1129-1139(2012b)·Zbl 1443.62184号 ·doi:10.1080/01621459.2012.695654
[11] Lo,S.H.,Singh,K.:产品极限估计和引导:一些渐近表示。普罗巴伯。理论关联。字段71、455-465(1986)·兹比尔0561.62032 ·doi:10.1007/BF01000216
[12] Lu,W.,Li,L.:具有删失生存数据的非线性变换模型的Boosting方法。生物统计学9658-667(2008)·Zbl 1437.62546号 ·doi:10.1093/biostatistics/kxn005
[13] Rosenwald,A.、Wright,G.、Chan,W.C.、Connors,J.M.、Hermelink,H.K.、Smeland,E.B.、Staudt,L.M.:使用分子分析预测弥漫性大B细胞淋巴瘤化疗后的生存率。北英格兰。《医学杂志》3461937-1947(2002)·doi:10.1056/NEJMoa012914
[14] Serfling,R.J.:数理统计的近似定理。威利,纽约(1980)·Zbl 0538.62002号 ·数字对象标识代码:10.1002/9780470316481
[15] Tibshirani,R.:通过套索进行回归收缩和选择。J.R.Stat.Soc.B 58,267-288(1996)·Zbl 0850.62538号
[16] Uno,H.,Cai,T.,Pencina,M.J.,D’Agostino,R.B.,Wei,L.J.:关于用删失生存数据评估风险预测程序总体充分性的c-统计量。Stat.Med.30,1105-1117(2011)
[17] Zhao,S.D.,Li,Y.:超高维协变量cox模型的原则性确定独立筛选。J.多变量。分析。105, 397-411 (2012) ·Zbl 1233.62173号 ·doi:10.1016/j.jmva.2011.08.002
[18] Zhu,L.P.,Li,L.,Li.,R.,Zhu和L.X.:超高维数据的无模型特征筛选。《美国统计协会期刊》106,1464-1475(2011)·Zbl 1233.62195号 ·doi:10.1198/jasa.2011.tm10563
[19] Zou,H.:自适应套索及其预言属性。《美国法律总汇》第101卷第1418-1429页(2006年)·Zbl 1171.62326号 ·doi:10.1198/016214500000735
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。