×

利用一类自适应弹性网技术对生存数据进行变量选择。 (英语) Zbl 1505.62220号

摘要:加速失效时间(AFT)模型在许多情况下都被证明是有用的,尽管严重的审查(例如癌症生存)和高维性(例如微阵列数据)给模型拟合和模型选择带来了困难。基于使用正则加权最小二乘优化的AFT模型,我们提出了新的截尾数据变量选择方法。在两种提出的弹性网类型方法下,正则化技术使用了(ell_1)和(ell_2)范数惩罚的混合。一种是自适应弹性网,另一种是加权弹性网。这些方法扩展了S.Ghosh公司[自适应弹性网:对弹性网的改进,以实现oracle特性。技术报告PR编号07-01。印第安纳波利斯:印第安纳大学-普渡大学(2007)D.洪F.张【数学模型.自然现象.5,No.3,115–133(2010;Zbl 1187.92040号)]分别是。我们还通过在模型优化框架中添加删失观测值作为约束,扩展了这两种方法。这些方法在微阵列和模拟上进行了评估。我们将这些方法的性能与其他六种变量选择技术进行了比较,其中三种通常用于删失数据,另外三种是用于高维数据的基于相关性的贪婪方法。

MSC公司:

62-08 统计问题的计算方法
62J05型 线性回归;混合模型
62号02 生存分析和删失数据中的估计
第62页第10页 统计学在生物学和医学中的应用;元分析
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Akaike,H。;彼得罗夫,BN(编辑);Csaki,F.(编辑),信息论作为最大似然原理的延伸,267-281(1973),布达佩斯·Zbl 0283.62006号
[2] Antoniadis,A.,Fryzlewicz,P.,Letue,F.:考克斯比例风险模型中的Dantzig选择器。扫描。《美国联邦法律大全》第37卷第4期,第531-552页(2010年)·Zbl 1349.62473号 ·文件编号:10.1111/j.1467-9469.2009.00685.x
[3] Buckley,J.,James,I.:删失数据的线性回归。《生物特征》66,429-436(1979)·Zbl 0425.62051号 ·doi:10.1093/biomet/66.3.429
[4] Bühlmann,P.,Kalisch,M.,Maathuis,M.H.:高维线性模型中的变量选择:部分忠实分布和PC-simple算法。生物特征97(2),261-278(2010)·兹比尔1233.62135 ·doi:10.1093/biomet/asq008
[5] Cai,T.,Huang,J.,Tian,L.:加速失效时间模型的正则化估计。生物统计学65,394-404(2009)·兹比尔1274.62736 ·doi:10.1111/j.1541-0420.2008.01074.x
[6] Candes,E.,Tao,T.:Dantzig选择器:当p远大于n时的统计估计。Ann.Stat.35(6),2313-2351(2007)·Zbl 1139.62019号 ·doi:10.1214/00905360000001523
[7] Cho,H.,Fryzlewicz,P.:通过倾斜进行高维变量选择。J.R.统计社会服务。B 74(3),593-622(2012)·Zbl 1411.62183号 ·doi:10.1111/j.1467-9868.2011.01023.x
[8] Cox,D.R.:回归模型和生命表。J.R.统计社会服务。B 34187-220(1972)·Zbl 0243.62041号
[9] Datta,S.、Le-Rademacher,J.、Datta、S.:使用偏最小二乘法和LASSO通过加速失效时间建模从微阵列数据预测患者存活率。生物统计学63,259-271(2007)·doi:10.1111/j.1541-0420.2006.00660.x
[10] Efron,B.:审查数据的两个样本问题。摘自:《第五届伯克利数理统计与概率研讨会论文集》,第4卷,第831-853页。普伦蒂斯·霍尔,纽约(1967年)·Zbl 0767.62036号
[11] Efron,B.,Tibshirani,R.:Bootstrap简介。查普曼和霍尔,纽约(1993年)·Zbl 0835.62038号 ·doi:10.1007/978-1-4899-4541-9
[12] Efron,B.,Hastie,T.,Johnstone,I.,Tibshirani,R.:最小角度回归。Ann.Stat.32,407-499(2004)·Zbl 1091.62054号 ·doi:10.1214/009053604000000067
[13] Engler,D.,Li,Y.:高维协变量生存分析:微阵列研究中的应用。统计应用程序。遗传学。分子生物学。8(1), 1-22 (2009). (第14条)·Zbl 1276.62067号
[14] Fan,J.,Li,R.:通过非冲突惩罚似然及其预言属性进行变量选择。《美国统计协会期刊》96,1348-1360(2001)·Zbl 1073.62547号 ·doi:10.1198/016214501753382273
[15] Fan,J.,Li,R.:考克斯比例风险模型和脆弱性模型的变量选择。Ann.Stat.30,74-99(2002)·Zbl 1012.62106号 ·doi:10.1214/aos/1015362185
[16] Fan,J.,Lv,J.:超高维特征空间的确定独立筛选。J.R.统计社会服务。B 70(5),849-911(2008)·Zbl 1411.62187号 ·doi:10.1111/j.1467-9868.2008.00674.x
[17] Faraggi,D.,Simon,R.:截尾生存数据的贝叶斯变量选择方法。生物统计学54,1475-1485(1998)·Zbl 1058.62511号 ·doi:10.2307/2533672
[18] Frank,I.E.,Friedman,J.H.:一些化学计量学回归工具的统计观点。技术计量学35(2),109-135(1993)·Zbl 0775.62288号 ·doi:10.1080/00401706.1993.10485033
[19] Gehan,E.A.:用于比较任意单次审查样本的广义Wilcoxon检验。《生物特征》52,203-223(1965)·Zbl 0133.41901号 ·doi:10.1093/biomet/52.1-2.203
[20] Ghosh,S.:关于自适应弹性网的分组选择和模型复杂性。统计计算。21(3), 451-462 (2011) ·Zbl 1255.62215号 ·doi:10.1007/s11222-010-9181-4
[21] Ghosh,S.:自适应弹性网:对弹性网的改进,以实现预言性能。技术报告,印第安纳大学普渡大学,印第安纳波利斯,(PR编号07-01)(2007)·Zbl 1187.92040号
[22] Gui,J.,Li,H.:高维和低样本设置下的惩罚Cox回归分析,应用于微阵列基因表达数据。生物信息学21,3001-3008(2005)·doi:10.1093/bioinformatics/bti422
[23] Hong,D.,Zhang,F.:质谱成像处理的加权弹性网模型。数学。模型。自然现象。5(3), 115-133 (2010) ·Zbl 1187.92040号 ·doi:10.1051/mmnp/20105308
[24] Hu,S.,Rao,J.S.:评估高维AFT模型并应用于微阵列数据分析的具有审查约束的稀疏惩罚。迈阿密大学技术报告(2010年)·Zbl 1077.62109号
[25] Huang,J.,Harrington,D.:右删失数据分析的迭代偏最小二乘法:与其他降维技术的比较。生物统计学61(1),17-24(2005)·Zbl 1077.62109号 ·doi:10.1111/j.0006-341X.2005.040304.x
[26] Huang,J.,Ma,S.:通过桥接法在加速失效时间模型中选择变量。寿命数据分析。16, 176-195 (2010) ·Zbl 1322.62189号 ·doi:10.1007/s10985-009-9144-2
[27] Huang,J.,Ma,S.,Xie,H.:具有高维协变量的加速失效时间模型中的正则化估计。生物统计学62,813-820(2006)·Zbl 1111.62090号 ·文件编号:10.1111/j.1541-0420.2006.00562.x
[28] Hunter,D.R.,Li,R.:使用MM算法的变量选择。Ann.Stat.33(4),1617-1642(2005)·Zbl 1078.62028号 ·doi:10.1214/009053605000000200
[29] Jin,Z.,Lin,D.,Wei,L.J.,Ying,Z.L.:加速失效时间模型的基于秩的推断。生物特征90,341-353(2003)·Zbl 1034.62103号 ·doi:10.1093/biomet/90.2.341
[30] Jin,Z.,Lin,D.Y.,Ying,Z.:关于截尾数据的最小二乘回归。生物特征93(1),147-161(2006)·Zbl 1152.62068号 ·doi:10.1093/biomet/93.1.147
[31] Khan,M.H.R.,Shaw,J.E.H.:AdapEnetClass:一类用于审查数据的自适应弹性网络方法。R软件包版本1.1(2014)·Zbl 1058.62511号
[32] Khan,M.H.R.:高维生存数据的变量选择和估计程序。华威大学统计系博士论文(2013)·兹比尔1168.62064
[33] Khan,M.H.R.,Shaw,J.E.H.:关于在加权最小二乘下处理截尾最大观测值。华威大学统计系第13-07号CRiSM工作文件(2013b)·Zbl 07184827号
[34] Khan,M.H.R.,Shaw,J.E.H.:使用改进的Buckley-James方法和dantzig选择器进行变量选择,以获取高维生存数据。收录于:第59届ISI世界统计大会会议记录,香港,第4239-4244页,2013年8月25-30日c·Zbl 1091.62054号
[35] Kriegeskorte,N.,Simmons,W.K.,Bellgowan,P.S.F.,Baker,C.I.:系统神经科学中的循环分析:双重浸泡的危险。自然神经科学。12(5), 535-540 (2009) ·doi:10.1038/nn.2303
[36] Li,H.,Luan,Y.:将基因表达谱与截尾生存数据联系起来的核Cox回归模型。派克靴。交响乐团。生物计算机。8, 65-76 (2003) ·Zbl 1219.92044号
[37] Meinshausen,N.,Bühlmann,P.:稳定性选择。J.R.统计社会服务。B 72(4),417-473(2010)·兹比尔1411.62142 ·文件编号:10.1111/j.1467-9868.2010.00740.x
[38] Peduzzi,P.N.,Hardy,R.J.,Holford,T.R.:非线性回归模型的逐步变量选择程序。生物统计学36,511-516(1980)·Zbl 0442.62049号 ·doi:10.2307/2530219
[39] Radchenko,P.,James,G.M.:通过Forward-Lasso自适应收缩改进变量选择。附录申请。《统计》第5(1)卷,第427-448页(2011年)·Zbl 1220.62089号 ·doi:10.1214/10-AOAS375
[40] Rosenwald,A.、Wright,G.、Wiestner,A.、Chan,W.、Connors,J.、Campo,E.、Gascoyne,R.、Grogan,T.、Muller Hermelink,H.、Smeland,E.、Chiorazzi,M.、Giltnane,J.,Hurt,E.、Zhao,H.,Averett,L.、Henrickson,S.、Yang,L.,Powell,W.、Dave,B.、Lynch,J.、Vose,J.和Armitage,J.,Fisher,R.、Miller,T.、LeBlanc,M.、Ott,G.、Kvaloy,S.、Holte,H.、Delabie,J.以及Staudt,L.:增殖基因表达特征是预测套细胞淋巴瘤生存率的致癌事件的定量积分。癌症细胞3,185-197(2003)·doi:10.1016/S1535-6108(03)00028-X
[41] Sha,N.,Tadesse,M.G.,Vannucci,M.:用于分析具有审查结果的微阵列数据的贝叶斯变量选择。生物信息学22(18),2262-2268(2006)·doi:10.1093/生物信息学/btl362
[42] Stute,W.:协变量可用时,随机审查下的一致估计。J.多变量。分析。45, 89-103 (1993) ·Zbl 0767.62036号 ·doi:10.1006/jmva.1993.1028
[43] Stute,W.:当存在协变量时,随机审查下的分布收敛。扫描。J.Stat.23,461-471(1996)·Zbl 0903.62045号
[44] Swerdlow,S.,Williams,M.:从中心细胞淋巴瘤到套细胞淋巴瘤:30年的临床病理学和分子回顾。嗯,病态。33, 7-20 (2002) ·doi:10.1053/hupa.2002.30221
[45] Tibshirani,R.:通过套索进行回归收缩和选择。J.R.统计社会服务。B 58267-288(1996)·Zbl 0850.62538号
[46] Tibshirani,R.:考克斯模型中变量选择的套索方法。Stat.Med.16,385-395(1997)·doi:10.1002/(SICI)1097-0258(19970228)16:4<385::AID-SIM380>3.0.CO;2-3
[47] Wang,S.,Nan,B.,Zhu,J.,Beer,D.G.:对于具有高维协变量的生存数据,Buckley-James方法受到双重惩罚。生物统计学64,132-140(2008)·Zbl 1139.62063号 ·doi:10.1111/j.1541-0420.2007.00877.x
[48] Wu,Y.:Cox比例风险模型的弹性网,带解路径算法。统计正弦。22271-294(2012年)·Zbl 06013159号
[49] Ying,Z.:删失回归数据秩估计的大样本研究。Ann.Stat.21(1),76-99(1993)·Zbl 0773.62048号 ·doi:10.1214/aos/1176349016
[50] Yuan,M.,Lin,Y.:分组变量回归中的模型选择和估计。J.R.统计社会服务。B 68,49-67(2006)·Zbl 1141.62030号 ·doi:10.1111/j.1467-9868.2005302.x
[51] Zhang,C.H.:极小极大凹惩罚下的几乎无偏变量选择。Ann.Stat.38(2),894-942(2010)·Zbl 1183.62120号 ·doi:10.1214/09-AOS729
[52] Zou,H.:自适应套索及其预言属性。《美国统计协会期刊》101,1418-1429(2006)·Zbl 1171.62326号 ·doi:10.1198/016214500000735
[53] Zou,H.,Hastie,T.:通过弹性网络的正则化和变量选择。J.R.统计社会服务。B 67301-320(2005)·Zbl 1069.62054号 ·数字对象标识代码:10.1111/j.1467-9868.2005.0050.x
[54] Zou,H.,Zhang,H.H.:关于参数发散的自适应弹性网。Ann.Stat.37(4),1733-1751(2009年)·Zbl 1168.62064号 ·doi:10.1214/08-AOS625
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。