×

基因研究中的高维Cox回归分析与截尾生存结果。 (英语) Zbl 1263.62134号

摘要:随着高通量技术的进步,如今高维基因组和蛋白质组数据很容易获得,在揭示许多疾病的复杂病因方面变得越来越重要。虽然通过Cox相对风险模型将大量因素与生存结果联系起来,但文献中提出了各种技术。我们回顾了一些最近开发的此类分析方法。对于具有参数相对风险的Cox模型中的高维变量选择,我们考虑了使用套索惩罚的单变量收缩方法(US)和使用折叠惩罚的惩罚偏似然方法(PPL)。
惩罚方法并不局限于有限维情况。对于高维((p\rightarrow\infty,;p\lln)或超高维情况((n\rightarrow\infty,n\llp)),确定独立性筛选(SIS)方法和扩展贝叶斯信息准则(EBIC)都可以进一步纳入变量选择的惩罚方法中。我们还考虑了具有半参数相对风险的Cox模型的惩罚方法和Cox模型修正的偏最小二乘法。讨论了不同方法的比较,并给出了数值例子。最后,提出了进一步研究的领域。

MSC公司:

第62页第10页 统计学在生物学和医学中的应用;元分析
92D10型 遗传学和表观遗传学
65立方厘米60 统计中的计算问题(MSC2010)
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] L.Breiman,“模型选择中不稳定性和稳定性的启发”,《统计年鉴》,第24卷,第2350-2383页,1996年·Zbl 0867.62055号 ·doi:10.1214/aos/1032181158
[2] R.Tibshirani,“通过类进行回归收缩和选择”,《皇家统计学会期刊B》,第58卷,第267-288页,1996年·Zbl 0850.62538号
[3] J.Fan和R.Li,“通过非认证惩罚可能性及其预言属性进行变量选择”,《美国统计协会杂志》,第96卷,第456期,第1348-1360页,2001年·Zbl 1073.62547号 ·doi:10.1198/016214501753382273
[4] J.Fan和H.Peng,“参数数量不同的非凹惩罚可能性”,《统计学年鉴》,第32卷,第3期,第928-9612004页·Zbl 1092.62031号 ·doi:10.1214/009053604000000256
[5] J.Fan和J.Lv,“超高维特征空间的确定独立筛选”,《皇家统计学会学报》B卷,第70卷,第5期,第849-911页,2008年·doi:10.1111/j.1467-9868.2008.00674.x
[6] J.Chen和Z.Chen,“大模型空间模型选择的扩展贝叶斯信息标准”,《生物统计学》,第95卷,第3期,第759-771页,2008年·Zbl 1437.62415号 ·doi:10.1093/biomet/asn034
[7] J.Chen和Z.Chen,“小n大P稀疏GLM的扩展BIC”,《统计》。新闻界·Zbl 1238.62080号
[8] R.Tibshirani,“考克斯模型中变量选择的拉索方法”,《医学统计学》,第16卷,第385-395页,1997年·doi:10.1002/(SICI)1097-0258(19970228)16:4<385::AID-SIM380>3.0.CO;2-3
[9] J.Fan和R.Li,“考克斯比例风险模型和脆弱性模型的变量选择”,《统计年鉴》,第30卷,第1期,第74-99页,2002年·Zbl 1012.62106号 ·doi:10.1214/aos/1015362185
[10] H.H.Zhang和W.Lu,“Cox比例风险模型的自适应套索”,《生物统计学》,第94卷,第3期,第691-703页,2007年·Zbl 1135.62083号 ·doi:10.1093/biomet/asm037
[11] H.Zou,“惩罚比例风险模型中基于路径的变量选择注释”,《生物特征》,第95卷,第1期,第241-247页,2008年·Zbl 1437.62681号 ·doi:10.1093/biomet/asm083
[12] R.J.Tibshirani,“高维数据的Cox模型中的单变量收缩”,《遗传学和分子生物学的统计应用》,第8卷,第3498-3528页,2009年·Zbl 1276.62096号 ·数字对象标识代码:10.2202/1544-6115.1438
[13] J.Bradic、J.Fan和J.Jiang,“具有NP维的Cox比例风险模型的正则化”,第39卷,第6期,第3092-3120页,2011年·Zbl 1246.62202号 ·doi:10.1214/11-AOS911
[14] P.Du、S.Ma和H.Liang,“具有半参数相对风险的Cox模型的惩罚变量选择程序”,《统计年鉴》,第38卷,第4期,第2092-2117页,2010年·Zbl 1202.62132号 ·doi:10.1214/09-AOS780
[15] H.Li和G.Jiang,“高维微阵列基因表达数据的偏Cox回归分析”,生物信息学,第20卷,第1期,第i208-i2152004页·doi:10.1093/bioinformatics/bth900
[16] P.Verweij和H.van Houwelingen,“生存分析中的交叉验证”,《医学统计学》,第12卷,第2305-23141993页·数字对象标识代码:10.1002/sim.4780122407
[17] D.L.Donoho和I.M.Johnstone,“小波收缩的理想空间适应”,《生物统计学》,第81卷,第3期,第425-455页,1994年·Zbl 0815.62019号 ·doi:10.1093/biomet/81.3.425
[18] D.Paul、E.Bair、T.Hastie和R.Tibshirani,“高维问题中特征选择和回归的‘预处理’”,《统计年鉴》,第36卷,第4期,第1595-1618页,2008年·Zbl 1142.62022号 ·doi:10.1214/009053600000000578
[19] P.J.Bickel、Y.Ritov和A.B.Tsybakov,“LASSO和Dantzig选择器的同步分析”,《统计年鉴》,第37卷,第1705-1732页,2009年·Zbl 1173.62022号 ·doi:10.1214/08-AOS620
[20] Y.Kim、H.Choi和H.-S.Oh,“平滑剪裁高维绝对偏差”,《美国统计协会期刊》,第103卷,第484期,第1665-1673页,2008年·Zbl 1286.62062号 ·doi:10.19198/0162114508000001066
[21] J.Bradic、J.Fan和W.Wang,“超高维变量选择的惩罚复合拟似然”,《皇家统计学会期刊B辑》,出版。
[22] T.T.Wu和K.Lange,“套索惩罚回归的坐标下降算法”,《应用统计学年鉴》,第2卷,第1期,第224-244页,2008年·Zbl 1137.62045号 ·doi:10.1214/07-AOAS174支持
[23] J.Friedman、T.Hastie和R.Tibshirani,“通过坐标下降法实现广义线性模型的正则化路径”,《统计软件杂志》,第33卷,第1-22页,2010年。
[24] B.Efron、T.Hastie、I.Johnstone和R.Tibshirani,“最小角度回归”,《统计年鉴》,第32卷,第2期,第407-499页,2004年,作者讨论和反驳·Zbl 1091.62054号 ·doi:10.1214/009053604000000067
[25] H.Wold,“用迭代最小二乘法估计主成分和相关模型”,载于《多元分析》,P.R.Krishaiaah,Ed.,第391-420页,美国纽约州纽约市学术出版社,1966年·Zbl 0214.46103号
[26] D.Nguyen和D.M.Roke,“应用于DNA微阵列数据的偏最小二乘比例风险回归”,《生物信息学》,第18卷,第1625-1632页,2002年·doi:10.1093/bioinformatics/18.12.1625
[27] P.J.Park、L.Tian和I.S.Kohane,“使用偏最小二乘法将表达数据与患者生存时间联系起来”,生物信息学,第18卷,第S120-S1272002页·doi:10.1093/bioinformatics/18.suppl_1.S120
[28] B.D.Marx,“广义线性回归的迭代加权偏最小二乘估计”,《技术计量学》,第38卷,第374-381页,1996年·Zbl 0902.62081号 ·doi:10.2307/1271308
[29] D.G.Beer、S.L.Kardia、C.C.Huang等人,“基因表达谱预测肺腺癌患者的生存率”,《自然医学》,第8卷,第816-824页,2002年。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。