×

Cox比例风险模型中变量选择的新调和正则化方法。 (英语) Zbl 1423.92052号

摘要:变量选择是回归中的一个重要问题,已经提出了许多涉及非凸惩罚函数的变量选择方法。本文研究了一种新的调和正则化方法,该方法可以近似非凸(Lq(1/2<q<1))正则化,以使用微阵列基因表达数据选择Cox比例风险模型中的关键风险因素。使用我们提出的直接路径搜索方法可以有效地求解调和正则化方法,该方法可以产生近似于凸损失函数和非凸正则化的解。基于人工数据集和四个真实的微阵列基因表达数据集(如真实的弥漫性大B细胞淋巴瘤(DCBCL)、肺癌和AML数据集)的仿真结果表明,调和正则化方法比现有的拉索级数方法更能准确地选择变量。

MSC公司:

92C40型 生物化学、分子生物学
62页第10页 统计学在生物学和医学中的应用;元分析
62年5月 线性回归;混合模型
2007年6月62日 岭回归;收缩估计器(拉索)
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Leung,E.L。;曹志伟。;姜振华。;周,H。;Liu,L.,通过集成系统生物学和计算技术实现基于网络的药物发现,生物信息学简报,14,4,491-505(2013)·doi:10.1093/bib/bbs043
[2] Cox,D.R.,回归模型和生命表,《皇家统计学会期刊B方法学》,34,2,187-220(1972)·Zbl 0243.62041号
[3] Cox,D.R.,部分可能性,生物特征,62,2,269-276(1975)·Zbl 0312.62002号 ·doi:10.1093/biomet/62.269
[4] 范,J。;Li,R.,通过非一致惩罚似然进行变量选择及其预言性质,美国统计协会杂志,96,456,1348-1360(2001)·Zbl 1073.62547号 ·doi:10.1198/016214501753382273
[5] Tibshirani,R.,《通过套索进行回归收缩和选择》,英国皇家统计学会期刊B。方法学,58,1,267-288(1996)·Zbl 0850.62538号
[6] Zhang,H.H。;Lu,W.,Cox比例风险模型的自适应套索,Biometrika,94,3,691-703(2007)·Zbl 1135.62083号 ·doi:10.1093/biomet/asm037
[7] Zhang,C.H.,最小最大凹惩罚下的几乎无偏变量选择,《统计年鉴》,38,2,894-942(2010)·Zbl 1183.62120号 ·doi:10.1214/09-AOS729
[8] 刘,Z。;江,F。;田,G。;王,S。;佐藤,F。;梅尔泽,S.J。;Tan,M.,生物标志物识别的带Lp惩罚的稀疏逻辑回归,遗传学和分子生物学的统计应用,6,1(2007)·Zbl 1166.62314号 ·doi:10.2202/1544-6115.1248
[9] 徐,Z.B。;张,H。;Wang,Y。;Chang,X.Y。;梁毅,L 1/2正则化,中国科学系列F:信息科学,53,6,1159-1169(2010)·Zbl 1497.62192号
[10] 徐,Z.B。;Chang,X.Y。;Xu,F.M.,L-1/2正则化:阈值表示理论和快速求解器,IEEE神经网络和学习系统事务,23,7,1013-1027(2012)
[11] Tibshirani,R.,Cox模型中变量选择的套索方法,医学统计学,16385-395(1997)
[12] 桂,J。;Li,H.,高维和低样本量环境中的惩罚Cox回归分析,及其在微阵列基因表达数据中的应用,生物信息学,21,1330031-3008(2005)·doi:10.1093/bioinformatics/bti422
[13] 邹,H。;Hastie,T.,《通过弹性网进行正则化和变量选择》,《皇家统计学会期刊B:统计方法》,67,2,301-320(2005)·Zbl 1069.62054号 ·文件编号:10.1111/j.1467-9868.2005.005.x
[14] Rosset,S。;朱军,分段线性正则解路径,统计年鉴,35,3,1012-1030(2007)·Zbl 1194.62094号 ·doi:10.1214/0090536000001370
[15] Zhang,T.,稀疏正则化的多级凸松弛分析,机器学习研究杂志(JMLR),11,1081-1107(2010)·兹比尔1242.68262
[16] Mazumder,R。;弗里德曼,J.H。;Hastie,T.,SparseNet:协调下降与非凸惩罚,美国统计协会杂志,106,495,1125-1138(2011)·兹比尔1229.62091 ·doi:10.1198/jasa.2011.tm09738
[17] 梁,Y。;刘,C。;栾,X.-Z。;Leung,K.-S。;Chan,T.-M。;徐,Z.-B。;Zhang,H.,癌症分类中基因选择的L1/2惩罚稀疏逻辑回归,BMC生物信息学,14,1,第198条(2013)·doi:10.186/1471-2105-14-198
[18] 刘,C。;梁,Y。;栾,X.Z。;Leung,K.S。;Chan,T.M。;徐,Z.B。;Zhang,H.,Cox模型中变量选择的L1/2正则化方法,应用软计算,14,498-503(2013)
[19] Fu,W.J.,《惩罚回归:桥梁与套索》,《计算与图形统计杂志》,第7、3、397-416页(1998年)·数字对象标识代码:10.2307/1390712
[20] Blumensath,T。;Yaghoobi,M。;Davies,M.E.,迭代硬阈值和(L_0)正则化,IEEE声学、语音和信号处理国际会议论文集(ICASSP’07)·doi:10.1109/ICASSP.2007.366820
[21] Sohn,I。;Kim,J。;荣格,S.-H。;Park,C.,Cox比例风险模型的梯度套索,生物信息学,25,141775-1781(2009)·doi:10.1093/bioinformatics/btp322
[22] 赵,P。;Yu,B.,Stagewise lasso,《机器学习研究杂志》,8,2701-2726(2007)·Zbl 1222.68345号
[23] 多诺霍,D.L。;霍,X.,不确定性原理和理想原子分解,IEEE信息理论汇刊,47,7,2845-2862(2001)·Zbl 1019.94503号 ·doi:10.1109/18.959265
[24] 多诺霍,D.L。;Elad,E.,通过L1最小化实现最大稀疏表示,美国国家科学院学报,100,52197-2202(2003)·Zbl 1064.94011号
[25] 埃夫隆,B。;哈斯蒂,T。;约翰斯通,I。;Tibshirani,R.,最小角回归,《统计年鉴》,32,2,407-499(2004)·Zbl 1091.62054号 ·doi:10.1214/009053604000000067
[26] Friedman,J.H.,《快速稀疏回归和分类》(2008),斯坦福大学统计系
[27] van Houwelingen,H.C。;布鲁因斯马,T。;哈特,A.A.M。;范特维尔,L.J。;Wessels,L.,微阵列基因表达数据的交叉验证Cox回归,《医学统计学》,25,18,3201-3216(2006)·数字对象标识代码:10.1002/sim.2353
[28] 格拉芙,E。;Schmoor,C。;绍尔布赖,W。;Schumacher,M.,生存数据预测分类方案的评估和比较,《医学统计学》,18,17-18,2529-2545(1999)·doi:10.1002/(SICI)1097-0258(19990915/30)18:17/18<2529::AID-SIM274>3.0.CO;2-5
[29] Harrel,F.E.,回归建模策略及其在线性模型、Logistic回归和生存分析中的应用(2001),美国纽约州纽约市:Springer,纽约州纽约州纽约·Zbl 0982.62063号
[30] Bender,R。;奥古斯丁,T。;Blettner,M.,《生成生存时间以模拟Cox比例风险模型》,《医学统计学》,24,11,1713-1723(2005)·数字对象标识代码:10.1002/sim.2059
[31] 罗森瓦尔德,A。;赖特,G。;Chan,W.C.,《利用分子分析预测弥漫性大B细胞淋巴瘤化疗后的生存率》,《新英格兰医学杂志》,3461937-1946(2002)
[32] 罗森瓦尔德,A。;赖特,G。;威斯特纳,A。;Chan,W.C。;康纳斯,J.M。;坎波,E。;俄罗斯天然气公司。;Grogan,T.M。;Muller-Hermelink,香港。;斯迈兰德,E.B。;Chiorazzi,M。;吉尔特纳,J.M。;赫特,E.M。;赵,H。;Averett,L。;Henrickson,S。;Yang,L。;鲍威尔,J。;Wilson,W.H。;Jaffe,E.S。;西蒙,R。;Klausner,R.D。;蒙特塞拉特,E。;博世,F。;格雷纳,T.C。;维森伯格,D.D。;桑格·W·G。;戴夫,B.J。;林奇,J.C。;Vose,J。;Armitage,J.O。;费舍尔,R.I。;米勒,T.P。;勒布朗,M。;奥特·G。;科瓦洛伊,S。;霍尔特,H。;德拉比,J。;Staudt,L.M.,增殖基因表达特征是预测套细胞淋巴瘤生存率的致癌事件的定量积分,《癌症细胞》,3,2,185-197(2003)·doi:10.1016/S1535-6108(03)00028-X
[33] 啤酒,D.G。;Kardia,S.L.R。;黄,C.-C。;佐丹奴,T.J。;莱文,A.M。;Misek,D.E。;林,L。;陈,G。;Gharib,T.G。;托马斯·D·G。;Lizeness,M.L。;Kuick,R。;南部早坂。;J.M.G.泰勒。;医学博士Ianettoni。;奥林格,M.B。;Hanash,S.,基因表达谱预测肺腺癌患者的生存率,自然医学,8,8,816-824(2002)·数字对象标识代码:10.1038/nm733
[34] 布林格,L。;Döhner,K。;拜尔,E。;弗罗林,S。;施伦克,R.F。;Tibshirani,R。;Döhner,H。;Pollack,J.R.,基因表达谱分析在成人急性髓细胞白血病预后亚类中的应用,《新英格兰医学杂志》,350,16,1605-1616(2004)·doi:10.1056/NEJMoa031046
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。