×

高维二元删失回归模型的Bayesian惩罚Buckley-James方法。 (英语) Zbl 07522670号

摘要:对于高维基因表达数据,一个重要的目标是识别少量与疾病进展或患者生存相关的基因。在本文中,我们考虑了多元生存数据的变量选择问题。我们提出了一种具有双变量截尾数据的高维加速失效时间(AFT)模型的估计方法。该方法扩展了Buckley-James方法,通过最小化一个惩罚L_2损失函数,该惩罚函数由二元尖峰和单峰先验规范导出。在该算法中,使用Kaplan-Meier估计对截尾观测值进行插补,避免了对误差项的参数假设。我们的实证研究表明,与为单变量生存数据设计的替代程序相比,无论真实事件是否相关,所提出的方法都能提供更好的性能,并为AFT模型概念化了一种处理双变量生存数据的正式方法。还介绍了使用该方法对骨髓瘤临床试验进行分析的结果。

MSC公司:

62Nxx号 生存分析和审查数据
第62页第10页 统计学在生物学和医学中的应用;元分析
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 艾哈迈德,SE;侯赛因,S。;Doksum,KA,Lasso和威布尔删失回归模型中的收缩估计,J Stat Plan Inference,142,6,1273-1284(2012)·Zbl 1242.62075号
[2] 理发师,RF;Candès,EJ,《通过仿冒品控制虚假发现率》,《Annal Stat》,第43、5、2055-2085页(2015年)·Zbl 1327.62082号
[3] 巴比里,MM;Berger,JO,最优预测模型选择,Annal Stat,32,3870-897(2004)·Zbl 1092.62033号
[4] 巴克利,J。;James,I.,《截尾数据线性回归》,《生物统计学》,第66、3、429-436页(1979年)·Zbl 0425.62051号
[5] 蔡,T。;黄,J。;Tian,L.,加速失效时间模型的正则化估计,生物统计学,65,2,394-404(2009)·兹比尔1274.62736
[6] 坎迪斯,E。;范,Y。;Janson,L。;Lv,J.,《淘金:高维受控变量选择的无模型仿冒品》,J R Stat Soc:Ser B(Stat Methodol),80,3,551-577(2018)·Zbl 1398.62335号
[7] Chang,SH,重复事件中连续逗留时间的加速失效时间模型中的边际效应估算,寿命数据分析,10,2,175-190(2004)·Zbl 1058.62082号
[8] Chatonnet,F。;Pignare,A。;Sérandour,AA;卡隆,G。;Avner,S。;罗伯特,N。;Kassambara,A。;A.劳伦特。;比佐特,M。;Agirer,X.,《多发性骨髓瘤的羟甲基组将fam72d确定为与增殖相关的1q21标记物》,《血液学》,105,3,774-783(2020)
[9] Chiou,SH;康,S。;Kim,J。;Yan,J.,带广义估计方程的边际半参数多元加速失效时间模型,寿命数据分析,20,4,599-618(2014)·Zbl 1357.62296号
[10] Cox,DR,回归模型和生命表,J R Stat Soc:Ser B(Methodol),34,2,187-202(1972)·Zbl 0243.62041号
[11] Duan,W。;张,R。;Zhao,Y。;沈,S。;魏毅。;陈,F。;Christiani,DC,参数生存模型的贝叶斯变量选择及其在癌症组学数据中的应用,人类基因组,12,1,49(2018)
[12] 乔治,EI;McCulloch,RE,《贝叶斯变量选择方法》,中国统计局,7,2,339-373(1997)·Zbl 0884.62031号
[13] Hanagal,DD,基于截尾样本的双变量威布尔回归模型,统计论文,47,1,137-147(2006)·Zbl 1084.62101号
[14] 霍利,TS;里兹,I。;杨伟(Yang,W.)。;Wakabayashi,纽约州。;DePalma,L。;Chang,YT;彭,W。;朱,J。;Hawley,RG,通过多能干细胞荧光染料cdy1鉴定abcb1(p-糖蛋白)阳性的卡非佐米耐药骨髓瘤亚群,Am J Hematol,88,4265-272(2013)
[15] He,W。;Lawless,JF,回归分析的双变量位置尺度模型及其在寿命数据中的应用,J R Stat Soc:Ser B(Stat Methodol),67,1,63-78(2005)·Zbl 1060.62061号
[16] Hornsteiner U,Hamerle A(1996)估计多变量失效时间加速失效时间模型的组合gee/buckley-james方法。讨论文件47,蒙城路德维希·马克西米利安大学。也可从http://stat.unimuenchen.de/sfb386/publikation.html
[17] 胡,J。;Chai,H.,高维协变量加速失效时间模型中的调整正则化估计,《多变量分析杂志》,122,96-114(2013)·Zbl 1349.62481号
[18] Huang,J。;Ma,S.,通过桥接法在加速失效时间模型中选择变量,寿命数据分析,16,2,176-195(2010)·Zbl 1322.62189号
[19] 黄,J。;马,S。;Xie,H.,高维协变量加速失效时间模型中的正则化估计,生物统计学,62,3,813-820(2006)·Zbl 1111.62090号
[20] 黄,J。;马,S。;Xie,H.,加速失效时间模型的最小绝对偏差估计,Stat Sinica,17,4,1533-1548(2007)·Zbl 1133.62083号
[21] 黄,J。;马,S。;谢浩。;Zhang,CH,A group bridge approach for variable selection,生物统计学,96,2,339-355(2009)·Zbl 1163.62050
[22] 黄,L。;Kopciuk,K。;Lu,X.,半参数加速失效时间模型中的自适应群桥选择,J Multiv-Anal,175104562(2020)·Zbl 1437.62277号
[23] Huang,Y.,用多州加速逗留时间模型进行删失回归,J R Stat Soc:Ser B(Stat Methodol),64,1,17-29(2002)·Zbl 1015.62114号
[24] Z.Jin。;Lin,D。;Wei,L。;Ying,Z.,加速失效时间模型的基于秩的推断,Biometrika,90,2,341-353(2003)·Zbl 1034.62103号
[25] Z.Jin。;Lin,D。;Ying,Z.,关于截尾数据的最小二乘回归,Biometrika,93,1,147-161(2006)·Zbl 1152.62068号
[26] Z.Jin。;Lin,D。;Ying,Z.,基于边际线性模型的多变量故障时间数据的秩回归分析,斯堪的纳维亚统计杂志,33,1,1-23(2006)·Zbl 1126.62095号
[27] 约翰逊,BA,On lasso for centered data,Electron J Stat,3485-506(2009)·Zbl 1326.62201号
[28] Kalbfleisch,法学博士;Prentice,RL,《失效时间数据的统计分析》(2011),新泽西州:威利·Zbl 0504.62096号
[29] 汗,MHR;Shaw,JEH,利用一类自适应弹性网技术选择生存数据变量,统计计算,26,3,725-741(2016)·Zbl 1505.62220号
[30] 汗,MHR;Shaw,JEH,用综合估计技术选择加速寿命模型的变量,统计方法医学研究,28,3,937-952(2019)
[31] 汗,MHR;Bhadra,A。;Howlader,T.,用船尾模型实现套索、屋脊和弹性网的稳定性选择,Stat Appl Genet Mol Biol,18,5742(2019)·Zbl 1445.92142号
[32] Konrath,S。;Fahrmeir,L。;Kneib,T.,基于高斯惩罚混合的贝叶斯加速失效时间模型:正则化和变量选择,AStA Adv Stat Ana,99,3,259-280(2015)·Zbl 1443.62386号
[33] 科尔,H。;Vv,苏萨拉;Van Ryzin,J.,随机右偏数据的回归分析,《年鉴统计》,9,6,1276-1288(1981)·Zbl 0477.62046号
[34] 李,KE;Mallick,BK,生存模型中变量选择的贝叶斯方法及其在dna微阵列数据中的应用,Sankhyá:Ind J Stat,66,4,756-778(2004)·Zbl 1192.62083号
[35] Lee,KH;Chakraborty,S。;Sun,J.,《使用群体套索先验法对高维基因组数据进行变量选择和审查结果》,《计算统计数据分析》,第112期,第1-13页(2017年)·Zbl 1464.62115号
[36] 李,H。;Yin,G.,用聚类失效时间数据进行线性回归的广义矩估计方法,Biometrika,96,2,293-306(2009)·Zbl 1163.62076号
[37] 李毅。;Dicker,L。;Zhao,SD,《删失线性回归模型的dantzig选择器》,中国统计局,24,1,251(2014)·Zbl 1285.62075号
[38] Lu,W.,删失双变量失效时间数据的独立性检验,寿命数据分析,13,1,75-90(2007)·Zbl 1121.62087号
[39] Miller,RG,带删失数据的最小二乘回归,Biometrika,63,3,449-464(1976)·Zbl 0344.62058号
[40] 米切尔,TJ;Beauchamp,JJ,线性回归中的贝叶斯变量选择,J Am Stat Assoc,83,404,1023-1032(1988)·Zbl 0673.62051号
[41] Narisetty,NN;He,X.,具有收缩和扩散先验的贝叶斯变量选择,Annal Stat,42,2789-817(2014)·Zbl 1302.62158号
[42] JE诺尔;Vandyke,K。;Hewett,DR;姆罗兹克,KM;巴拉,RJ;威廉姆斯,SA;中国科克;Zannettino,AC,Pttg1的表达与多发性骨髓瘤的过度增殖性疾病和不良预后有关,《血液肿瘤杂志》,8,1106(2015)
[43] 潘·W。;Kooperberg,C.,《通过多重插补实现二元删失数据的线性回归》,《统计医学》,18,22,3111-3121(1999)
[44] 潘·W。;Louis,TA,多元删失数据的线性混合效应模型,生物统计学,56,1160-166(2000)·Zbl 1060.62650号
[45] 帕克,T。;Casella,G.,《贝叶斯套索》,美国统计协会期刊,第103、482、681-686页(2008年)·Zbl 1330.62292号
[46] 罗奇科娃,V。;George,EI,Emvs:贝叶斯变量选择的em方法,美国统计协会期刊,109,506,828-846(2014)·Zbl 1367.62049号
[47] 日本萨伯林;瓦尔达尔,W。;Nobel,AB,《惩罚模型选择中选择惩罚参数的置换方法》,生物统计学,71,4,1185-1194(2015)·Zbl 1419.62171号
[48] 施耐德,H。;Weissfeld,L.,《截尾数据线性模型中的估计》,《生物统计学》,73,3,741-745(1986)·Zbl 0655.62072号
[49] Sha,N。;塔德斯,MG;Vannucci,M.,贝叶斯变量选择用于分析经审查结果的微阵列数据,生物信息学,22,18,2262-2268(2006)
[50] Shaughnessy,J.,染色体带1q21处cks1b的扩增和过度表达与p27 kip1水平降低和多发性骨髓瘤的侵袭性临床病程相关,血液学,10,117-126(2005)
[51] 肖内西(Shaughnessy,JD Jr);詹,F。;比利时布里灵顿;黄,Y。;科拉,S。;花村一世。;斯图尔特,JP;Kordsmeier,B。;伦道夫,C。;Williams,DR,高危多发性骨髓瘤经验证的基因表达模型是通过对1号染色体上的基因表达进行放松管制来定义的,Blood,109,6,2276-2284(2007)
[52] Shi,L。;坎贝尔,G。;琼斯,W。;坎帕涅,F。;温,Z。;Walker,S。;苏,Z。;Chu,T。;古德赛,F。;Pusztai,L.,《maqc-ii项目:基于微阵列预测模型开发和验证的通用实践综合研究》,《自然生物技术》,28827-838(2010)
[53] 斯图特,W。;Wang,JL,《随机审查下的强势法律》,《年鉴统计》,第36期,第1591-1607页(1993年)·Zbl 0785.60020号
[54] 马萨诸塞州坦纳;Wong,WH,《通过数据增强计算后验分布》,美国统计学会杂志,82,398,528-540(1987)·Zbl 0619.62029号
[55] Tibshirani,R.,《考克斯模型中变量选择的套索方法》,《统计医学》,16,4,385-395(1997)
[56] Tsiatis,AA,《使用删失数据的线性秩检验估计回归参数》,《年鉴统计》,90,354-372(1990)·Zbl 0701.62051号
[57] Uno,H。;蔡,T。;Pencina,MJ;达戈斯蒂诺,苏格兰皇家银行;Wei,L.,《关于使用删失生存数据评估风险预测程序总体充分性的c-statistics》,Stat Med,30,10,1105-1117(2011)
[58] Van Erp,S。;奥伯斯基,DL;Mulder,J.,贝叶斯惩罚回归的收缩先验,《数学心理学杂志》,89,31-50(2019)·Zbl 1431.62564号
[59] Visser,M.,双变量生存函数的非参数估计及其在垂直传播艾滋病中的应用,Biometrika,83,3,507-518(1996)·Zbl 0866.62076号
[60] 王,S。;Nan,B。;朱,J。;Beer,DG,高维协变量生存数据的双重惩罚buckley-james方法,生物统计学,64,1,132-140(2008)·Zbl 1139.62063号
[61] 王,X。;Song,L.,加速失效模型的自适应套索变量选择,Commun Stat-Theory Methods,40,24,4372-4386(2011)·Zbl 1239.62129号
[62] 王,YG;Fu,L.,具有聚类和截尾数据的加速故障时间模型的秩回归,Comput Stat data Anal,55,7,2334-2343(2011)·Zbl 1328.62564号
[63] Wei,LJ,《加速失效时间模型:生存分析中cox回归模型的有用替代方法》,Stat Med,11,14-15,1871-1879(1992)
[64] 魏,LJ;Ying,Z。;Lin,D.,基于秩检验的截尾生存数据线性回归分析,Biometrika,77,4,845-851(1990)
[65] 徐,J。;冷,C。;Ying,Z.,基于秩的删失数据变量选择,统计计算,20,2,165-176(2010)
[66] Yi,GY;He,W.,加速失效时间模型下具有误测协变量的双变量生存数据方法,Commun Stat-Theory Methods,35,8,1539-1554(2006)·Zbl 1105.62097号
[67] 尹,G。;Cai,J.,多变量失效时间数据的分位数回归模型,生物统计学,61,1,151-161(2005)·兹比尔1077.62086
[68] 詹,F。;黄,Y。;科拉,S。;斯图尔特,JP;花村一世。;古普塔,S。;爱泼斯坦,J。;Yaccoby,S。;Sawyer,J。;Burington,B.,《多发性骨髓瘤的分子分类》,《血液》,108,6,2020-2028(2006)
[69] Zhu,有限合伙人;李,L。;Li,R。;Zhu,LX,超高维数据的无模型特征筛选,J Am Stat Assoc,106,496,1464-1475(2011)·Zbl 1233.62195号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。