×

基于高维协变量稳定得分测试的生存树。 (英语) Zbl 07698005号

总结:生存树可以将受试者分为不同的生存预后组。然而,当数据包含高维协变量时,这两种流行的分类树表现出致命的缺陷。logrank树是不稳定的,往往有虚假节点;条件推理树很难解释高维测试的调整后的P值。基于这些问题,我们提出了一种新的基于稳定得分测试的生存树。为了通过稳定分数测试同时测试多个节点,我们提出了一种新的基于矩阵的算法。我们提出了一种递归分区算法来构造生存树并开发我们的原始R包https://cran.r-project.org/package=uni.survival.tree用于实施。通过仿真验证了该方法相对于现有方法的优越性。肺癌数据分析证明了该方法的有效性。

MSC公司:

62至XX 统计
PDF格式BibTeX公司 XML格式引用
全文: DOI程序 链接

参考文献:

[1] Alvisi,G。;布鲁梅尔曼,J。;普契奥,S。;马扎,E.M。;番茄,E.P。;A.Losurdo。;萨农,V。;皮亚诺,C。;斯里兰卡科伦坡。;斯卡帕,A。;阿洛伊西奥,M。;瓦桑塔库马尔,A。;Roychoudhuri,R。;Kallikourdis,M。;Pagani,M。;Lopci,E。;Novellis,P。;布鲁姆,J。;Kallies,A。;Veronesi,G。;Lugli,E.,IRF4指导人类癌症中的效应Treg分化和免疫抑制,临床杂志。投资。,130, 6, 3137-3150 (2020)
[2] 巴科扬尼斯,G。;Chu,F.I。;Babiker,A.G。;Touloumi,G.,随机对照试验中细灰色模型协变量遗漏和分类的影响,Jpn。统计数据科学杂志。(2021) ·Zbl 1478.62318号 ·doi:10.1007/s42081-021-0011-5
[3] 啤酒,D.G。;卡迪亚,S.L.R。;黄,C.C。;佐丹奴,T.J。;莱文,A.M。;Misek,D.E。;林,L。;陈,G。;Gharib,T.G。;托马斯·D·G。;Lizeness,M.L。;Kuick,R。;南部早坂。;J.M.G.泰勒。;医学博士Ianettoni。;奥林格,M.B。;Hanash,S.,基因表达谱预测肺腺癌患者的生存率,《国家医学》,8816-824(2002)
[4] Bou-Hamad,I。;拉罗基,D。;Ben-Ameur,H.,《存活树木评论》,Stat.Surv。,5, 44-71 (2011) ·Zbl 1274.62648号
[5] 布雷曼,L。;弗里德曼,J.H。;Olshen,R.A。;Stone,C.J.,《分类和回归树》(1984),查普曼和霍尔:查普曼与霍尔,纽约·Zbl 0541.62042号
[6] 坎塔加略,E。;De Backer,M。;Kicinski,M。;Ozenne,B。;科莱特,L。;罗格朗,C。;Buyse,M。;Péron,J.,基于广义成对比较的涉及竞争风险的临床试验中治疗效果的新衡量标准,Biometrical J,63272-288(2021)·Zbl 1523.62096号 ·doi:10.1002/bimj.201900354
[7] Chen,H.Y。;Yu,S.L。;Chen,C.H。;Chang,G.C。;Chen,C.Y。;袁,A。;Cheng,C.-L。;Wang,C.-H。;特恩·H·J。;高,S.-F。;Chan,W.-K。;李,H.-N。;刘,C.-C。;辛格,S。;陈伟杰。;Chen,J.J.W。;Yang,P.-C.,非小细胞肺癌的五基因特征和临床结果,英国北部。《医学杂志》,356,11-20(2007)
[8] Choi,J。;哦,我。;Seo,S.等人。;Ahn,J.,G2vec:用于识别癌症预后基因的分布式基因表示,科学。代表8、1、1-10(2018年)
[9] Ciampi,A。;布什,R.S。;Gospodarowicz,M。;Till,J.E.,《非霍奇金淋巴瘤患者生存经验相关预后因素分类方法:基于一系列982例患者:1967-1975年,癌症,47,621-627(1981)》
[10] Ciampi,A。;Thiffault,J。;Nakache,J.-P。;Asselain,B.,《通过逐步回归、对应分析和递归分区进行分层:使用协变量分析生存数据的三种方法的比较》,计算。统计数据。分析。,4, 3, 185-204 (1986) ·Zbl 0649.62106号
[11] 新南威尔士州德雷莎。;Van Keilegom,I.,生存数据的多元正态回归模型,受不同类型的依赖性审查,计算。统计数据。分析。,144, 106879 (2020) ·Zbl 1504.62144号
[12] Ditzhaus,M。;Pauly,M.,Wild bootstrap logrank tests with wide power functions for testing superiority,Compute,用更广泛的幂函数测试优势。统计数据。分析。,136, 1-11 (2019) ·兹比尔1507.62049
[13] Dobler,D。;Pauly,M.,基于Bootstrap和置换的右旋和捆绑数据的Mann-Whitney效应推断,Test,27,3,639-658(2018)·Zbl 1417.62284号
[14] Dobler,D。;Pauly,M.,《独立右偏下治疗效果的因子分析》,《统计方法医学研究》(2020年)
[15] Emura,T。;Chen,Y.H.,依赖性审查下生存数据的基因选择:基于连接的方法,《统计方法医学研究》,25,6,2840-2857(2016)
[16] Emura,T。;Chen,Y.H.,《依赖性删减生存数据分析,基于Copula的方法》(2018年),《统计中的JSS研究系列》,Springer:JSS统计研究系列,Springer,新加坡·Zbl 1464.62001年
[17] Emura,T。;Chen,Y.H。;Chen,H.Y.,基于Cox比例风险模型下复合协变量的生存预测,PLoS ONE,7,e47627(2012)·doi:10.1371/journal.pone.0047627
[18] Emura,T。;Hsu,J.H.,相依删失下两样本问题中的Mann-Whitney效应估计,《Compt Stat数据分析》,150,106990(2020)·Zbl 1510.62400号
[19] Emura,T。;松井,S。;Chen,H.Y.,化合物。Cox:预测生存率的单变量特征选择和复合协变量,计算。方法生物识别程序。,168, 21-37 (2019)
[20] Emura,T。;中町,M。;松井,S。;Michimae,H。;Rondeau,V.,根据肿瘤进展和高维遗传因素对死亡的个性化动态预测:联合模型的Meta分析,Stat.Methods Med.Res.,27,922842-2858(2018)
[21] Everitt,B.S。;豪厄尔,D.C.,分类和回归树,行为科学统计百科全书,287-290(2005),威利:威利,奇切斯特·Zbl 1107.62120号
[22] 冯·L。;张,X。;Liu,B.,双样本位置问题的高维空间秩检验,计算。统计数据。分析。,144, 106889 (2020) ·Zbl 1504.62074号
[23] 弗莱明,T.R。;Harrington,D.P.,《计数过程和生存分析》(1991),John Wiley&Sons:John Willey&Sons,纽约·Zbl 0727.62096号
[24] Hothorn,T。;Everitt,B.S.,《使用R的统计分析手册》(2014),CRC出版社·兹比尔1341.62012
[25] Hothorn,T。;霍尼克,K。;Zeileis,A.,《无偏递归分区:条件推理框架》,J.Compute。图表。《统计》,第15卷,第651-674页(2006年)
[26] Hothorn,T.、Hornik,K.和Zeileis,A.,ctree:条件推理树。CRAN版本1.2-8(2020)。
[27] Hothorn,T.、Seibold,H.和Zeileis,A.,partykit:递归参与的工具包。CRAN版本1.2-8(2020)。
[28] Ishwaran,H。;Kogalur,英国。;Blackstone,E.H。;Lauer,M.S.,《随机生存森林》,Ann.Appl。统计,2,3,841-860(2008)·Zbl 1149.62331号
[29] Kang,T.H。;Park,J.H。;杨,A。;帕克,H.J。;李,S.E。;Kim,Y.S。;Jang,G.-Y。;Farmer,E。;Lam,B。;纽约州帕克市。;Hung,C.-F.,Annexin A5作为一种免疫检查点抑制剂和肿瘤归巢分子用于癌症治疗,Nat.Commun,11,1137(2020)
[30] Kim,M。;哦,我。;Ahn,J.,《通过网络学习预测癌症预后的改进方法》,《基因》。(巴塞尔),9,10,478(2018)
[31] 勒布朗,M。;Crowley,J.,《基于树的预后模型综述》,《癌症研究与治疗》,75,113-124(1995)
[32] Lo,S.M。;Mammen,E。;Wilke,R.A.,《多重咒语竞争风险的嵌套连接词持续时间模型》,Compt。统计数据分析。,150, 106986 (2020) ·Zbl 1510.62229号
[33] Lo,S.M。;Wilke,R.A.,相依竞争风险的copula模型,J.R.Stat.Soc.C Appl。Stat.,59,2,359-376(2010年)
[34] Matsui,S.,在微阵列预后标志物研究中使用重要基因子集预测生存结果,BMC Bioinform,7,1156(2006)
[35] 松井,S.,《临床开发和基因组特征验证中的统计问题,预测医学临床试验的设计和分析》,207-226(2015),CRC出版社:CRC出版社,博卡拉顿
[36] 莫拉迪安,H。;拉罗基,D。;Bellavance,F.,《独立审查数据的生存森林》,《统计方法医学研究》,第28、2、445-461页(2019年)
[37] Péron,J。;Buyse,M。;Ozenne,B。;罗氏,L。;Roy,P.,《审查中优先结果的广义两两比较扩展》,《统计方法医学研究》,271230-1239(2018)
[38] Radespiel-Tröger,M。;Rabenstein,T。;施耐德,H.T。;Lausen,B.,生存数据预测分层的基于树的方法比较,Artif。智力。医学,28,323-341(2003)
[39] Therneau,T.M.和Atkinson,E.J.,rpart:递归分区和回归树。CRAN 4.1-15版(2019年)。
[40] Therneau,T.M.和Lumley,T.,《生存:生存分析》。CRAN版本3.1-12(2020)。
[41] van Wieringen,W.N。;Kun,D。;汉佩尔,R。;Boulesteix,L.,使用基因表达数据的生存预测:综述和比较,计算机。统计数据分析。,53, 5, 1590-1603 (2009) ·Zbl 1453.62225号
[42] Witten,D.M。;Tibshirani,R.,《高维协变量生存分析》,《统计方法医学研究》,19,29-51(2010)
[43] Yanagawa,T。;Tajiri,R.,当样本量太小时,Akaike信息标准在两个样本问题中决策的有用性,Jpn。统计数据科学杂志。,1, 2, 333-346 (2018) ·Zbl 1430.62022号
[44] 张,Q。;王,J。;刘,M。;朱,Q。;李强。;谢,C。;Han,C。;Wang,Y。;高,M。;Liu,J.,加权相关基因网络分析揭示了一种新的干细胞指数相关生存模型,用于预测肝细胞癌的预后,Aging,12,13,13502-13517(2020)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。