×

\存活森林中的(L_1)分裂规则。 (英语) Zbl 1468.62397号

摘要:在许多常用的生存树和森林算法中,log-rank检验被用作分割函数。然而,在某些情况下,对数-秩检验可能会有显著的功率损失,特别是当两个比较组的危险函数或生存函数相互交叉时。我们研究了使用两个子节点生存函数之间的积分绝对差作为分割规则。模拟研究和对实际数据集的应用表明,使用此规则构建的森林通常会产生非常好的结果,并且与使用对数-库分割规则构建的林相比,它们通常会更好。

MSC公司:

62页第10页 统计学在生物学和医学中的应用;元分析
62H30型 分类和歧视;聚类分析(统计方面)
62N01号 审查数据模型
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Ambler G,Benner A(2014)mfp:多变量分数多项式。R包版本1.5.0。http://CRAN.R-project.org/package=mfp
[2] Bache K,Lichman M(2013)UCI机器学习库。http://archive.ics.uci.edu/ml
[3] 我,Bou-Hamad;拉罗克,D;Ben Ameur,H,《生存树木综述》,Stat Surv,5,44-71,(2011)·兹比尔1274.62648 ·doi:10.1214/09-SS047
[4] 阿拉巴马州布列斯特克斯;贾尼察,S;克鲁帕,J;König,IR,《随机森林方法论和实践指南概述,重点是计算生物学和生物信息学》,Wiley Interdiscip Rev Data Min Knowl Discov,2493-507,(2012)·doi:10.1002/widm.1072
[5] Breiman,L,Random forests,马赫学习,45,5-32,(2001)·Zbl 1007.68152号 ·doi:10.1023/A:1010933404324
[6] Breiman L、Friedman JH、Olshen RA、Stone CJ(1984)分类和回归树。沃兹沃思和布鲁克斯,蒙特雷·Zbl 0541.62042号
[7] 东北部布雷斯洛;Chatterjee,N,二元结果应用于肾母细胞瘤预后的两阶段研究的设计和分析,J R Stat Soc Ser C(Appl Stat),48,457-468,(1999)·Zbl 0957.62091号 ·doi:10.1111/1467-9876.00165
[8] 陈,X;Ishwaran,H,基因组数据分析的随机森林,基因组学,99,323-329,(2012)·doi:10.1016/j.ygeno.2012.04.003
[9] 陈,X;Ishwaran,H,《随机生存森林的路径狩猎》,生物信息学,29,99-105,(2013)·doi:10.1093/bioinformatics/bts643
[10] Ciampi,A;蒂法尔,J;Nakache,JP;Asselain,B,《通过逐步回归、对应分析和递归分区进行分层:具有协变量的生存数据三种分析方法的比较》,《计算统计数据分析》,4185-204,(1986)·Zbl 0649.62106号 ·doi:10.1016/0167-9473(86)90033-2
[11] Ciampi,A;南非霍格;McKinney,S;Thiffault,J,Recpam:一个计算机程序,用于审查生存数据和生物统计学中经常出现的其他情况的递归分割和合并。i.方法和程序特征,Comput methods Progr Biomed,26223-256,(1988)·doi:10.1016/0169-2607(88)90004-1
[12] 卡特勒,A;Zhao,G,Pert-完全随机树系综,计算科学统计,33490-497,(2001)
[13] 里卡多·宾(Riccardo Bin);威利·索尔布雷;Boulesteix,Anne-Laure,《基于临床和组学数据研究生存模型的预测能力:两个案例研究》,Stat Med,33,5310-5329,(2014)·doi:10.1002/sim.6246
[14] Fleming TR,Harrington DP(1991),计数过程和生存分析。霍博肯威利·Zbl 0727.62096号
[15] 戈登,左;Olshen,RA,树状生存分析,癌症治疗代表,691065,(1985)
[16] 格拉芙,E;Schmoor,C;绍尔布雷,W;Schumacher,M,生存数据预测分类方案的评估和比较,Stat Med,18,2529-2545,(1999)·doi:10.1002/(SICI)1097-0258(19990915/30)18:17/18<2529::AID-SIM274>3.0.CO;2-5
[17] FE哈雷尔;加州,RM;普赖尔,DB;Lee,KL;罗萨蒂,RA,评估医学检验的结果,JAMA,2472543-2546,(1982)·doi:10.1001/jama.1982.03320430047030
[18] Hosmer DW Jr,Lemeshow S,May S(2011)应用生存分析:事件发生时间数据的回归建模。奇切斯特·威利·Zbl 1136.62060号
[19] Hothorn,T;Lausen,B,《关于最大选择秩统计的精确分布》,《计算统计数据分析》,43,121-137,(2003)·Zbl 1429.62542号 ·doi:10.1016/S0167-9473(02)00225-6
[20] Hothorn,T;Bühlmann,P;Dudoit,S;莫里纳罗,A;Laan,MJ,生存集合,生物统计学,7355-373,(2006)·Zbl 1170.62385号 ·doi:10.1093/biostatistics/kxj011
[21] Hothorn,T;霍尼克,K;Zeileis,A,《无偏递归划分:条件推理框架》,《计算图统计杂志》,第15期,第651-674页,(2006)·doi:10.1198/106186006X133933
[22] 伊斯瓦兰,H;Kogalur,UB,随机存活森林的一致性,Stat Probab Lett,80,1056-1064,(2010)·Zbl 1190.62177号 ·doi:10.1016/j.spl.2010.02.020
[23] Ishwaran H,Kogalur UB(2014)《生存、回归和分类的随机森林》(rf-src)。R包版本1.5.5。http://cran.r-project.org/web/packages/randomForestSRC/ ·Zbl 0773.62071号
[24] 伊什瓦兰,H;乌兰巴托Kogalur;爱荷华州黑石集团;Lauer,MS,《随机生存森林》,Ann Appl Stat,2841-860,(2008)·Zbl 1149.62331号 ·doi:10.1214/08-AOAS169
[25] 伊斯瓦兰,H;乌兰巴托州科加卢;戈洛德斯基,EZ;米恩,AJ;Lauer,MS,生存数据的高维变量选择,J Am Stat Assoc,105,205-217,(2010)·Zbl 1397.62220号 ·doi:10.1198/jasa.2009.tm08622
[26] 伊斯瓦兰,H;乌兰巴托州科加卢;陈,X;Minn,AJ,《高维数据的随机生存森林》,《统计分析数据》,第4期,第115-132页,(2011年)·Zbl 07260271号 ·doi:10.1002/sam.10103
[27] Kalbfleisch JD,Prentice RL(1980)失效时间数据的统计分析。概率和数理统计中的威利级数。纽约威利·Zbl 1397.62220号
[28] 勒布朗,M;克劳利,J,《分裂优度生存树》,J Am Stat Assoc,88,457-467,(1993)·Zbl 0773.62071号 ·doi:10.1080/01621459.1993.10476296
[29] 林,X;Wang,H,一种比较生存曲线整体同质性的新测试方法,Biom J,46,489-496,(2004)·Zbl 1442.62499号 ·doi:10.1002/bimj.200310053
[30] 林,X;Xu,Q,生存分布比较的新方法,Pharm Stat,9,67-76,(2010)·doi:10.1002/pst.376
[31] 林,Y;Jeon,Y,《随机森林和自适应最近邻》,J Am Stat Assoc,101,578-590,(2006)·Zbl 1119.62304号 ·doi:10.1198/0162145000001230
[32] Loh,WY,带无偏变量选择和交互检测的回归树,Stat Sin,12,361-386,(2002)·Zbl 0998.62042号
[33] Loh WY(2013)第15版分类和回归树指南用户手册·兹比尔0649.62106
[34] 乌兰巴托莫根森;伊斯瓦兰,H;Gerds,TA,使用预测误差曲线评估随机森林以进行生存分析,J Stat Softw,50,1,(2012)·doi:10.18637/jss.v050.111
[35] R核心团队(2014)R:统计计算的语言和环境。R统计计算基金会,奥地利维也纳。网址:http://www.R-project.org/ ·Zbl 0957.62091号
[36] Rokach,L,《分类任务中表征集成方法的分类学:综述和注释书目》,《计算统计数据分析》,53,4046-4072,(2009)·Zbl 1453.62185号 ·doi:10.1016/j.csda.2009.07.017
[37] 威利·索尔布雷;Patrick Royston,《建立多变量预测和诊断模型:使用分数多项式转换预测因子》,J R Stat-Soc-Ser-A(Stat-Soc),162,71-94,(1999)·doi:10.1111/1467-985X.00122
[38] Scheike T、Martinussen T、Silver J(2009)timereg:timereg软件包,用于生存数据的灵活回归模型。R包版本,第1-2页
[39] Schlichting,P;克里斯滕森,E;安徒生,PK;Fauerholdt,L;Juhl,E;鲍尔森,H;Tygstrup,N,通过cox回归模型确定肝硬化的预后因素,肝病学,3889-895,(1983)·doi:10.1002/hep.1840030601
[40] 舒马赫,M;巴斯特,G;Bojar,H;Huebner,K;Olschewski,M;绍尔布雷伊,W;Schmoor,C;Beyerle,C;诺依曼,RL;Rauschecker,HF,评估结节阳性乳腺癌患者激素治疗和化疗持续时间的随机2×2试验。德国乳腺癌研究小组,《临床肿瘤学杂志》,12,2086-2093,(1994)·doi:10.1200/JCO.1994.12.10.2086
[41] Segal,MR,审查数据的回归树,生物统计学,44,35-47,(1988)·Zbl 0707.62224号 ·doi:10.2307/2531894
[42] Siroky,DS,导航随机森林和算法建模的相关进展,Stat Surv,3147-163,(2009)·兹比尔1190.62100 ·doi:10.1214/07-SS333
[43] Therneau TM(2014)S.R软件包版本2.37-7中的生存分析软件包。http://CRAN.R-project.org/package=生存 ·Zbl 1429.62542号
[44] Verikas,A;Gelzinis,A;Bacauskine,M,《随机森林的挖掘数据:调查和新测试结果》,《模式识别》,44,330-349,(2011)·doi:10.1016/j.patcog.2010.08.011
[45] 朱,R;科索罗克,MR,递归插补生存树,美国统计协会,107,331-340,(2012)·Zbl 1261.62009年 ·doi:10.1080/01621459.2011.637468
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。