×

审查无偏回归树和集合。 (英语) Zbl 1478.62289号

摘要:本文提出了一种在生存分析中构建回归树和集成学习的新范式。介绍了一般损失函数的分类回归树(CART)和随机森林(RF)算法的推广,以及在后一种情况下更通用的引导程序。这些结果,结合适用于损失函数的删失无偏变换(CUT)理论的扩展,支持了两类新的生存树和生存林构建算法的开发:删失无偏回归树和删失毫无偏回归集合。对于平方误差损失的“双稳健”CUT,我们进一步说明了如何使用现有软件(例如CART、RF)实现这些新算法。在模拟环境和四个数据集的应用中,将这些方法与现有的用于预测生存概率的集成程序进行了比较。结果表明,这些新方法要么改进了随机生存树、条件推理树和递归插补生存树的现有实现,要么保持了竞争力。

MSC公司:

62N01号 审查数据模型
62G05型 非参数估计
62H30型 分类和区分;聚类分析(统计方面)
PDF格式BibTeX公司 XML格式引用
全文: 内政部 链接

参考文献:

[1] Breiman,L.,Bagging Predictors,机器学习,24123-140(1996)·Zbl 0858.68080号
[2] ---《随机森林》,《机器学习》,45,5-32(2001)·Zbl 1007.68152号
[3] 布雷曼,L。;弗里德曼,J.H。;斯通,C.J。;Olshen,R.A.,分类和回归树(1984),纽约:查普曼和霍尔/CRC,纽约·Zbl 0541.62042号
[4] Brier,G.W.,《用概率表示的预测验证》,《月度天气评论》,78,1-3(1950)
[5] 巴克利,J。;James,I.R.,《截尾数据线性回归》,《生物特征》,第66期,第429-436页(1979年)·Zbl 0425.62051号
[6] Davis,R.B。;Anderson,J.R.,指数生存树,《医学统计学》,8947-961(1989)
[7] 范,J。;Gijbels,I.,《删失回归:局部线性近似及其应用》,美国统计协会杂志,89560-570(1994)·Zbl 0802.62044号
[8] ---《局部多项式建模及其应用》(1996),纽约:查普曼和霍尔出版社,纽约·Zbl 0873.62037号
[9] Gordon,L。;Olshen,R.A.,树状生存分析,《癌症治疗报告》,691065-1069(1985)
[10] 格拉芙,E。;Schmoor,C。;Sauerbrei,W。;Schumacher,M.,生存数据预测分类方案的评估和比较,《医学统计学》,第18期,第2529-2545页(1999年)
[11] Hothorn,T.公司。;Bühlmann,P。;Dudoit,S。;莫里纳罗,A。;Van Der Laan,M.J.,生存集合,生物统计学,7355-373(2006)·Zbl 1170.62385号
[12] Hothorn,T.、Hornik,K.、Strobl,C.和Zeileis,A.(2010年),聚会:递归聚会实验室,R软件包版本1.0-25,可从
[13] Hothorn,T.公司。;霍尼克,K。;Zeileis,A.,《无偏递归划分:条件推理框架》,《计算与图形统计杂志》,第15期,第651-674页(2006年)
[14] Ishwaran,H.,《分裂对随机森林的影响》,机器学习,99,75-118(2015)·Zbl 1320.62015年
[15] Ishwaran,H.和Kogalur,U.B.(2016),randomForestSRC:生存、回归和分类的随机森林(RF-SRC),R软件包版本2.3.0,可从
[16] Ishwaran,H。;Kogalur,英国。;Blackstone,E.H。;Lauer,M.S.,《随机生存森林》,《应用统计年鉴》,2841-860(2008)·Zbl 1149.62331号
[17] Ishwaran,H。;Kogalur,英国。;戈洛德斯基,E.Z。;Minn,A.J。;Lauer,M.S.,生存数据的高维变量选择,美国统计协会杂志,105,205-217(2010)·Zbl 1397.62220号
[18] Jensen,G。;Torp-Pedersen,C。;希尔德布兰特,P。;科伯,L。;尼尔森,F。;Melchior,T。;乔恩,T。;Andersen,P.,住院心室颤动是否影响心肌梗死后的预后?,《欧洲心脏杂志》,18,919-924(1997)
[19] 科尔,H。;苏萨拉,V。;Van Ryzin,J.,随机右删失数据的回归分析,《统计年鉴》,9,1276-1288(1981)·Zbl 0477.62046号
[20] 勒布朗,M。;Crowley,J.,《截尾生存数据的相对风险树》,生物统计学,48411-425(1992)
[21] ---,《按分裂好度划分的生存树》,《美国统计协会杂志》,88,457-467(1993)·Zbl 0773.62071号
[22] Leurgans,S.,线性模型,随机删减和合成数据,生物特征,74301-309(1987)·兹比尔0649.62068
[23] Liaw,A.和Wiener,M.(2002),“随机森林分类和回归”R新闻, 2, 18-22. 可在
[24] Lostritto,K。;斯特劳德曼,R.L。;Molinaro,A.M.,《创建生存风险组的分区删除/替换/添加算法》,《生物统计学》,68,1146-1156(2012)·Zbl 1274.62830号
[25] 曼奇,L。;胡克,G.,《通过置信区间和假设检验量化随机森林中的不确定性》,《机器学习研究杂志》,17,1-41(2016)·Zbl 1360.62095号
[26] Mogensen,英国。;Ishwaran,H。;Gerds,T.A.,《使用预测误差曲线评估随机森林以进行生存分析》,《统计软件杂志》,50,1-23(2012)
[27] 莫里纳罗,A.M。;Dudoit,S。;Van Der Laan,M.J.,基于树的多元回归和右偏数据密度估计,多元分析杂志,90,154-177(2004)·Zbl 1048.62046号
[28] 普雷·斯特加德,J。;Wellner,J.A.,一般经验过程的可交换加权自举,《概率年鉴》,212053-2086(1993)·Zbl 0792.62038号
[29] Rotnitzky,A.和Vansteelandt,S.(2014),《双反方法》,in缺失数据方法手册,编辑G.,Molenberghs,G.,Fitzmaurice,M.,Kenward,A.,Tsiatis,and G.,Verbeke,185-221,纽约:CRC出版社。
[30] 鲁宾,D。;Van Der Laan,M.J.,《双重稳健无偏筛选转换》,《国际生物统计学杂志》,3,1-21(2007)·Zbl 1133.62325号
[31] 鲁宾,D.B.,《贝叶斯自助法》,《统计年鉴》,第9卷,第130-134页(1981年)
[32] Scornet,E.公司。;Biau,G。;Vert,J.-P.,《随机森林的一致性》,《统计年鉴》,第43期,第1716-1741页(2015年)·Zbl 1317.62028号
[33] Segal,M.R.,《截尾数据的回归树》,《生物计量学》,44,35-47(1988)·Zbl 0707.62224号
[34] 斯坦格里姆森,J。;刁,L。;莫里纳罗,A.M。;斯特劳德曼,R.L.,《双稳健生存树》,《医学统计》,35,3595-3612(2016)
[35] Therneau,T.、Atkinson,B.和Ripley,B.(2014),rpart:递归分区和回归树.R软件包版本4.1-8,可从
[36] Tsiatis,A.,《半参数理论与缺失数据》(2007),纽约:Springer Science&Business Media出版社,纽约·Zbl 1105.6202号
[37] Zhu,R.和Kosorok,M.R.(2012),“递归计算生存树”美国统计协会杂志, 107, 331-340. ·兹比尔1261.62009
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。