乔恩·阿尔尼·斯坦格里姆森;刁、利群;罗伯特·斯特劳德曼。 审查无偏回归树和集合。 (英语) Zbl 1478.62289号 美国统计协会。 114,编号525,370-383(2019). 摘要:本文提出了一种在生存分析中构建回归树和集成学习的新范式。介绍了一般损失函数的分类回归树(CART)和随机森林(RF)算法的推广,以及在后一种情况下更通用的引导程序。这些结果,结合适用于损失函数的删失无偏变换(CUT)理论的扩展,支持了两类新的生存树和生存林构建算法的开发:删失无偏回归树和删失毫无偏回归集合。对于平方误差损失的“双稳健”CUT,我们进一步说明了如何使用现有软件(例如CART、RF)实现这些新算法。在模拟环境和四个数据集的应用中,将这些方法与现有的用于预测生存概率的集成程序进行了比较。结果表明,这些新方法要么改进了随机生存树、条件推理树和递归插补生存树的现有实现,要么保持了竞争力。 引用于7文件 MSC公司: 62N01号 审查数据模型 62G05型 非参数估计 62H30型 分类和区分;聚类分析(统计方面) 关键词:分类和回归树;双重鲁棒;损失估算;随机森林;风险预测 软件:随机生存森林;随机森林;聚会;随机ForestSRC;r零件;部分DSA PDF格式BibTeX公司 XML格式引用 \textit{J.A.Steingrissson}等人,《美国法律总汇》第114卷,第525、370和383号(2019年;Zbl 1478.62289) 全文: 内政部 链接 参考文献: [1] Breiman,L.,Bagging Predictors,机器学习,24123-140(1996)·Zbl 0858.68080号 [2] ---《随机森林》,《机器学习》,45,5-32(2001)·Zbl 1007.68152号 [3] 布雷曼,L。;弗里德曼,J.H。;斯通,C.J。;Olshen,R.A.,分类和回归树(1984),纽约:查普曼和霍尔/CRC,纽约·Zbl 0541.62042号 [4] Brier,G.W.,《用概率表示的预测验证》,《月度天气评论》,78,1-3(1950) [5] 巴克利,J。;James,I.R.,《截尾数据线性回归》,《生物特征》,第66期,第429-436页(1979年)·Zbl 0425.62051号 [6] Davis,R.B。;Anderson,J.R.,指数生存树,《医学统计学》,8947-961(1989) [7] 范,J。;Gijbels,I.,《删失回归:局部线性近似及其应用》,美国统计协会杂志,89560-570(1994)·Zbl 0802.62044号 [8] ---《局部多项式建模及其应用》(1996),纽约:查普曼和霍尔出版社,纽约·Zbl 0873.62037号 [9] Gordon,L。;Olshen,R.A.,树状生存分析,《癌症治疗报告》,691065-1069(1985) [10] 格拉芙,E。;Schmoor,C。;Sauerbrei,W。;Schumacher,M.,生存数据预测分类方案的评估和比较,《医学统计学》,第18期,第2529-2545页(1999年) [11] Hothorn,T.公司。;Bühlmann,P。;Dudoit,S。;莫里纳罗,A。;Van Der Laan,M.J.,生存集合,生物统计学,7355-373(2006)·Zbl 1170.62385号 [12] Hothorn,T.、Hornik,K.、Strobl,C.和Zeileis,A.(2010年),聚会:递归聚会实验室,R软件包版本1.0-25,可从 [13] Hothorn,T.公司。;霍尼克,K。;Zeileis,A.,《无偏递归划分:条件推理框架》,《计算与图形统计杂志》,第15期,第651-674页(2006年) [14] Ishwaran,H.,《分裂对随机森林的影响》,机器学习,99,75-118(2015)·Zbl 1320.62015年 [15] Ishwaran,H.和Kogalur,U.B.(2016),randomForestSRC:生存、回归和分类的随机森林(RF-SRC),R软件包版本2.3.0,可从 [16] Ishwaran,H。;Kogalur,英国。;Blackstone,E.H。;Lauer,M.S.,《随机生存森林》,《应用统计年鉴》,2841-860(2008)·Zbl 1149.62331号 [17] Ishwaran,H。;Kogalur,英国。;戈洛德斯基,E.Z。;Minn,A.J。;Lauer,M.S.,生存数据的高维变量选择,美国统计协会杂志,105,205-217(2010)·Zbl 1397.62220号 [18] Jensen,G。;Torp-Pedersen,C。;希尔德布兰特,P。;科伯,L。;尼尔森,F。;Melchior,T。;乔恩,T。;Andersen,P.,住院心室颤动是否影响心肌梗死后的预后?,《欧洲心脏杂志》,18,919-924(1997) [19] 科尔,H。;苏萨拉,V。;Van Ryzin,J.,随机右删失数据的回归分析,《统计年鉴》,9,1276-1288(1981)·Zbl 0477.62046号 [20] 勒布朗,M。;Crowley,J.,《截尾生存数据的相对风险树》,生物统计学,48411-425(1992) [21] ---,《按分裂好度划分的生存树》,《美国统计协会杂志》,88,457-467(1993)·Zbl 0773.62071号 [22] Leurgans,S.,线性模型,随机删减和合成数据,生物特征,74301-309(1987)·兹比尔0649.62068 [23] Liaw,A.和Wiener,M.(2002),“随机森林分类和回归”R新闻, 2, 18-22. 可在 [24] Lostritto,K。;斯特劳德曼,R.L。;Molinaro,A.M.,《创建生存风险组的分区删除/替换/添加算法》,《生物统计学》,68,1146-1156(2012)·Zbl 1274.62830号 [25] 曼奇,L。;胡克,G.,《通过置信区间和假设检验量化随机森林中的不确定性》,《机器学习研究杂志》,17,1-41(2016)·Zbl 1360.62095号 [26] Mogensen,英国。;Ishwaran,H。;Gerds,T.A.,《使用预测误差曲线评估随机森林以进行生存分析》,《统计软件杂志》,50,1-23(2012) [27] 莫里纳罗,A.M。;Dudoit,S。;Van Der Laan,M.J.,基于树的多元回归和右偏数据密度估计,多元分析杂志,90,154-177(2004)·Zbl 1048.62046号 [28] 普雷·斯特加德,J。;Wellner,J.A.,一般经验过程的可交换加权自举,《概率年鉴》,212053-2086(1993)·Zbl 0792.62038号 [29] Rotnitzky,A.和Vansteelandt,S.(2014),《双反方法》,in缺失数据方法手册,编辑G.,Molenberghs,G.,Fitzmaurice,M.,Kenward,A.,Tsiatis,and G.,Verbeke,185-221,纽约:CRC出版社。 [30] 鲁宾,D。;Van Der Laan,M.J.,《双重稳健无偏筛选转换》,《国际生物统计学杂志》,3,1-21(2007)·Zbl 1133.62325号 [31] 鲁宾,D.B.,《贝叶斯自助法》,《统计年鉴》,第9卷,第130-134页(1981年) [32] Scornet,E.公司。;Biau,G。;Vert,J.-P.,《随机森林的一致性》,《统计年鉴》,第43期,第1716-1741页(2015年)·Zbl 1317.62028号 [33] Segal,M.R.,《截尾数据的回归树》,《生物计量学》,44,35-47(1988)·Zbl 0707.62224号 [34] 斯坦格里姆森,J。;刁,L。;莫里纳罗,A.M。;斯特劳德曼,R.L.,《双稳健生存树》,《医学统计》,35,3595-3612(2016) [35] Therneau,T.、Atkinson,B.和Ripley,B.(2014),rpart:递归分区和回归树.R软件包版本4.1-8,可从 [36] Tsiatis,A.,《半参数理论与缺失数据》(2007),纽约:Springer Science&Business Media出版社,纽约·Zbl 1105.6202号 [37] Zhu,R.和Kosorok,M.R.(2012),“递归计算生存树”美国统计协会杂志, 107, 331-340. ·兹比尔1261.62009 此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。