×

生存树和生存集合方法的原理和应用。 (英语) Zbl 1323.62127号

摘要:分类和回归树(CART)及其后续工具——袋装林和随机林,是越来越受到关注的统计学习工具。然而,由于删失数据收集的特点,标准的CART算法不能立即转移到生存分析的上下文中。关于事件发生和时间的问题在心理学和行为科学中都会出现,特别是在纵向研究中。基于树的方法的预测能力和其他关键特性在事件发生是感兴趣的结果的研究中很有前景。本文回顾了专门为删失响应设计的现有树算法以及最近开发的生存集合方法,并介绍了可用的计算机软件。通过仿真和实例,讨论了这些方法的优点和局限性。为实际使用提供了建议。

MSC公司:

第62页,共15页 统计学在心理学中的应用
62页第10页 统计学在生物学和医学中的应用;元分析
68T05型 人工智能中的学习和自适应系统
PDF格式BibTeX公司 XML格式引用
全文: 内政部 链接

参考文献:

[1] Berk,R.A.(2008)。从回归角度进行统计学习。纽约州纽约:施普林格·Zbl 1258.62047号
[2] Breiman,L.(1996)。装袋预测器。机器学习,24123-140·Zbl 0858.68080号
[3] Breiman,L.(2001)。随机森林。机器学习,45,5-32·Zbl 1007.68152号 ·doi:10.1023/A:1010933404324
[4] Breiman,L.(2002)。面向大众的软件。加州大学伯克利分校统计系。检索自http://www.stat.berkeley.edu网站/breiman/wald2002-3.pdf。2014年7月1日查阅·Zbl 0773.62071号
[5] Breiman,L.(2003a)。如何使用生存森林。加州大学伯克利分校统计系。检索自http://www.stat.berkeley.edu网站/breiman/SF_手册.pdf。访问日期:2014年7月1日。
[6] Breiman,L.(2003b)。手动设置、使用和了解随机森林4.0版。检索自http://www.stat.berkeley.edu网站/breiman/Using_random_forests_v4.0.pdf。2014年7月1日查阅。
[7] Breiman,L.、Friedman,J.H.、Olshen,R.和Stone,C.J.(1984)。分类和回归树。纽约州纽约市:查普曼和霍尔·Zbl 0541.62042号
[8] Butler,J.、Gilpin,E.、Gordon,L.和Olshen,R.(1989)。树结构生存分析。二、。斯坦福大学生物统计系技术报告。
[9] Ciampi,A.、Thiffault,J.、Nakache,J.P.和Asselain,B.(1986年)。通过逐步回归、对应分析和递归划分进行分层:对具有协变量的生存数据的三种分析方法的比较。计算统计学与数据分析,4185-204·Zbl 0649.62106号 ·doi:10.1016/0167-9473(86)90033-2
[10] Cox,D.R.(1972)。回归模型和生命表。英国皇家统计学会期刊B辑,34(2),187-220·Zbl 0243.62041号
[11] Cox,D.R.和Oakes,D.(1984)。生存数据分析。伦敦:查普曼和霍尔·Zbl 1007.68152号
[12] Davis,R.和Anderson,J.(1989)。指数生存树。医学统计学,8947-961·数字对象标识代码:10.1002/sim.4780080806
[13] DeWit,D.J.、Adlaf,E.M.、Offord,D.R.和Ogborne,A.C.(2000年)。首次饮酒年龄:酒精障碍发生的危险因素。美国精神病学杂志,157(5),745-750。
[14] Gordon,L.和Olshen,R.A.(1985)。树结构生存分析。癌症治疗报告,69,1065-1069。
[15] Graf,E.、Schmoor,C.、Sauerbrei,W.和Schumacher,M.(1999)。生存数据预后分类方案的评估和比较。医学统计,182529-2545·doi:10.1002/(SICI)1097-0258(19990915/30)18:17/18<2529::AID-SIM274>3.0.CO;2-5
[16] Harrell,F.、Calif,R.、Pryor,D.、Lee,K.和Rosati,R..(1982年)。评估医学测试的结果。《美国医学会杂志》,2472543-2546·doi:10.1001/jama.1982.03320430047030
[17] Henning,K.R.和Fureh,B.C.(1996年)。监禁罪犯的认知行为治疗:佛蒙特州惩教署认知自我改变项目评估。《刑事司法与行为》,第23期,第523-541页。
[18] Hothorn,T.、Bühlmann,P.、Dudoit,S.、Molinaro,A.和van der Laan,M.J.(2006年A)。生存合奏。生物统计学,7(3),355-373·Zbl 1170.62385号
[19] Hothorn,T.、Hornik,K.、Strobl,C.和Zeileis,A.(2010年)。包“一方”:递归部分(y)定位的实验室(R包0.9-9997版)[计算机软件]。检索自http://cran.r-project.org/web/packages/party/index.html。2010年10月15日访问。
[20] Hothorn,T.、Hornik,K.和Zeileis,A.(2006b)。无偏递归划分:一个条件推理框架。《计算与图形统计学杂志》,15651-674·doi:10.1198/106186006X133933
[21] Hothorn,T.、Lausen,B.、Benner,A.和Radespiel-Tröger,M.(2004)。将幸存树木打包。医学统计,2377-91·数字对象标识代码:10.1002/sim.1593
[22] Hothorn,T.和Zeileis,A.(2012年)。包“partykit”:递归Partytioning的工具包(R包版本0.1-6)[计算机软件]。检索自http://cran.r-project.org/web/packages/partykit/index.html。2013年9月3日访问·Zbl 0649.62106号
[23] Intrator,O.和Kooperberg,C.(1995年)。生存分析中的树和样条曲线。《医学研究中的统计方法》,4(3),237-261。
[24] Ishwaran,H.和Kogalur,U.B.(2010年)。“randomSurvivalForest”包:随机生存林。(R包版本3.6.3)[计算机软件]。检索自http://cran.r-project.org/web/packages/randomSurvivalForest/index.html。2010年10月15日访问·Zbl 1190.62177号
[25] Ishwaran,H.、Kogalur,U.B.、Blackstone,E.H.和Lauer,M.S.(2008)。随机生存森林。应用统计年鉴,2(3),841-860·Zbl 1149.62331号
[26] Keleš,S.和Segal,M.R.(2002年)。基于残差的树结构生存分析。医学统计学,21,313-326·Zbl 0308.62063号
[27] LeBlanc,M.和Crowley,J.(1992年)。截尾生存数据的相对风险树。生物统计学,48,411-425·doi:10.2307/2532300
[28] LeBlanc,M.和Crowley,J.(1993年)。幸存的树木靠分裂的好处。美国统计协会杂志,88,457-467·Zbl 0773.62071号 ·doi:10.1080/01621459.1993.10476296
[29] Mantel,N.(1966年)。生存数据评估和两个新的秩序统计出现在它的审议中。癌症化疗报告,50(3),163-170。
[30] Mertens,J.R.、Kline-Simon,A.H.、Delucchi,K.L.、Moore,C.和Weisner,C.M.(2012)。私人酒精和药物门诊治疗缓解的十年稳定性:非问题使用者与戒除者。药物和酒精依赖,125(1),67-74。
[31] McArdle,J.J.(2011)。在行为科学中使用CART进行探索性数据挖掘。H.Cooper、P.Camic、D.Long、A.T.Panter、D.Rindskopf和K.Sher(编辑),《美国心理学协会心理学研究方法手册》。华盛顿特区:美国心理协会·Zbl 0858.68080号
[32] Molinaro,A.M.、Dudoit,S.和van der Laan,M.J.(2004)。基于树的多元回归和右偏数据密度估计。多元分析杂志,90,154-177·Zbl 1048.62046号
[33] Morgan,J.N.和Sonquist,J.A.(1963年)。调查数据分析中的问题,并提出建议。美国统计协会杂志,58,415-434·Zbl 0114.10103中
[34] Morita,J.G.、Lee,T.W.和Mowday,R.T.(1993年)。生存分析的回归模拟:离职研究的选择性应用。《管理学会杂志》,36(6),1430-1464。
[35] Peters,A.、Hothorn,T.、Ripley,B.D.、Therneau,T.和Atkinson,B.(2009年)。“ipred”包:改进的预测器。(R包版本0.9-3)[计算机软件]。检索自http://cran.r-project.org/web/packages/ipred/index.html。2014年7月1日查阅。
[36] Peto,R.和Peto,J.(1972年)。渐近有效的秩不变测试程序。英国皇家统计学会期刊A辑,135(2),185-207·doi:10.2307/2344317
[37] Schemper,M.和Stare,J.(1996年)。解释了生存分析中的变异。1999年至2012年15月《医学统计》·doi:10.1002/(SICI)1097-0258(19961015)15:19<1999::AID-SIM353>3.0.CO;二维
[38] Segal,M.R.(1988年)。审查数据的回归树。生物计量学,44,35-47·Zbl 0707.62224号
[39] Schapire,R.E.(1999)。助推简介。《第十六届国际人工智能联合会议记录》(IJCAI 99)(第1401-1405页)·Zbl 0858.68080号
[40] Singer,J.D.和Willett,J.B.(1991年)。模拟我们的生活:在设计和分析事件持续时间和时间的纵向研究时,使用生存分析。《心理公报》,110(2),268。
[41] Singer,J.D.和Willett,J.B.(2003年)。应用纵向数据分析。纽约州纽约市:牛津。
[42] Stone,M.(1974年)。统计预测的选择和评估。英国皇家统计学会期刊B辑,36111-133·Zbl 0308.62063号
[43] Strobl,C.、Malley,J.和Tutz,G.(2009年)。递归分区简介:分类和回归树、套袋和随机森林的合理化、应用和特征。心理学方法,14(4),323-348·doi:10.1037/a0016973
[44] Therneau,T.M.和Atkinson,B.(2010年)。包“rpart”:递归分区(R包版本3.1-48)[计算机软件]。检索自http://cran.r-project.org/web/packages/rpart/index.html。2010年10月15日访问·Zbl 0308.62063号
[45] Therneau,T.M.、Grambsch,P.M.和Fleming,T.R.(1990)。生存模型的基于鞅的残差。《生物特征》,77(1),147-160·Zbl 0692.62082号
[46] Zhang,H.P.和Singer,B.(1999)。健康科学中的递归划分。纽约州纽约:施普林格·Zbl 0920.62135号
[47] Zhou,Y.、Kadlec,K.M.和McArdle,J.J.(2014)。夏威夷认知家庭研究中人口统计学和特定认知能力对死亡率的预测。J.J.McArdle和G.Ritschard(编辑),《探索性数据挖掘的当代问题》(第429-449页)。纽约州纽约市:劳特利奇。
[48] Zosuls,K.M.、Ruble,D.N.、Tamis LeMonda,C.S.、Shrut,P.E.、Bornstein,M.H.和Greulich,F.K.(2009年)。婴儿期性别标签的获得:性别类型游戏的含义。发展心理学,45(3),688。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。