×

离散时间存活树。 (英语) 兹比尔1170.62074

摘要:基于树的方法常用于生存时间受删失的研究。它们的结构和易解释性使其有助于识别预后因素,并预测给定个体协变量的条件生存概率。现有方法是为处理连续测量的生存时间变量而定制的。然而,在实践中经常会遇到离散规模的生存变量。
作者提出了一种新的树构造方法,特别适用于这种离散时间生存变量。对于以右为中心的数据,分裂过程可视为分类结果熵标准的扩展。最终树的选择是通过结合自举校正的剪枝算法进行的。作者还提出了一种通过套袋潜在地提高单株树预测性能的简单方法。模拟研究表明,与参数模型相比,单株树和袋装树表现良好。给出了一个真实的数据例子,研究了人格维度在预测吸烟早期发作中的有用性。

MSC公司:

62N99型 生存分析和审查数据
62N01号 审查数据模型
65C60个 统计中的计算问题(MSC2010)

关键词:

装袋;最大似然
PDF格式BibTeX公司 XML格式引用
全文: DOI程序

参考文献:

[1] Breiman,Bagging predictors,机器学习24 pp 123–(1996)·Zbl 0858.68080号
[2] Breiman,《随机森林》,机器学习45页,第5页–(2001年)·兹比尔1007.68152
[3] Breiman,分类和回归树(1984)
[4] Ciampi,逐步回归分层、对应分析和递归分区:三种生存数据分析方法与协变量的比较,计算统计与数据分析4,第185页–(1986)·兹比尔0649.62106
[5] Cloninger,酒精中毒的神经遗传适应机制,《科学》x236第410页–(1987)
[6] 考克斯,回归模型和生命表,《皇家统计学会杂志》B 34 pp 187–(1972)·Zbl 0243.62041号
[7] Davis,指数生存树,《医学统计学》8 pp 947–(1989)
[8] Doornik,使用Ox的面向对象矩阵编程(2002)
[9] Fan,按分裂优度计算相关存活数据的树,及其在牙齿预后中的应用,美国统计协会期刊101第959页–(2006)·Zbl 1120.62328号
[10] 高,用多变量生存数据识别预后因素,计算统计与数据分析45 pp 813–(2004)·Zbl 1429.62525号
[11] Gordon,树状生存分析,《癌症治疗报告》第69页第1065页–(1985年)
[12] Hamza,《基于分类树的集成方法的实证比较》,《统计计算与模拟杂志》75页629–(2005)·Zbl 1075.62051号
[13] Hastie,《统计学习的要素:数据挖掘、推断和预测》(2001年)·Zbl 0973.62007号
[14] Hothorn,打包生存树,《医学统计》23,第77页–(2004)
[15] Hothorn,生存系群,生物统计学7 pp 355–(2006)·Zbl 1170.62385号
[16] 金,基于生存时间方差的替代树结构生存分析,《医学决策》24页670–(2004)
[17] Keles,基于残差的树结构生存分析,《医学统计学》21,第313页–(2002)
[18] Ishwaran,《随机生存森林》,《应用统计年鉴》2,第841页–(2008年)·Zbl 1149.62331号
[19] LeBlanc,截尾生存数据的相对风险树,《生物统计学》48页411–(1992)
[20] 勒布朗(LeBlanc),《分裂优度生存树》(Survival trees by goody of split),《美国统计协会杂志》(Journal of the American Statistical Association)88 pp 457–(1993)·Zbl 0773.62071号
[21] Másse,《幼儿园男孩的行为和青春期药物使用的开始》,《普通精神病学档案》54,第62页–(1997)·doi:10.1001/archpsyc.1997.01830130068014
[22] Molinaro,基于树的多元回归和右偏数据密度估计,《多元分析杂志》90页154–(2004)·Zbl 1048.62046号
[23] Morgan,《调查数据分析中的问题与建议》,《美国统计协会杂志》58页415–(1963)·Zbl 0114.10103中
[24] Radespiel-Tröger,生存数据预测分层的基于树的方法比较,《医学人工智能》28,第323页–(2003)
[25] Radespiel-Tröger,生存树中分裂选择不稳定性和预测误差之间的关联,《医学信息方法》45 pp 548–(2006)
[26] R开发团队(2007)。R: 统计计算语言和环境。R统计计算基础:http://www.R-project.org。
[27] Segal,审查数据的回归树,《生物统计学》44,第35页–(1988)·Zbl 0707.62224号
[28] Segal,纵向数据的树结构方法,《美国统计协会杂志》87页407–(1992)
[29] Singer,《关于时间:使用离散时间生存分析研究事件的持续时间和时间》,《教育统计杂志》第18卷第155页–(1993年)
[30] Singer,应用纵向数据分析:建模变化和事件发生(2003)·doi:10.1093/acprof:oso/9780195152968.001.0001
[31] Su,《多元生存树:基于脆弱模型的最大似然方法》,《生物统计学》第60页第93页–(2004)·Zbl 1130.62386号
[32] Su,Tree-argended Cox比例风险模型,生物统计学6 pp 486–(2005)·Zbl 1071.62111号
[33] Su,最大似然回归树,《计算与图形统计杂志》13页586–(2004)
[34] Therneau,生存模型基于鞅的残差,Biometrika 77 pp 147–(1990)·Zbl 0692.62082号
[35] 张,多个二进制响应的分类树,《美国统计协会杂志》93 pp 180–(1998)·Zbl 0906.62130号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。