×

使用生存树集合由中间事件触发的动态风险预测。 (英语) Zbl 07692387号

摘要:随着电子健康记录和登记数据库中大量数据的可用性,结合时变患者信息以改进风险预测已引起极大关注。为了利用不断增长的预测信息,我们使用生存树集合开发了一个统一的里程碑预测框架,当新信息可用时,可以在该框架中执行更新的预测。与具有固定里程碑时间的传统里程碑预测相比,我们的方法允许里程碑时间具有主题特异性,并由中间临床事件触发。此外,非参数方法避免了模型在不同里程碑时间不兼容的棘手问题。在我们的框架中,纵向预测因子和事件时间结果都要经过正确的审查,因此现有的基于树的方法无法直接应用。为了应对分析挑战,我们提出了一种基于风险集的集合程序,通过对单个树的鞅估计方程进行平均。我们进行了大量的模拟研究来评估我们的方法的性能。将这些方法应用于囊性纤维化基金会患者登记(CFFPR)数据,对囊性纤维化患者的肺部疾病进行动态预测,并确定重要的预后因素。

MSC公司:

62件 统计学的应用
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Breiman,L.(1996)。装袋预测器。机器。学习。24 123-140. ·Zbl 0858.68080号
[2] Breiman,L.(2001)。随机森林。机器。学习。45 5-32. ·Zbl 1007.68152号
[3] CIAMPI,A.、THIFFAULT,J.、NAKACHE,J.-P.和ASSELAIN,B.(1986年)。通过逐步回归、对应分析和递归划分进行分层:对具有协变量的生存数据的三种分析方法的比较。计算。统计师。数据分析。4 185-204. ·兹比尔0649.62106
[4] DAVIS,R.B.和ANDERSON,J.R.(1989)。指数生存树。统计医学。8 947-961.
[5] DOMANSKI,M.J.,TIAN,X.,WU,C.O.,REIS,J.P.,DEY,A.K.,GU,Y.,ZHAO,L.,BAE,S.,LIU,K.等人(2020年)。低密度脂蛋白胆固醇暴露的时间进程和心血管疾病事件风险。美国大学J.Am.Coll。心脏病。76 1507-1516.
[6] DRING,G.,HOIBY,N.,GROUP,C.S.等人(2004年)。囊性纤维化患者肺部疾病的早期干预和预防:欧洲共识。J.囊肿。纤维。3 67-91。
[7] FERER,L.、PUTTER,H.和PROUST-LIMA,C.(2019)。使用地标和联合建模进行单个动态预测:估值器的验证和稳健性评估。统计方法医学研究。28 3649-3666. ·doi:10.1177/0962280218811837
[8] Friedman,J.、Hastie,T.和Tibshirani,R.(2001)。统计学习的要素纽约州施普林格·Zbl 0973.62007号
[9] GORDON,L.和OLSHEN,R.A.(1985年)。树结构生存分析。癌症治疗。代表。69 1065-1069.
[10] HARUN,S.N.、WAINWRIGHT,C.、KLEIN,K.和HENNIG,S.(2016)。对囊性纤维化患者肺功能下降率研究的系统综述。儿科学。回复。版次。20 55-66. ·doi:10.1016/j.prrv.2016.03.002
[11] HEAGERTY,P.J.、LUMLEY,T.和PEPE,M.S.(2000年)。截尾生存数据和诊断标记的时间依赖性ROC曲线。生物计量学56 337-344. ·Zbl 1060.62622号
[12] HELTSHE,S.L.、KHAN,U.、BECKET,V.、BAINES,A.、EMERSON,J.、SANDERS,D.B.、GIBSON,R.L.,MORGAN,W.和ROSENFELD,M.(2018)。囊性纤维化幼儿初始、慢性和粘液性铜绿假单胞菌感染的纵向发展。J.囊肿。纤维。17 341-347. ·doi:10.1016/j.jcf.2017.10.008
[13] HOTHORN,T.、LAUSEN,B.、BENNER,A.和RADESPIEL-TRGER,M.(2004)。将存活树木装袋。统计医学。23 77-91. ·数字对象标识代码:10.1002/sim.1593
[14] Hothorn,T.、Bühlmann,P.、Dudoit,S.、Molinaro,A.和van der Laan,M.J.(2006)。生存合奏。生物统计学7 355-373. ·Zbl 1170.62385号
[15] ISHWARAN,H.、KOGALUR,U.B.、BLACKSTONE,E.H.和LAUER,M.S.(2008年)。随机生存森林。附录申请。斯达。2 841-860. ·Zbl 1149.62331号 ·doi:10.1214/08-AOAS169
[16] JEWELL,N.P.和NIELSEN,J.P.(1993年)。基于标记的一致预测规则框架。生物计量学80 153-164. ·Zbl 0772.62052号 ·doi:10.1093/biomet/80.1.153
[17] KAMATA,H.、ASAKURA,T.、铃木,S.、NAMKOONG,H.,YAGI,K.、FUNATSU,Y.、OKAMORI,S.,UNO,S.和UWAMINO,Y.等人(2017年)。慢性铜绿假单胞菌感染对禽分枝杆菌复合型肺病患者健康相关生活质量的影响。BMC Polm公司。医学。17 198. ·doi:10.1186/s12890-017-0544-x
[18] KNAPP,E.A.、FINK,A.K.、GOSS,C.H.、SEWALL,A.、OSTRENGA,J.、DOWD,C.、ELBERT,A.、PETREN,K.M.和MARSHALL,B.C.(2016)。囊性纤维化基金会患者登记处。国家观察疾病登记册的设计和方法。安·艾默尔。托拉克。Soc公司。13 1173-1179.
[19] LEBLANC,M.和CROWLEY,J.(1992年)。截尾生存数据的相对风险树。生物计量学48 411-425.
[20] LEBLANC,M.和CROWLEY,J.(1993)。幸存的树木靠分裂的好处。J.Amer。统计师。协会。88 457-467. ·Zbl 0773.62071号
[21] LIN,Y.和JEON,Y.(2006)。随机森林和自适应最近邻。J.Amer。统计师。协会。101 578-590. ·兹比尔1119.62304 ·doi:10.1198/0162145000001230
[22] MANNINO,D.M.、REICHERT,M.M.和DAVIS,K.J.(2006)。成年人群肺功能下降和预后。美国J.Respir。批评。护理医学。173 985-990.
[23] MAZIARZ,M.、HEAGERTY,P.、CAI,T.和ZHENG,Y.(2017)。关于时间-事件结果的纵向预测:建模选项的比较。生物计量学73 83-93. ·Zbl 1366.62233号 ·doi:10.1111/biom.12562
[24] MCGARRY,M.E.、NEUHAUS,J.M.、NIELSON,D.W.和LY,N.P.(2019年)。纵向肺功能的区域差异:美国西班牙裔和非西班牙裔囊性纤维化患者的比较。儿科。Pulmonol公司。54 1382-1390. ·doi:10.1002/ppul.24377
[25] MCGARRY,M.E.、HUANG,C.Y.、NIELSON,D.W.和LY,N.P.(2021年)。美国囊性纤维化西班牙青年铜绿假单胞菌的早期获得和转化。J.囊肿。纤维。20 424-431. ·doi:10.1016/j.jcf.2020.10.002
[26] MCINTOSH,M.W.和PEPE,M.S.(2002年)。结合多项筛选测试:风险评分的最佳性。生物计量学58 657-664. ·Zbl 1210.62189号 ·doi:10.1111/j.0006-341X.2002.00657.x
[27] MOLINARO,A.M.、DUDOIT,S.和VAN DER LAAN,M.J.(2004)。基于树的多元回归和右偏数据密度估计。J.多变量分析。90 154-177. ·Zbl 1048.62046号 ·doi:10.1016/j.jmva.2004.02.003
[28] MORGAN,W.J.、VANDEVANTER,D.R.、PASTA,D.J.、FOERMAN,A.J.、WAGENER,J.S.、KONSTAN,M.W.、MORGAN、W.、KONSTA,M.、LIOU,T.等人(2016年)。1秒用力呼气量变异性有助于确定囊性纤维化患者肺功能损失更大的风险。儿科杂志169 116-121.
[29] PARAST,L.、CHENG,S.-C.和CAI,T.(2012)。结合短期事件时间信息的长期存活率里程碑式预测。J.Amer。统计师。协会。107 1492-1501. ·Zbl 1258.62107号 ·doi:10.1080/016214592012.721281
[30] PROUST-LIMA,C.、DARTIGUES,J.-F.和JACQMIN-GADDA,H.(2016)。重复多元认知测量与痴呆和死亡竞争风险的联合建模:潜在过程和潜在类别方法。统计医学。35 382-398. ·数字对象标识代码:10.1002/sim.6731
[31] RIZOPOULOS,D.(2011年)。纵向和时间-事件数据联合模型中的动态预测和预期精度。生物计量学67 819-829. ·Zbl 1226.62124号 ·文件编号:10.1111/j.1541-0420.2010.01546.x
[32] RIZOPOULOS,D.、MOLENBERGHS,G.和LESAFRE,E.M.E.H.(2017)。使用联合建模和陆地标记的生存分析中具有时间相关协变量的动态预测。生物。J。59 1261-1276之间·Zbl 1379.62083号 ·doi:10.1002/bimj.201600238
[33] SEGAL,M.R.(1988年)。审查数据的回归树。生物计量学44 35-47. ·Zbl 0707.62224号
[34] Steingrimson,J.A.、DIAO,L.和STRAWDERMAN,R.L.(2019年)。审查无偏回归树和集合。J.Amer。统计师。协会。114 370-383. ·Zbl 1478.62289号 ·doi:10.1080/01621459.2017.1407775
[35] Steingrimson,J.A.、DIAO,L.、MOLINARO,A.M.和STRAWDERMAN,R.L.(2016)。双倍健壮的存活树。统计医学。35 3595-3612. ·数字对象标识代码:10.1002/sim.6949
[36] SUN,Y.、CHIOU,S.H.、WU,C.O.、MCGARRY,M.E.和HUANG,C.-Y.(2023)。补充“使用生存树集合由中间事件触发的动态风险预测”https://doi.org/10.1214/22-AOAS1674SUPA网站, https://doi.org/10.1214/22-AOAS1674SUPPB
[37] SWEETING,M.J.、BARRETT,J.K.、THOMPSON,S.G.和WOOD,A.M.(2017年)。重复血压测量用于心血管风险预测:ARIC研究中统计模型的比较。统计医学。36 4514-4528. ·doi:10.1002/sim.7144
[38] TANNER,K.T.、SHARPLES,L.D.、DANIEL,R.M.和KEOGH,R.H.(2021)。结合标记和机器学习集成的动态生存预测:方法和经验比较。J.罗伊。统计师。Soc.序列号。A类184 3-30之间·doi:10.1111/rssa.12611
[39] TAYLOR,J.M.G.、PARK,Y.、ANKERST,D.P.、PROUST-LIMA,C.、WILLIAMS,S.、KESTIN,L.、BAE,K.、PICKLES,T.和SANDLER,H.(2013)。使用联合模型实时预测前列腺癌复发。生物计量学69 206-213. ·Zbl 1272.62093号 ·文件编号:10.1111/j.1541-0420.2012.01823.x
[40] TWALA,B.、JONES,M.C.和HAND,D.J.(2008)。处理决策树中缺失数据的好方法。模式识别。莱特。29 950-956.
[41] VAN HOUWELINGEN,H.C.(2007年)。事件历史分析中的陆地标记动态预测。扫描。J.统计。34 70-85之间·Zbl 1142.62083号 ·网址:10.1111/j.1467-9469.2006.00529.x
[42] VAN HOUWELINGEN,H.C.和PUTTER,H.(2008)。通过标记进行动态预测作为多状态建模的替代方法:应用于急性淋巴细胞白血病数据。寿命数据分析。14 447-463. ·Zbl 1302.62240号 ·doi:10.1007/s10985-008-9099-8
[43] VAN HOUWELINGEN,H.C.和PUTTER,H.(2012)。临床生存分析中的动态预测.统计学和应用概率专著123.佛罗里达州博卡拉顿CRC出版社。
[44] WANG,J.、LUO,S.和LI,L.(2017)。多重重复测量和事件时间数据的动态预测:帕金森病的应用。附录申请。斯达。11 1787-1809. ·Zbl 1380.62260号 ·doi:10.1214/17-AOAS1059
[45] WRIGHT,M.N.和ZIEGLER,A.(2017年)。ranger:在C++和R中为高维数据快速实现随机森林。J.统计软件。77 1-17. ·doi:10.18637/jss.v077.i01
[46] 张华(1995)。生存树中的分裂准则。统计模型。104 305-313.
[47] ZHANG,H.,HOLFORD,T.和BRACKEN,M.B.(1996)。一种用于前瞻性研究的基于树的分析方法。统计医学。15 37-49. ·doi:10.1002/(SICI)1097-0258(19960115)15:1<37::AID-SIM144>3.0.CO;2-0
[48] ZHENG,Y.和HEAGERTY,P.J.(2005)。纵向数据的部分条件生存模型。生物计量学61 379-391. ·Zbl 1077.62090号 ·文件编号:10.1111/j.1541-0420.2005.00323.x
[49] ZHU,R.和KOSOROK,M.R.(2012)。递归插补生存树。J.Amer。统计师。协会。107 331-340. ·兹比尔1261.62009 ·doi:10.1080/016214519.2011.637468
[50] ZHU,Y.、LI,L.和HUANG,X.(2019)。用于动态预测的Landmark线性转换模型,并应用于慢性病的纵向队列研究。J.R.统计社会服务。C.申请。斯达。68 771-791
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。