×

使用具有多重估算数据的大样本对模型性能进行评估的预测的估计和使用。 (英语) Zbl 1329.62037号

摘要:多重插补可以作为构建医学和流行病学研究中缺失协变量值的预测模型的工具。此类模型可用于对模型性能评估进行预测,但多重插补结构使任务更加复杂。我们总结了由协变量构建的各种预测,包括多重插补协变量,以及特定插补预测模型系数集或合并预测模型系数。我们进一步描述了使用预测评估模型性能的方法。我们区分理想模型性能和实用模型性能,前者指模型在理想临床环境中的性能,其中所有个体都已完全观察到预测因子,而后者指模型在现实临床环境中,一些个体缺少预测因子的性能。通过基于UK700试验的广泛模拟研究对这些方法进行了比较。我们确定理想模型性能的度量可以在插补数据集中进行估计,然后汇总以给出模型性能的总体度量。需要其他方法来评估语用模型的性能,我们建议要么从第二组不使用观测结果的协变量插补构建预测,要么从为协变量的每个潜在观测模式构建的一组部分预测模型构建预测。实用模型性能通常低于理想模型性能。我们关注派生数据中的模型性能,但描述了如何将所有方法扩展到验证数据集。

MSC公司:

62-07 数据分析(统计)(MSC2010)

软件:

Stata公司
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Ambler,《在具有二元结果的风险模型中处理缺失预测值的插补技术的比较》,《医学研究中的统计方法》,第16页,第277页–(2007年)·Zbl 1122.62334号 ·doi:10.1177/0962280206074466
[2] 烧伤,重症精神病的强化与标准病例管理:一项随机试验,《柳叶刀》353页2185–(1999)·doi:10.1016/S0140-6736(98)12191-8
[3] Buuren,生存分析中缺失血压协变量的多重插补,《医学统计学》18,第681页–(1999)·doi:10.1002/(SICI)1097-0258(19990330)18:6<681::AID-SIM71>3.0.CO;2-右
[4] Carpenter,多重插补及其应用(2013)·Zbl 1352.62008年 ·doi:10.1002/9781119942283
[5] Clark,《在缺少数据的情况下建立预后模型:卵巢癌病例研究》,《临床流行病学杂志》第56卷第28页–(2003年)·doi:10.1016/S0895-4356(02)00539-5
[6] Collins,QRISK心血管风险预测的独立外部验证和评估:一项前瞻性开放队列研究,BMJ(临床研究编辑)339 pp b2584–(2009)·doi:10.136/bmj.b2584文件
[7] Collins,QRISK2心血管疾病风险评分的独立外部验证:一项前瞻性开放队列研究,BMJ(临床研究编辑)340 pp c2442–(2010)·doi:10.1136/bmj.c2442
[8] Collins,《识别未检出结直肠癌患者:QCancer(结肠)的独立验证》,《英国癌症杂志》107第260页–(2012)·doi:10.1038/bjc.2012.266
[9] Cox,二元回归模型的两个进一步应用,Biometrika 45第562页–(1958)·Zbl 0085.13715号 ·doi:10.1093/biomet/45.3-4.562
[10] Hippisley-Cox,QRISK的推导和验证,英国新的心血管疾病风险评分:前瞻性开放队列研究,BMJ(临床研究编辑)335第136页–(2007)·doi:10.1136/bmj.39261.471806.55
[11] 霍斯默,应用逻辑回归(1989)·Zbl 0967.62045号
[12] Laar,晚期上皮性卵巢癌患者总体生存率三种预后模型的外部验证,《英国癌症杂志》110第42页–(2014)·doi:10.1038/bjc.2013.717
[13] 《商业与经济统计杂志》(Journal of Business&Economic Statistics),第6页,287–(1988)
[14] 少,缺失数据的统计分析(1987年)
[15] Marshall,《多重插补后对预测模型研究的兴趣评估:当前实践和指南》,BMC医学研究方法9,第57页–(2009年)·doi:10.1186/1471-2288-9-57
[16] Moons,《临床流行病学杂志》(Journal of Clinical Epidemiology)第59卷第1092页–(2006年),首选使用结果来插补缺失的预测值·doi:10.1016/j.jclinepi.2006.01.009
[17] 月亮,风险预测模型:II。外部验证、模型更新和影响评估,Heart 98第691页–(2012a)·doi:10.1136/hartjnl-2011-301247
[18] Moons,风险预测模型:I.开发、内部验证和评估新(生物)标记物的增量价值,Heart 98 pp 683–(2012b)·doi:10.1136/hartjnl-2011-301246
[19] O'Mahony,肥厚型心肌病心源性猝死的新型临床风险预测模型(HCM risk-SCD),《欧洲心脏杂志》,第35页,2010-(2014)·doi:10.1093/eurheartj/eht439
[20] Rubin,调查中无应答的多重插补(1987)·2007年6月10日 ·数字对象标识代码:10.1002/9780470316696
[21] Schafer,不完全多元数据分析(1997)·Zbl 0997.62510号 ·doi:10.1201/9781439821862
[22] Smith,小数据集乐观预测修正,《美国流行病学杂志》,第180页,第318页–(2014年)·doi:10.1093/aje/kwu140
[23] StataCorp,STATA统计软件:第12.0版(2011年)
[24] Sterne,流行病学和临床研究中缺失数据的多重插补:潜力和陷阱,BMJ(临床研究编辑)338页b2393–(2009)·doi:10.1136/bmj.b2393
[25] Steyerberg,《预测创伤性脑损伤后的预后:基于入院特征的预后评分的发展和国际验证》,PLoS Medicine 5第1251页–(2008)·doi:10.1371/journal.pmed.0050165
[26] Vergouw,《在多个输入数据集中寻找稳定的预后模型》,BMC医学研究方法10,第81页–(2010年)·doi:10.1186/1471-2288-10-81
[27] Vergouwe,《缺少预测数据的预测模型的开发和验证:一种实用方法》,《临床流行病学杂志》第63卷第205页–(2010年)·doi:10.1016/j.临床.2009.03.017
[28] 怀特,《使用连锁方程的多重插补:实践问题和指南》,《医学统计》30,第377页–(2011年)·doi:10.1002/sim.4067
[29] Wood,如何使用多重插补数据进行变量选择?,医学统计27 pp 3227–(2008)·doi:10.1002/sim.3177
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。