×

基于残差的预测曲线:评估预测模型性能的可视化工具。 (英语) Zbl 1419.62318号

摘要:生物统计学家一致认为,二元结果的预测模型应满足两个基本标准:第一,预测模型应具有高度的区分能力,这意味着它能够清楚地将病例与对照区分开来。第二,模型应该经过很好的校准,这意味着预测的风险应该与数据中观察到的相对频率密切一致。这项工作的重点是预测曲线,该曲线由Y.Huang(黄)等【生物统计学63,No.4,1181–1188(2007;Zbl 1136.62078号)]作为评估上述标准的图形工具。通过对其特性进行详细分析,我们回顾了预测曲线在生物医学预测模型性能评估中的作用。特别是,我们证明,标记物比较不应仅基于预测性曲线,因为通过比较从竞争模型获得的预测性曲线不可能一致地可视化新标记物的附加预测值。基于我们的分析,我们提出了“基于残差的预测性曲线”(RBP曲线),它解决了上述问题,并将原始方法扩展到了对独立测试数据的预测模型进行评估特别感兴趣的设置。与预测曲线类似,RBP曲线反映了预测模型的校准和判别能力。此外,可以方便地使用曲线进行有效的性能检查和标记比较。

MSC公司:

62页第10页 统计学在生物学和医学中的应用;元分析
62H30型 分类和区分;聚类分析(统计方面)
PDF格式BibTeX公司 XML格式引用
全文: 内政部 链接

参考文献:

[1] Bura,E.和Gastwirth,J.L.(2001年)。二元回归分位数图:直观评估二元回归中预测因子的重要性。《生物医学杂志》43,5-21·Zbl 0997.62053号
[2] 库克,N.R.(2010)。评论:总结和比较标记物预测能力的措施。《国际生物统计杂志》6,第22条。
[3] Crowson,C.S.、Atkinson,E.J.和Therneau,T.M.(2014)。评估预后风险评分的校准。医学研究中的统计方法DOI:10.1177/0962280213497434。
[4] De Bin,R.、Sauerbrei,W.和Boulesteix,A.-L。(2014). 研究基于临床和组学数据的生存模型的预测能力。医学统计33,5310-5329。
[5] Friedman,J.(2001年)。贪婪函数近似:梯度增强机。《统计年鉴》291189-1232·Zbl 1043.62034号
[6] Gu,W.和Pepe,M.S.(2009年)。总结和比较标记预测能力的措施。国际生物统计杂志5,1-49。
[7] Hatzis,C.、Pusztai,L.、Valero,V.、Booser,D.J.、Esserman,L.和Lluch,A.等人(2011年)。侵袭性乳腺癌紫杉烷蒽环类化疗反应和生存率的基因组预测因子。美国医学协会杂志3051873-1881。
[8] Huang,Y.、Pepe,M.S.和Feng,Z.(2007)。评估连续标记的预测性。生物统计学63,1181-1188·Zbl 1136.62078号
[9] Janes,H.和Pepe,M.(2013)。主题:Framingham心血管风险预测的临床实用性超出其统计性能:德黑兰血脂和血糖研究。美国流行病学杂志177,864-865。
[10] Johnson,E.S.、Weinstein,J.R.、Thorp,M.L.、Platt,R.W.、Petrik,A.F.、Yang,X.等人(2010年)。预测以赖诺普利开始的慢性肾脏疾病患者的高钾血症风险。药物流行病学和药物安全19,266-272。
[11] Kramer,A.A.和Zimmerman,J.E.(2007年)。评估危重病护理中死亡率基准的校准:Hosmer‐Lemeshow检验再次进行。危重病护理医学35,2052-2056。
[12] Mayr,A.、Binder,H.、Gefeller,O.和Schmid,M.(2014)。boosting算法的发展。医学信息方法53,419-27。
[13] Moons,K.G.M.、Royston,P.、Vergouwe,Y.、Grobee,D.E.和Altman,D.G.(2009)。预后和预后研究:什么,为什么,以及如何?英国医学杂志3381317-1320。
[14] Pepe,M.S.(2010年)。再次阅读N.Cook的“措施评论”,总结并比较标记物的预测能力。《国际生物统计学杂志》6,16-18。
[15] Pepe,M.S.、Feng,Z.和Gu,J.W.(2008)。M.J.Pencina等人,《医学统计学》27,173-181,对评估新标记物的附加预测能力的评论。
[16] Pepe,M.S.、Feng,Z.、Huang,Y.、Longton,G.、Prentice,R.、Thompson,I.M.等人(2008年)。将标记的预测性与其作为分类器的性能相结合。美国流行病学杂志167,362-368。
[17] Pepe,M.S.、Kerr,K.F.、Longton,G.和Wang,Z.(2013年)。预测模型性能改进测试。医学统计32,1467-1482。
[18] Soto,K.、Papoila,A.L.、Coelho,S.、Bennett,M.、Ma,Q.、Rodrigues,B.等人(2013)。血浆NGAL用于急诊住院患者AKI的诊断。美国肾脏学会临床杂志82053-2063。
[19] Uno,H.、Cai,T.、Tian,L.和Wei,L.J.(2011)。使用经过审查的事件时间数据评估新预测值的总体和特定对象增量值的图形程序。生物统计学671389-1396·Zbl 1274.62888号
[20] Vickers,A.J.和Elkin,E.B.(2006年)。决策曲线分析:一种评估预测模型的新方法。医疗决策26,565-574。
[21] Zou,K.、Hall,W.和Shapiro,D.(1997)。用于连续诊断测试的平滑非参数接收器工作特性(ROC)曲线。医学统计16,2143-2156。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。