×

协变量调整ROC曲线:概念及其重要性,推理方法综述,以及一种新的贝叶斯估计。 (英语) 兹伯利07612071

小结:疾病的准确诊断在临床实践和医学研究中至关重要。在医疗诊断测试在实践中常规使用之前,必须严格评估其区分疾病和非疾病状态的能力。接收机工作特性(ROC)曲线是评估连续输出测试诊断准确性的最常用工具。人们已经认识到,一些因素(如年龄和/或性别等受试者特定特征)可以影响疾病状态以外的测试结果和准确性。最近,协变量调整ROC曲线被提出,并成功应用于考虑协变量信息的诊断准确性的全局汇总度量。本文的目的有三个方面。首先,我们激发了在ROC分析中包含协变量信息的重要性,特别是协变量调整ROC曲线是如何在这种情况下成为重要工具的。其次,我们回顾并深入了解了估计协变量调整ROC曲线的现有方法。第三,我们开发了一种高度灵活的贝叶斯方法,该方法基于加性正态模型的Dirichlet过程混合和贝叶斯自举,用于对协变量调整ROC曲线进行推断。通过仿真研究评估了不同方法的性能,并证明了我们提出的贝叶斯模型能够成功恢复经协变量调整的真实ROC曲线,并在各种复杂场景中产生有效推断。这些方法被应用于一项内分泌研究,其目的是评估体重指数的准确性,并根据年龄和性别进行调整,以检测心血管疾病风险因素簇。

MSC公司:

62至XX 统计
PDF格式BibTeX公司 XML格式引用
全文: DOI程序 链接

参考文献:

[1] ALONZO,T.A.和PEPE,M.S.(2002年)。使用二元回归技术进行无分布ROC分析。生物统计学3 421-432. ·Zbl 1135.62390号
[2] ALTMAN,D.G.和ROYSTON,P.(2006)。二分连续变量的成本。BMJ公司332 1080. ·doi:10.1136/bmj.332.7549.1080
[3] BRANSCUM,A.J.、JOHNSON,W.O.、HANSON,T.E.和BARON,A.T.(2015)。ROC和风险分析的灵活回归模型,有或没有黄金标准。统计医学。34 3997-4015. ·doi:10.1002/sim.6610
[4] CAI,T.(2004)。使用放置值进行半参数ROC回归分析。生物统计学5 45-60. ·Zbl 1096.62112号 ·doi:10.1093/biostatistics/5.1.45
[5] Davison,A.C.和Hinkley,D.V.(1997年)。Bootstrap方法及其应用.剑桥统计与概率数学系列1.剑桥大学出版社,剑桥·Zbl 0886.62001号 ·doi:10.1017/CBO9780511802843
[6] DAWSON,N.V.和WEISS,R.(2012)。统计分析中连续变量的二分法:应避免的做法。医学博士。制造商。32 225-226.
[7] DE BOOR,C.(1978)。花键实用指南.应用数学科学27.纽约-柏林施普林格·Zbl 0406.41003号
[8] De Iorio,M.、Johnson,W.O.、Müller,P.和Rosner,G.L.(2009年)。贝叶斯非参数非比例风险生存模型。生物计量学65 762-771. ·Zbl 1172.62073号 ·doi:10.1111/j.1541-0420.2008.0166.x
[9] Dunson,D.B.、Pillai,N.和Park,J.-H.(2007年)。贝叶斯密度回归。J.R.统计社会服务。B.统计方法。69 163-183. ·Zbl 1120.62025号 ·doi:10.1111/j.1467-9868.2007.00582.x
[10] Fan,J.和Gijbels,I.(1996年)。局部多项式建模及其应用.统计学和应用概率专著66.CRC出版社,伦敦·Zbl 0873.62037号
[11] FARAGGI,D.(2003)。调整协变量的接收器工作特性曲线和相关指标。统计员52 179-192. ·数字对象标识代码:10.1111/1467-9884.00350
[12] Ferguson,T.S.(1973)。一些非参数问题的贝叶斯分析。安。统计师。1 209-230. ·Zbl 0255.62037号
[13] Gabri,J.、Simpson,D.、Vehtari,A.、Betancourt,M.和Gelman,A.(2019年)。贝叶斯工作流中的可视化。J.罗伊。统计师。Soc.序列号。A类182 389-402. ·doi:10.1111/rssa.12378
[14] Geisser,S.和Eddy,W.F.(1979年)。模型选择的预测方法。J.Amer。统计师。协会。74 153-160. ·Zbl 0401.62036号
[15] GELMAN,A.、CARLIN,J.B.、STERN,H.S.、DUNSON,D.B.、VEHTARI,A.和RUBIN,D.B.(2013)。贝叶斯数据分析CRC出版社,博卡拉顿。
[16] Gelman,A.、Hwang,J.和Vehtari,A.(2014)。了解贝叶斯模型的预测信息标准。统计计算。24 997-1016. ·Zbl 1332.62090号 ·doi:10.1007/s11222-013-9416-2
[17] GNEITING,T.和VOGEL,P.(2018年)。接收机工作特性(ROC)曲线。
[18] GONZáLEZ-MANTEIGA,W.、PARDO-FERNáNDEZ,J.C.和VAN KEILEGOM,I.(2011)。非参数位置尺度回归模型中的ROC曲线。扫描。J.统计。38 169-184. ·Zbl 1246.62104号 ·doi:10.1111/j.1467-9469.2010.00693.x
[19] Griffin,J.E.和Steel,M.F.J.(2006)。基于订单的依赖性Dirichlet过程。J.Amer。统计师。协会。101 179-194. ·Zbl 1118.62360号 ·doi:10.1198/01621450000000727
[20] GU,J.、GHOSAL,S.和ROY,A.(2008年)。ROC曲线的贝叶斯自举估计。统计医学。27 5407-5420. ·doi:10.1002/sim.3366
[21] 关政、秦杰和张斌(2012)。协变量调整ROC曲线的信息借用方法。加拿大。J.统计。40 569-587. ·Zbl 1333.62275号 ·doi:10.1002/cjs.11145
[22] HANSON,T.E.(2006)。有限Polya树模型的混合推理。J.Amer。统计师。协会。101 1548-1565. ·Zbl 1171.62323号 ·doi:10.1198/016214500000384
[23] HAYFIELD,T.和RACINE,J.S.(2008)。非参数计量经济学:np包。J.统计软件。27
[24] INáCIO DE CARVALHO,V.、DE CARVALOH,M.和BRANSCUM,A.J.(2017)。尤登指数的非参数贝叶斯协变量调整估计。生物计量学73 1279-1288. ·Zbl 1405.62225号 ·doi:10.1111/biom.12686
[25] INáCIO DE CARVALHO,V.、JARA,A.、HANSON,T.E.和DE CARVALHO,M.(2013)。贝叶斯非参数ROC回归模型。贝叶斯分析。8 623-645. ·Zbl 1329.62154号 ·doi:10.1214/13-BA825
[26] INáCIO,V.和罗德里格斯-阿尔瓦雷斯,M.X(2022)。补充“协变量调整ROC曲线:概念及其重要性,推理方法综述,以及新的贝叶斯估计。”https://doi.org/10.1214/21-STS839SUPP网站
[27] INáCIO,V.、罗德里格斯-阿尔瓦雷斯,M.X.和GAYOSO-DIZ,P.(2021)。医学检验的统计评估。每年。修订状态申请。8 41-67. ·doi:10.1146/annurev-statistics-040720-022432
[28] Ishwaran,H.和James,L.F.(2001)。破胶前期吉布斯取样方法。J.Amer。统计师。协会。96 161-173. ·Zbl 1014.62006年 ·doi:10.1198/016214501750332758
[29] JANES,H.和PEPE,M.S.(2008a)。在诊断、筛查或预后标记物的研究中调整协变量:新环境中的旧概念。美国流行病学杂志。168 89-97.
[30] JANES,H.和PEPE,M.S.(2008b)。分类准确性研究中的匹配:对分析、效率和增量价值评估的影响。生物计量学64 1-9. ·Zbl 1138.62074号 ·doi:10.1111/j.1541-0420.2007.00823.x
[31] JANES,H.和PEPE,M.S.(2009年)。使用经协变量调整的接收机工作特性曲线调整协变量对分类精度的影响。生物特征96 371-382. ·Zbl 1163.62046号 ·doi:10.1093/biomet/asp002
[32] KERR,K.F.和PEPE,M.S.(2011年)。联合建模、协变量调整和相互作用:风险预测模型和风险预测绩效中的对比概念。流行病学22 805-812.
[33] KIM,S.和HUANG,Y.(2017)。结合生物标记物进行分类和协变量调整。统计医学。36 2347-2362. ·doi:10.1002/sim.7274
[34] LIN,H.、ZHOU,L.、PENG,H.和ZHOU、X.-H.(2011)。使用ROC方法选择和组合生物标记物用于疾病分类和预测。加拿大。J.统计。39 324-343. ·Zbl 1219.62171号 ·doi:10.1002/cjs.10107
[35] LIU,C.、LIU,A.和HALABI,S.(2011年)。生物标记物的最小组合可提高诊断准确性。统计医学。30 2005-2014. ·doi:10.1002/sim.4238
[36] 刘德和周晓华(2013)。生物标记物组合与协变量调整的ROC分析。阿卡德。无线电。20 874-882.
[37] L奥斯·佩兹·拉特·N,M.、罗德里·盖兹-阿尔瓦雷斯,M.X.、卡达索·苏·阿雷斯,C.和古德·桑佩德罗,F.(2014)。OptimalCutpoints:用于在诊断测试中选择最佳切点的R包。J.统计软件。61 1-36.
[38] MEISNER,A.、PARIKH,C.R.和KERR,K.F.(2020年)。通过直接最大化和惩罚,在多中心研究中开发生物标记物组合。统计医学。39 3412-3426. ·doi:10.1002/sim.8673
[39] 帕尔多·芬·阿恩德斯,J.C.、罗德里格斯-阿尔瓦雷斯,M.X.和瓦恩·凯莱戈姆,I.(2014)。存在协变量的ROC曲线综述。REVSTAT公司12 21-41. ·Zbl 1314.62248号
[40] PEPE,M.S.(1998年)。连续测试结果接收器工作特性曲线回归分析的三种方法。生物计量学54 124-135. ·Zbl 1058.62643号
[41] PEPE,M.S.(2003年)。医学检验分类预测的统计评价.牛津统计科学系列28.牛津大学出版社,牛津·Zbl 1039.62105号
[42] PEPE,M.S.和CAI,T.(2004)。用于评估歧视性措施的位置值分析。生物计量学60 528-535. ·Zbl 1274.62173号 ·doi:10.1111/j.0006-341X.2004.00200.x
[43] PEPE,M.S.、CAI,T.和LONGTON,G.(2006年)。使用接收器工作特性曲线下的面积组合预测器进行分类。生物计量学62 221-229. ·Zbl 1091.62125号 ·文件编号:10.1111/j.1541-0420.2005.00420.x
[44] PEPE,M.、FAN,J.和SEYMOUR,C.(2013)。在将控制因素与协变量案例相匹配的研究中,估计接收器工作特性曲线。阿卡德。无线电。20 863-873.
[45] R核心团队(2021年)。R: 用于统计计算的语言和环境。R统计计算基金会,奥地利维也纳。
[46] 罗德·盖兹(RODRíGUEZ,A.)和马丁内斯(MARTíNEZ,J.C.)(2013)。协变量相关ROC曲线的贝叶斯半参数估计。生物统计学15 353-369.
[47] 罗德·盖兹-阿尔瓦雷斯,M.X.和INáCIO,V.(2021)。ROCnReg:一个R包,用于有或无协变量的接收器操作特性曲线推断。R J。13 525-555. ·doi:10.32614/RJ-2021-066
[48] 罗德·盖兹-阿尔瓦雷斯,M.X.,罗卡·帕迪尼奥斯,J.和卡达索·苏·阿雷斯,C.(2011a)。ROC曲线和协变量:将诱导方法扩展到非参数框架。统计计算。21 483-499. ·Zbl 1221.62147号 ·doi:10.1007/s11222-010-9184-1
[49] 罗德·盖兹-阿尔瓦雷斯,M.X.,罗卡·帕迪尼奥斯,J.和卡达索·苏·阿雷斯,C.(2011b)。一种新的灵活直接ROC回归模型:通过人体测量检测心血管危险因素的应用。计算。统计师。数据分析。55 3257-3270. ·兹比尔1271.62266 ·doi:10.1016/j.csda.2011.06.008
[50] 罗德·盖兹-阿尔瓦雷斯,M.X.,塔霍塞斯,P.G.,卡达索·苏·阿雷斯,C.和拉多,M.J.(2011)。ROC回归技术在乳腺癌计算机辅助诊断系统中应用的比较研究。计算。统计师。数据分析。55 888-902. ·Zbl 1247.62282号 ·doi:10.1016/j.csda.2010.07.018
[51] 罗森伯格,P.S.(1995)。使用B样条估计危险函数。生物计量学51 874-887. ·Zbl 0875.62489号
[52] RUBIN,D.B.(1981年)。贝叶斯引导。安。统计师。9 130-134.
[53] Sethuraman,J.(1994)。狄利克雷先验的构造性定义。统计师。西尼卡4 639-650. ·Zbl 0823.62007号
[54] TAYLOR,J.M.G.和YU,M.(2002)。分类解释变量导致的偏差和效率损失。《多元分析杂志》。83 248-263. ·Zbl 1146.62356号 ·文件编号:10.1006/jmva.2001.2045
[55] 托梅·马丁内斯·德·里图尔托,M.A.,博塔纳,M.A.、卡达索·苏亚雷斯,C.、REGO-IRAETA,A.、FERNáNDEZ-MARIñO,A.、MATO,J.A.、SOLACHE,I.和PEREZ-FERNANDEZ,R.(2009)。加利西亚(西班牙西北部)四种不同定义的代谢综合征患病率及其与胰岛素抵抗的关系。《内分泌杂志》。投资。32 505-511.
[56] WICKHAM,H.(2009年)。Ggplot公司2:用于数据分析的优雅图形纽约州施普林格·Zbl 1170.62004号
[57] WOOD,S.N.(2017)。广义可加模型:R引言.统计科学系列教材CRC出版社,佛罗里达州博卡拉顿·Zbl 1368.62004号
[58] ZHOU,X.-H.,OBUCHOWSKI,N.A.和MCCLISH,D.K.(2011)。诊断医学中的统计方法.概率统计中的威利级数新泽西州霍博肯威利·Zbl 1268.62146号 ·doi:10.1002/9780470906514
[59] ZWEIG,M.H.和CAMPBELL,G.(1993年)。受体操作特征(ROC)图:临床医学中的基本评估工具。临床。化学。39 561-577
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。