×

缺乏交叉验证可能会导致夸大的结果和虚假的结论:对麦克阿瑟暴力风险评估研究的重新分析。 (英语) Zbl 1391.62112号

综述:交叉验证是行为预测建模中的一种重要评估策略;如果没有它,预测模型可能会过于乐观。已经开发出统计方法,允许研究人员使用构建模型所用的相同数据直接交叉验证预测模型。在本研究中,利用麦克阿瑟暴力风险评估研究的数据,使用交叉验证技术构建了几个决策树模型[J.莫纳汉等人,重新思考风险评估。麦克阿瑟对精神障碍和暴力的研究。纽约州纽约市:牛津大学出版社(2001)]。然后将这些模型与原始的(非交叉验证的)暴力风险分类评估工具进行比较。结果表明,与最初用于拟合模型的训练样本相比,应用于测试样本时,预测模型准确性的度量(AUC、误分类误差、敏感性、特异性、阳性和阴性预测值)显著降低。此外,除非假阴性(即错误地预测个人是非暴力的)被认为比假阳性(即错误预测个人是暴力的)代价更高,否则模型通常很少预测暴力。结果表明,在构建模型时使用交叉验证可以为提高心理学研究的可靠性和可复制性做出重要贡献。

MSC公司:

62H30型 分类和区分;聚类分析(统计方面)
68T05型 人工智能中的学习和自适应系统
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 银行;罗宾斯,PC;银色,E;右VESSELINOV;斯蒂德曼,HJ;莫纳汉,J;ROTH,LH,《精神障碍患者暴力风险评估的多模型方法》,《刑事司法与行为》,31324-340,(2004)·doi:10.1177/0093854804263635
[2] BERK,R,《刑事司法环境中预测的非对称损失函数》,《定量犯罪学杂志》,27,107-123,(2011)·doi:10.1007/s10940-010-9098-2
[3] BERK,R.(2012),刑事司法风险预测:机器学习方法纽约州纽约市:施普林格。 ·doi:10.1007/978-14614-3085-8
[4] BREIMAN,L,Bagging predictors,机器学习,26123-140,(1996)·Zbl 0858.68080号
[5] 布莱曼,L,《随机森林,机器学习》,45,5-32,(2001)·Zbl 1007.68152号 ·doi:10.1023/A:1010933404324
[6] BREIMAN,L.、FRIEDMAN,J.H.、OLSHEN,R.A.和STONE,C.J.(1984),分类和回归树加利福尼亚州贝尔蒙特:沃兹沃斯和布鲁克斯·Zbl 0541.62042号
[7] BREIMAN,L.和SPECTOR,P.(1992),“回归中的子模型选择和评估。\(X\)-随机情况”,国际统计评论, 291-319.
[8] 多伊尔,M;SHAW,J;卡特,S;DOLAN,M,《调查英国样本中暴力风险分类的有效性》,《国际法医心理健康杂志》,9,316-323,(2010)·doi:10.1080/14999013.2010.527428
[9] FERNáNDEZ-DELGADO,M;CERNADAS,E;巴罗,S;AMORIM,D,我们需要数百个分类器来解决现实世界的分类问题吗?,《机器学习研究杂志》,153133-3181,(2014)·Zbl 1319.62005号
[10] 加德纳,W;LIDZ,顺时针;爱荷华州莫尔维;SHAW,EC,《识别精神疾病反复暴力患者的精算方法比较》,《法律与人类行为》,20,35-48,(1996)·doi:10.1007/BF01499131
[11] 基尼·C·(1912),变异性和变异性:对分布和报告统计研究的贡献意大利博洛尼亚:C.Cuppini。
[12] HARE,RD,犯罪人群中精神病评估的研究量表,人格和个体差异,111-119,(1980)·doi:10.1016/0191-8869(80)90028-8
[13] 哈里斯,GT;RICE、ME、Bayes和基本利率:什么是暴力风险精算评估的信息性先验?,行为科学与法律,31,103-124,(2013)·doi:10.1002/bsl.2048
[14] HASTIE,T.、TIBSHIRANI,R.和FRIEDMAN,J.(2009),统计学习的要素:数据挖掘、推理和预测(第二版),纽约州纽约市:施普林格·Zbl 1273.62005年 ·doi:10.1007/978-0-387-84858-7
[15] JAMES,G.、WITTEN,D.、HASTIE,T.和TIBSHIRANI,R.(2013),统计学习导论纽约州纽约市:施普林格·Zbl 1281.62147号 ·doi:10.1007/978-1-4614-7138-7
[16] KUHN,M.和JOHNSON,K.(2013),应用预测建模纽约州纽约市:施普林格·Zbl 1306.62014年 ·文件编号:10.1007/978-1-4614-6849-3
[17] MCCUSKER,PJ,《关于暴力风险分类(COVR)评估工具临床应用的问题》,《国际罪犯治疗与比较犯罪学杂志》,51,676-685,(2007)·doi:10.1177/0306624X07299227
[18] 比利时麦克德莫特;杜兰,IV;SCOTT,CL,法医精神病医院暴力风险分类(COVR)的预测能力,精神病服务,62430-433,(2011)·doi:10.1176/ps.62.4.pss6204_0430
[19] MEEHL、PE;罗森,A,《心理测量符号、模式或分数切割的先验概率和效率》,《心理公报》,52,194-215,(1955)·doi:10.1037/h0048070
[20] 莫纳汉,J;STEADMAN,HJ;APPELBAUM,PS公司;格里索,T;爱荷华州莫尔维;旋转,左侧;SILVER,E,《暴力风险的分类》,《行为科学与法律》,24721-730,(2006)·doi:10.1002/bsl.725
[21] 莫纳汉,J;斯蒂德曼,HJ;罗宾斯,PC;APPELBAUM,PS公司;银行;格里索,T;SILVER,E,精神障碍患者暴力风险评估的精算模型,精神病学服务,56,810-815,(2005)·doi:10.1176/appi.ps.56.7.810
[22] 莫纳汉,J;斯蒂德曼,HJ;罗宾斯,PC;银色,E;APPELBAUM,PS公司;格里索,T;ROTH,LH,《为评估暴力风险开发一种临床有用的精算工具》,《英国精神病学杂志》,176,312-319,(2000)·doi:10.1192/bjp.176.4312
[23] MONAHAN,J.、STEADMAN,H.J.、SILVER,E.、APPELBAUM,P.S.、ROBBINS,P.C.、MULVEY,E.P.和BANKS,S.(2001),重新思考风险评估:麦克阿瑟精神障碍和暴力研究,纽约州纽约市:牛津大学出版社。
[24] MOSSMAN,D,《纯粹风险评估批判》或《康德会议》塔拉索夫辛辛那提大学法律评论,75,523-609,(2006)
[25] MOSSMAN,D,《使用接收者操作特征分析评估风险评估:基本原理、优势、见解和局限性》,《行为科学与法律》,31,23-39,(2013)·doi:10.1002/bsl.2050
[26] 帕什勒,H;WAGENMAKERS,EJ,编辑对心理科学可复制性专题的介绍:信任危机?,心理科学展望,7528-530,(2012)·doi:10.1177/1745691612465253
[27] 波拉克,I;NORMAN,DA,识别实验的非参数分析,《心理科学》,1125-126,(1964)·doi:10.3758/BF03342823
[28] R核心团队(2014),R: 统计计算语言和环境(3.1.1版),奥地利维也纳,http://www.R-project.org/。
[29] 罗伯茨;PASHLER,H,一个好的搭配有多有说服力?关于理论测试的评论,《心理学评论》。,107, 358-367, (2000) ·doi:10.1037/0033-295X.107.2.358
[30] 斯诺登,RJ;灰色,NS;泰勒,J;FITZGERALD,S,《使用暴力风险分类(COVR)评估法医精神病住院患者未来暴力风险》,精神病服务,60,1522-1526,(2009)·doi:10.1176/ps.2009.60.11.1522
[31] SPSS公司(1993),用于Windows的SPSS(6.0版),伊利诺伊州芝加哥:SPSS公司。
[32] 斯蒂德曼,HJ;银色,E;莫纳汉,J;APPELBAUM,PS公司;罗宾斯,PC;爱荷华州莫尔维;BANKS,S,精算暴力风险评估工具开发的分类树方法,《法律与人类行为》,24,83-100,(2000)·doi:10.1023/A:1005478820425
[33] 斯特鲁普,J;克里斯蒂安森,M;LINDQVIST,P,《瑞典普通精神病患者的暴力行为:暴力风险分类(COVR)软件的验证》,精神病学研究,188161-165,(2011)·doi:10.1016/j.psychres.2010.12.021
[34] VRIEZE,SI;GROVE,WM,预测性犯罪累犯。一、量表编制中项目超选和准确度高估的纠正。二、。抽样误差导致的预测有效性相对于基本率信息的衰减,《法律与人类行为》,32,266-278,(2008)·数字对象标识代码:10.1007/s10979-007-9092-x
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。