×

关于交叉验证样本中Pearson’s(X^2)的渐近分布。 (英语) Zbl 1306.62443号

摘要:在分类数据分析中,双样本交叉验证不仅用于模型选择,还用于获得模型整体预测有效性的真实印象。后者在能够捕捉校准样本的每一个特性的高度参数化模型的情况下尤为重要。我们证明,对于最大似然估计量或其他渐近有效估计量,在双样本交叉验证框架中,由于使用不同的样本进行估计和良好性检验而导致额外的变异性,Pearson’s(X^2)不是渐近齐方的。我们提出了另一种检验统计量,即(X{mathrm{xval}}^2),它是对交叉验证样本中具有C-1自由度的渐近正方形的(X^2)的修正。随机地,(X_{\mathrm{xval}}^2\leqX^2\)。此外,使用(X^2)而不是(X_{mathrm{xval}}^2)和(chi_{C-1}^2”参考分布可能会给交叉验证样本中的模型拟合度留下不恰当的印象。

MSC公司:

第62页,共15页 统计学在心理学中的应用
62H17型 应急表

软件:

MULTILOG公司
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Agresti,A.(2002年)。分类数据分析(第二版)。纽约:Wiley·Zbl 1018.6202号
[2] Bishop、Y.M.M.、Fienberg、S.E.和;Holland,P.W.(1975)。离散多元分析。马萨诸塞州剑桥:麻省理工学院出版社·Zbl 0332.62039号
[3] 博克,R.D.,&;Lieberman,M.(1970年)。为n个二元评分项目拟合响应模型。《心理测量学》,35179-197年·doi:10.1007/BF02291262
[4] Browne,M.W.(2000年)。交叉验证方法。数学心理学杂志,44,108–132·Zbl 0946.62045号 ·doi:10.1006/jmps.1999.1279
[5] Chernyshenko,O.S.、Stark,S.、Chan,K.-Y.、Drasgow,F.和;Williams,B.(2001年)。将项目反应理论模型拟合到两个人格清单:问题和见解。多元行为研究,36,523–562·doi:10.1207/S15327906MBR3604_03
[6] Collins,L.M.、Graham,J.W.、Long,J.D.和;Hansen,W.B.(1994年)。早期物质使用开始的潜在类别模型的交叉验证。多元行为研究,29165-183·doi:10.1207/s15327906mbr2902_3
[7] Drasgow,F.、Levine,M.V.、Tsien,S.、Williams,B.和;米德·A(1995)。将多模项目反应理论模型应用于多项选择测验。应用心理测量,19143-165·doi:10.1177/014662169501900203
[8] 杜托伊特,M.(编辑)(2003年)。SSI的IRT。伊利诺伊州林肯伍德:科学软件国际。
[9] Koehler,K.和;Larntz,K.(1980)。稀疏多项式有效性统计的实证研究。美国统计协会杂志,75,336–344·Zbl 0442.62025号 ·doi:10.1080/01621459.1980.10477473
[10] M.V.莱文(1984)。多元线性公式评分理论简介。测量系列84-4。伊利诺伊州香槟市:基于模型的测量实验室。
[11] Lord、F.M.和;Novick,M.R.(1968年)。心理测试成绩的统计理论。马萨诸塞州雷丁:Addison-Wesley·Zbl 0186.53701号
[12] Maydeu-Olivares,A.(2005年)。Likert型人格数据的参数与非参数IRT建模的进一步实证结果。多元行为研究,40275-293·doi:10.1207/s15327906mbr4002_5
[13] Thissen,D.、Chen,W.-H.和;Bock,R.D.(2003)。Multilog(版本7)[计算机软件]。伊利诺伊州林肯伍德:科学软件国际。
[14] Zucchini,W.(2000年)。模型选择介绍。数学心理学杂志,44,41-61·Zbl 0949.62092号 ·doi:10.1006/jmps.1999.1276
此参考列表基于出版商或数字数学图书馆提供的信息。它的项目与zbMATH标识符启发式匹配,并且可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。