文件Zbl 1284.62710-zbMATH打开

使用估计项目反应函数的残差评估一维项目反应理论模型的项目适合性。（英语） Zbl 1284.62710号

心理测量学 78，第3期，417-440（2013）.

小结：残差分析[R.K.Hambleton公司和H.斯瓦米纳坦，项目反应理论：原理和应用。波士顿：Kluwer学术（1985）；R.K.Hambleton公司,H.斯瓦米纳坦和H.J.罗杰斯项目反应理论基础。千橡树，加利福尼亚州：Sage Publications（1991）]是一种常用的评估项目反应理论（IRT）模型拟合度的方法。我们提出了一种残差分析形式，可用于评估一维IRT模型的项目拟合度。残差分析包括物品特征曲线的最大似然估计与物品特征曲线的替代比率估计的比较。当IRT模型拟合数据时，残差的大样本分布被证明是标准正态的。在详细的模拟研究中，我们将建议残差的性能与Hambleton等人[1991，loc.cit.]的标准残差进行了比较。然后，我们使用操作测试的数据计算建议的残差。残差似乎有助于评估项目是否适合一维IRT模型。

引用于5文件

MSC公司：

第62页，共15页

统计学在心理学中的应用

关键词：

双参数逻辑模型；广义部分信用模型；项目特性曲线；IRT模型拟合

软件：

帕斯卡尔

PDF格式 BibTeX公司 XML格式引用

全文：内政部

参考文献：

[1]	美国教育研究协会、美国心理学协会；国家教育计量委员会（1999年）。教育和心理测试标准。华盛顿：美国教育研究协会。
[2]	博克，R.D.，&；Aitkin，M.（1981）。项目参数的边际最大似然估计：em算法的应用。《心理测量学》，46，443–459·doi:10.1007/BF02293801
[3]	博克，R.D.，&；哈伯曼，S.J.（2009）。用于检查估计项目响应函数的良好性的置信区间。在心理测量学会年会上提交的论文。英国剑桥。
[4]	盒子、G.E.P.和；德雷珀，N.R.（1987）。经验建模和响应面。纽约：Wiley·Zbl 0614.62104号
[5]	Chon，K.H.，Lee，W.，&；Dunbar，S.B.（2010年）。混合IRT模型项目拟合统计的比较。《教育测量杂志》，47318–338·doi:10.1111/j.1745-3984.2010.00116.x
[6]	Cochran，W.G.（1977年）。取样技术（第三版）。纽约：Wiley·Zbl 0353.62011号
[7]	Dodeen，H.（2004年）。物料参数和物料配合之间的关系。《教育测量杂志》，41259–268·doi:10.1111/j.1745-3984.2004.tb01165.x
[8]	杜托伊特，M.（2003）。SSI的IRT。林肯伍德：科学软件国际。
[9]	Glas、C.A.W.和；Suarez-Falcon，J.C.（2003年）。三参数logistic模型的项目-项目统计比较。应用心理测量，27（2），87–106·doi:10.1177/0146621602250530
[10]	哈伯曼，S.J.（1976）。对数线性模型的广义残差。第九届国际生物特征会议论文集（第1卷，第104-172页）。波士顿：国际生物识别学会。
[11]	哈伯曼，S.J.（1977a）。预期细胞数较小的对数线性模型和频率表。《统计年鉴》，51148-1169·Zbl 0404.62025号 ·doi:10.1214/aos/1176344001
[12]	哈伯曼，S.J.（1977b）。指数响应模型中的最大似然估计。《统计年鉴》，5815–841·Zbl 0368.62019号 ·doi:10.1214/aos/1176343941
[13]	哈伯曼，S.J.（1978）。定性数据分析，第一卷：介绍性主题。纽约：学术出版社·Zbl 0461.6202号
[14]	哈伯曼，S.J.（1979）。定性数据分析，第二卷：新发展。纽约：学术出版社。
[15]	哈伯曼，S.J.（1988）。通过间接观测导出的频率表对数线性模型的稳定Newton-Raphson算法。社会学方法论，18193-211·doi:10.2307/271049
[16]	哈伯曼，S.J.（2006）。项目反应模型的自适应求积（研究报告编号RR-06-29）。普林斯顿：ETS。
[17]	哈伯曼，S.J.（2009）。使用广义残差检验项目反应模型的拟合优度（研究报告编号RR-09-15）。普林斯顿：ETS。
[18]	哈伯曼，S.J.，&；Sinharay，S.（2012）。使用广义残差评估项目反应理论模型的拟合优度（未出版手稿）。
[19]	R.K.汉堡；Han，N.（2005）。评估IRT模型对教育和心理测试数据的适用性：一个五步计划和几个图形显示。在W.R.Lenderking&amp；D.Revicki（编辑），《健康结果研究方法、测量、统计分析和临床应用进展》（第57-78页）。华盛顿：Degnon Associates。
[20]	R.K.汉堡；Swaminathan，H.（1985）。项目反应理论：原理与应用。波士顿：Kluwer学院。
[21]	R.K.Hambleton、H.Swaminathan和；罗杰斯，H.J.（1991）。在项目反应理论基础中。纽伯里公园：圣人·Zbl 1256.91048号
[22]	Holland，P.W.（1990）。荷兰身份：研究项目反应模型的新工具。《心理测量学》，55，5-18·Zbl 0725.62097号 ·doi:10.1007/BF02294739
[23]	Kang，T.和；Chen，T.T.（2008）。多体IRT模型广义S2项指数的性能。教育测量杂志，45391-406·doi:10.1111/j.1745-3984.2008.0071.x
[24]	M.J.科伦；Brennan，R.L.（2004）。测试等值、缩放和链接（第二版）。纽约：斯普林格·兹比尔1059.62120
[25]	Li，Y.和；Rupp，A.A.（2011年）。全信息双因子模型的S2统计量性能。教育和心理测量，71，986–1005·数字对象标识代码：10.1177/0013164410392031
[26]	Liang，T.，Han，T.K.和；，Hambleton，R.K.（2009年）。ResidPlots-2：IRT图形残差分析的计算机软件。应用心理测量，33411-412·doi:10.1177/0146621608329502
[27]	Louis，T.（1982）。使用EM算法时，寻找观测信息矩阵。英国皇家统计学会杂志。B系列，44·Zbl 0488.62018号
[28]	马斯特斯，G.N.（1982）。部分信用评分的Rasch模型。Psycholometrika，47岁·兹伯利0493.62094
[29]	Mislevy，R.J.和；Bock，R.D.（1991）。BILOG 3.11[计算机软件]。林肯伍德：科学软件国际。
[30]	Muraki，E.（1997）。广义部分信用模型。在W.J.van der Linden&amp；R.K.Hambleton（编辑），《现代项目反应理论手册》。纽约：斯普林格。
[31]	Muraki，E.和；Bock，R.D.（2003）。第4部分：评级尺度数据的IRT项目分析和测试评分[计算机程序]。芝加哥：科学软件。
[32]	Naylor，J.C.和；A.F.M.史密斯（1982）。后验分布有效计算方法的应用。应用统计学，31214-225·Zbl 0521.65017号 ·doi:10.2307/2347995
[33]	M.奥兰多；Thissen，D.（2000）。二分项目反应理论模型的基于似然的项目-项目指数。应用心理测量，24，50-64·doi:10.1177/01466216000241003
[34]	Rao，C.R.（1973）。线性统计推断及其应用（第二版）。纽约：Wiley·Zbl 0256.6202号
[35]	医学博士Reckase（1997）。多维项目反应理论的过去和未来。应用心理测量，21，25-36·doi:10.1177/0146621697211002
[36]	Sinharay，S.（2005）。使用贝叶斯方法评估一维项目反应理论模型的拟合度。《教育测量杂志》，42，375–394·doi:10.1111/j.1745-3984.2005.00021.x
[37]	Sinharay，S.（2006）。一维项目反应理论模型的贝叶斯项目匹配分析。英国数学杂志；统计心理学，59429-449·doi:10.1348/000711005X66888
[38]	Sinharay，S.（2010年）。子核心多久增加一次价值？操作和模拟数据的结果。教育测量杂志，47150-174·doi:10.1111/j.1745-3984.2010.00106.x
[39]	Stone，首席执行官；Zhang，B.（2003年）。评估项目反应理论模型的拟合优度：传统程序和替代程序的比较。《教育测量杂志》，40（4），331-352·doi:10.1111/j.1745-3984.2003.tb01150.x
[40]	von Davier，M.、Sinharay，S.、Beaton，A.E.和；Oranje，A.（2006）。国家教育进展评估中使用的统计程序。在C.R.Rao&amp；S.Sinharay（编辑），《统计手册》（第26卷，第205-233页）。阿姆斯特丹：荷兰北部。
[41]	Wainer，H.和；Thissen，D.（1987）。用错误的模型估计能力。《教育统计杂志》，第12339–368页·doi:10.2307/1165054
[42]	Yen，W.（1981）。利用仿真结果选择潜在特征模型。应用心理测量，5245–262·doi:10.1177/014662168100500212

此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配，可能包含数据转换错误。在某些情况下，zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献，而不要求完整或完全匹配。

任何	在任何地方
一个	内部文档标识符
澳大利亚	作者、编辑
人工智能	内部作者标识符
钛	标题
洛杉矶	语言
所以	来源
实验室	回顾，摘要
第页	出版年份
车辆	评审员
复写的副本	MSC代码
美国犹他州	关键字
日期	文档类型(j个：期刊文章；b条：book；一：图书文章）

一&b条	逻辑和
一\|b条	逻辑或
!实验室	逻辑不
美国广播公司*	右通配符
"ab c公司"	短语
(ab c公司)	圆括号

示例

领域

操作员

使用估计项目反应函数的残差评估一维项目反应理论模型的项目适合性。（英语） Zbl 1284.62710号

MSC公司：

关键词：

软件：

参考文献：

示例

领域

操作员

使用估计项目反应函数的残差评估一维项目反应理论模型的项目适合性。 （英语） Zbl 1284.62710号

MSC公司：

关键词：

软件：

参考文献：

使用估计项目反应函数的残差评估一维项目反应理论模型的项目适合性。（英语） Zbl 1284.62710号