×

独立IRT校准的多重等式。 (英语) Zbl 1402.62299号

小结:当测试形式被单独校准时,项目反应理论参数是不可比较的,因为它们在不同的测量量表上表示。等值过程包括转换通用量表上的项目参数估计值和确定可比测试分数。已经提出了各种统计方法来实现两种测试形式之间的等值。本文对均值几何平均值、均值-均值、Haebara和Stocking-Lord方法的多种测试形式进行了推广。所提出的方法同时估计了允许所有形式参数的尺度变换到基形式尺度的等值系数。导出了等值系数的渐近标准误差。通过仿真研究,验证了该方法的性能。

MSC公司:

第62页第15页 统计学在心理学中的应用
PDF格式BibTeX公司 XML格式引用
全文: DOI程序 链接

参考文献:

[1] Baldwin,P.(2013)。关于均值-方差估计量和偏差。英国数学与统计心理学杂志,66,277-289。doi:10.1111/j.2044-8317.2012.2048.x·Zbl 1406.91339号 ·doi:10.1111/j.2044-8317.2012.02048.x
[2] Battauz,M.(2013)。复杂联动计划中的IRT检验等式。《心理测量学》,78,464-480。doi:10.1007/s11336-012-9316-y·Zbl 1284.62682号 ·doi:10.1007/s11336-012-9316-y
[3] Battauz,M.(2015)。equalizeIRT:IRT测试等值的R包。统计软件杂志,68,1-22。doi:10.18637/jss.v068.i07·doi:10.18637/jss.v068.i07
[4] Bock,R.D.和Aitkin,M.(1981年)。项目参数的边际最大似然估计:EM算法的应用。《心理测量学》,46,443-459。doi:10.1007/BF02293801·doi:10.1007/BF02293801
[5] Deming,W.E.和Stephan,F.F.(1940年)。当预期边际总和已知时,对采样频率表进行最小二乘调整。《数理统计年鉴》,第11427-444页。doi:10.1214/aoms/1177731829·Zbl 0024.05502号 ·doi:10.1214/aoms/1177731829
[6] Goodman,L.A.(1968年)。交叉分类数据的分析:独立性、准独立性以及列联表中有无遗漏条目的相互作用。美国统计协会杂志,631091-1131。doi:10.1080/01621459.1968.10480916·Zbl 0177.46901号 ·网址:10.1080/01621459.1968.10480916
[7] 哈伯曼,S.J.(2009)。通过单独的校准将项目响应模型得出的参数估计值联系起来。ETS研究报告系列,2009年,i-9。doi:10.1002/j.2333-8504.2009.tb02197.x。
[8] Haberman,S.J.、Lee,Y.H.和Qian,J.(2009)。评定等精度的刀削技术。ETS研究报告系列,2009年,i-37。doi:10.1002/j.2333-8504.2009.tb02196.x·Zbl 0177.46901号
[9] Haebara,T.(1980)。采用加权最小二乘法对后勤能力量表进行等式计算。《日本心理学研究》,22144-149·doi:10.4992/心理学1954.22.144
[10] Kim,S.和Kolen,M.J.(2007年)。IRT特征曲线方法标准函数的不同定义对标尺链接的影响。《教育与行为统计杂志》,32,371-397。doi:10.3102/1076998607302632·数字对象标识代码:10.3102/1076998607302632
[11] Kolen,M.J.和Brennan,R.L.(2014)。测试等值、缩放和链接:方法和实践(第三版)。纽约:斯普林格·Zbl 1284.62013年 ·doi:10.1007/978-1-4939-0317-7
[12] Lee,Y.-H和Haberman,S.J.(2013)。谐波回归和标度稳定性。《心理测量学》,78,815-829。doi:10.1007/S11336-013-9337-1·Zbl 1288.62185号 ·doi:10.1007/S11336-013-9337-1
[13] Loyd,B.H.和Hoover,H.D.(1980)。使用Rasch模型进行垂直等值。教育测量杂志,17,179-193。doi:10.1111/j.1745-3984.1980.tb00825.x·doi:10.1111/j.1745-3984.1980.tb00825.x
[14] Marco,G.L.(1977年)。项目特征曲线解决了三个棘手的测试问题。《教育测量杂志》,第14期,第139-160页。doi:10.1111/j.1745-3984.1977.tb00033.x·doi:10.1111/j.1745-3984.1977.tb00033.x
[15] Michaelides,M.P.和Haertel,E.H.(2014)。选择常见项目作为测试等式中未识别的变异源:假设随机抽样常见项目的自举近似。教育中的应用测量,27,46-57。doi:10.1080/08957347.2013.853069·doi:10.1080/08957347.2013.853069
[16] Mislevy R.J.和Bock R.D.(1990年)。比洛3。使用二元逻辑模型进行项目分析和测试评分。印第安纳州穆尔斯维尔:科学软件·Zbl 1284.62682号
[17] Ogasawara,H.(2000)。使用矩的IRT方程系数的渐近标准误差。《经济评论》(小樽商业大学),51,1-23。
[18] Ogasawara,H.(2001a)。项目反应理论真分数等式及其标准误差。《教育与行为统计杂志》,26,31-50。doi:10.3102/10769986026001031·数字对象标识代码:10.3102/10769986026001031
[19] Ogasawara,H.(2001b)。项目反应理论的标准错误——用反应函数方法进行等值/链接。应用心理测量,2553-67。doi:10.1177/01466216010251004·doi:10.1177/01466216010251004
[20] Ogasawara,H.(2003)。IRT观测核等值方法的渐近标准误差。《心理测量学》,68,193-211。doi:10.1007/BF02294797·Zbl 1306.62481号 ·doi:10.1007/BF02294797
[21] R开发核心团队。(2016). R: 统计计算语言和环境。维也纳:R统计计算基金会。
[22] Rizopoulos,D.(2006年)。ltm:潜在变量建模和项目反应理论分析的R包。统计软件杂志,17,1-25。doi:10.18637/jss.v017.205·doi:10.18637/jss.v017.i05
[23] Stocking,M.和Lord,M.L.(1983年)。开发项目反应理论中的通用指标。应用心理测量,7201-2010。doi:10.1177/014662168300700208·doi:10.1177/014662168300700208
[24] van der Linden,W.J.和Hambleton,R.K.(1997)。现代项目反应理论手册。纽约:斯普林格·Zbl 0872.62099号 ·doi:10.1007/978-1-4757-2691-6
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。