×

Lord-Wingersky算法2.0版,用于分层项目因子模型,应用于测试评分、标度校准和模型拟合测试。 (英语) Zbl 1322.62331号

总结:F.M.主M.S.温格斯基《IRT真实分数与等分观察核心等值的比较》,《应用心理学测量》第8卷第4期,第453-461页(1984年;doi:10.1177/014662168400800409)]用于创建基于总得分的可能性和后验概率的递归算法在一维项目反应理论(IRT)应用中有着良好的业绩记录。扩展递归算法以处理多维性相对简单,特别是对于固定求积,因为递归可以定义在由求积点的直积形成的网格上。然而,计算负担的增加在维数上仍然是指数级的,这使得递归算法的实现对于真正的高维模型来说很麻烦。本文提出了一种针对Lord-Wingersky递归的降维方法。该方法可以利用层次项目因子模型(例如,双因子模型、testlet模型或双层模型)所隐含的限制,使得Lord-Wingersky递归算法的一个版本可以在大大减少的求积点集上运行。例如,在双因子模型中,积分维数始终等于2,而与因子的数量无关。新算法不仅提供了一种有效的机制来生成针对残差依赖性进行适当调整的IRT评分转换表的总评分,而且在测试评分、链接和模型拟合检查中也带来了新的应用。通过仿真和实证例子说明了这些新的应用。

MSC公司:

第62页,共15页 统计学在心理学中的应用
62H25个 因子分析和主成分;对应分析
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Bock,R.D.、Gibbons,R.和Muraki,E.(1988年)。全信息项目因子分析。应用心理测量,12261-280·doi:10.1177/014662168801200305
[2] Cai,L.(2010年a)。采用Metropolis-Hastings-Robbins-Monro算法进行高维探索性项目因子分析。《心理测量学》,75,33-57·Zbl 1272.62113号 ·doi:10.1007/s11336-009-9136-x
[3] Cai,L.(2010年b)。一个具有应用程序的双层完整信息项因素分析模型。《心理测量学》,75,581-612·Zbl 1208.62183号 ·doi:10.1007/s11336-010-9178-0
[4] Cai,L.(2013)。flexMIRT 2.0版:灵活的多级项目分析和测试评分(计算机软件)。北卡罗来纳州Chapel Hill:Vector Psychometric Group LLC。
[5] Cai,L.、Thissen,D.和du Toit,S.H.C.(2011年)。IRTPRO:灵活、多维、多类别的IRT建模(计算机软件)。伊利诺伊州芝加哥:科学软件国际。
[6] Cai,L.、Yang,J.S.和Hansen,M.(2011)。广义全信息项双因子分析。心理学方法,16,221-248·doi:10.1037/a0023350
[7] Chen,W.H.和Thissen,D.(1999)。使用得分总和的边际似然估计三参数逻辑模型的项目参数。英国数学与统计心理学杂志,52,19-37·doi:10.1348/000711099158946
[8] Edwards,M.C.(2010年)。验证性项目因子分析的马尔可夫链蒙特卡罗方法。《心理测量学》,75,474-497·Zbl 1208.62188号 ·doi:10.1007/s11336-010-9161-9
[9] Ferrando,P.J.和Lorenzo-seva,U.(2001年)。通过预测观察得分的分布来检查项目反应理论模型的适当性:项目EO-fit。教育和心理测量,61895-902·数字对象标识代码:10.1177/00131640121971473
[10] Gibbons,R.D.和Hedeker,D.(1992年)。全信息项双因子分析。《心理测量学》,57,423-436·Zbl 0760.62097号 ·doi:10.1007/BF02295430
[11] Gibbons,R.D.、Bock,R.D、Hedeker,D.、Weiss,D.J.、Segawa,E.、Bhaumik,D.K.等人(2007年)。分级响应数据的全信息项双因子分析。应用心理测量,31,4-19·doi:10.1177/0146621606289485
[12] 玻璃、CAW;Wainer,H。;布拉德洛,ET;Linden,WJ(编辑);Glas,CAW(编辑),基于测试的自适应测试中的最大边际似然和期望后验估计,271-288(2000),马萨诸塞州波士顿·doi:10.1007/0-306-47531-6-14
[13] Hambleton,R.K.和Traub,R.E.(1973)。使用两个logistic潜在特征模型分析实证数据。英国数学与统计心理学杂志,26195-211·Zbl 0272.92021号 ·doi:10.1111/j.2044-8317.1973.tb00517.x
[14] Holzinger,K.J.和Swineford,F.(1937年)。双因素方法。《心理测量学》,第241-54页·doi:10.1007/BF02287965
[15] Ip,E.H.(2010年a)。经验上无法区分的多维IRT和局部依赖的一维项目反应模型。英国数学与统计心理学杂志,63395-416·doi:10.1348/000711009X466835
[16] Ip,E.H.(2010年b)。三参数测试用例响应模型和信息函数的解释。应用心理测量,34467-482·doi:10.1177/0146621610364975
[17] Jeon,M.、Rijmen,F.和Rabe-Hesketh,S.(2013年)。使用多组双因子模型的推广对差异项功能进行建模。《教育与行为统计杂志》,38,32-60·doi:10.3102/1076998611432173
[18] Li,Y.和Rupp,A.A.(2011)。全信息双因子模型的\[S-X^2S\]-X2统计量的性能。教育和心理测量,71,986-1005·数字对象标识代码:10.1177/0013164410392031
[19] Li,Y.、Bolt,D.M.和Fu,J.(2006)。testlet替代模型的比较。应用心理测量,30,3-21·doi:10.1177/0146621605275414
[20] Li,Z.和Cai,L.(2012)。用于测试IRT中潜在变量分布假设的基于总分的拟合指数。论文发表于美国东北部林肯市2012年心理测量学会国际会议。
[21] Lord,F.M.(1953年)。测试分数与测试潜在特征的关系。教育和心理测量,13517-548·doi:10.1177/001316445301300401
[22] Lord,F.M.和Wingersky,M.S.(1984年)。IRT真实分数与等分观察核心“等值”的比较。应用心理测量,8453-461·doi:10.1177/014662168400800409
[23] Muraki,E.(1992年)。广义部分信用模型:EM算法的应用。应用心理测量,16,159-176·doi:10.1177/014662169201600206
[24] Orlando,M.和Thissen,D.(2000)。二分项目反应理论模型的新项目拟合指数。应用心理测量,24,50-64·doi:10.1177/01466216000241003
[25] Orlando,M.、Sherbourne,C.D.和Thissen,D.(2000)。使用项目反应理论进行总结核心链接:在抑郁测量中的应用。心理评估,12354-359·doi:10.1037/1040-3590.12.354
[26] Reckase,医学博士(2009年)。多维项目反应理论。纽约州纽约市:斯普林格·Zbl 1291.62023号 ·数字对象标识代码:10.1007/978-0-387-89976-3
[27] Reeve,B.B.,Hays,R.D.,Bjorner,J.B.,Cook,K.F.,Crane,P.K.,Teresi,J.A.等人(2007年)。健康相关生活质量项目库的心理测量评估和校准:患者报告结果测量信息系统(PROMIS)计划。医疗保健,45,22-31·doi:10.1097/01.mlr.0000250483.85507.04
[28] Reise,S.P.(2012)。双因子测量模型的重新发现。多元行为研究,47667-696·doi:10.1080/00273171.2012.715555
[29] Rijmen,F.(2009)。多维IRT模型的高效全信息最大似然估计(技术报告编号RR-09-03)。教育测试服务·Zbl 1208.62188号
[30] Rijmen,F.(2010年)。双因素、testlet和二阶多维IRT模型之间的形式关系和经验比较。教育测量杂志,47361-372·doi:10.1111/j.1745-3984.2010.00118.x
[31] Rijmen,F.、Vansteelandt,K.和De Boeck,P.(2008)。日记法数据的潜在类模型:通过局部计算进行参数估计。《心理测量学》,第73卷,第167-182页·Zbl 1153.62092号 ·doi:10.1007/s11336-007-9001-8
[32] 罗莎,K。;斯威格特,KA;Nelson,L。;蒂森,D。;Thissen,D.(编辑);Wainer,H.(ed.),项目反应理论应用于多项选择和结构反应项目的组合——总分模式的量表分数,253-292(2001),新泽西州马华
[33] Ross,J.(1966年)。logistic心理测试模型的实证研究。《心理测量学》,31325-340·doi:10.1007/BF02289466
[34] Samejima,F.(1969年)。使用分级分数的反应模式评估潜在能力(心理测量专题论文第17号)。弗吉尼亚州里士满:心理测量学会。
[35] Schilling,S.和Bock,R.D.(2005)。基于自适应求积的高维最大边际似然项因子分析。心理测量,70533-55·Zbl 1306.62497号
[36] Schmid,J.和Leiman,J.M.(1957)。分层因子解决方案的开发。《心理测量学》,22,53-61·Zbl 0077.33704号 ·doi:10.1007/BF02289209
[37] Sinharay,S.、Johnson,M.S.和Stern,H.S.(2006年)。项目反应理论模型的后验预测评估。应用心理测量,30298-321·doi:10.1177/0146621605285517
[38] Stucky,B.D.、Thissen,D.和Edelen,M.O.(2013)。使用边缘迹线的逻辑近似值进行简短评估。应用心理测量,37,41-57·doi:10.1177/0146621612462759
[39] Thissen,D.和Wainer,H.(编辑)。(2001). 测试得分。新泽西州马华:劳伦斯·埃尔鲍姆。
[40] Thissen,D.、Pommerich,M.、Billeaud,K.和Williams,V.S.L.(1995)。项目反应理论用于测试分数,包括具有有序反应的多模项目。应用心理测量,19,39-49·doi:10.1177/014662169501900105
[41] Thissen,D.、Varni,J.W.、Stucky,B.D.、Liu,Y.、Irwin,D.E.和DeWalt,D.A.(2011)。使用PedsQL™3.0哮喘模块获得与PROMIS儿童哮喘影响量表(PAIS)可比较的分数。《生活质量研究》,第20期,1497-1505页·doi:10.1007/s11136-011-9874-y
[42] Wainer,H.、Bradlow,E.T.和Wang,X.(2007)。Testlet响应理论及其应用。纽约州纽约市:剑桥大学出版社·Zbl 1182.62211号 ·doi:10.1017/CBO9780511618765
[43] Wirth,R.J.和Edwards,M.C.(2007年)。项目因素分析:当前方法和未来方向。心理学方法,12,58-79·doi:10.1037/1082-989X.12.1.58
[44] Wu,E.J.C.和Bentler,P.M.(2011)。EQSIRT:一个用户友好的IRT程序(计算机软件)。加利福尼亚州恩西诺:多元软件。
[45] Yung,Y.F.、McLeod,L.D.和Thissen,D.(1999)。关于高阶因子模型和层次因子模型之间的关系。《心理测量学》,第64期,第113-128页·Zbl 1291.62252号 ·doi:10.1007/BF02294531
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。