×

匹配测试性能的项目反应理论模型。 (英语) Zbl 1437.91370号

小结:在匹配测试中,考生会被出示一份测试项目列表和一份备选答案列表,并被要求将每个备选答案与一个测试项目进行匹配。响应备选方案最多可以作为对一个测试项目的响应。因此,考生对一个测试项目的回答取决于他或她对所有其他测试项目的回应。这违反了大多数现有项目反应理论(IRT)方法(如Rasch模型)的“局部独立性”假设。在这里,我们开发了一个框架来扩展二分法IRT模型,以考虑匹配测试中的测试行为。该模型将个人对匹配测试项目的正确回答的知识与其对这些项目的回答分离开来。除了开发匹配框架外,我们还导出了一些重要的属性,包括其项目响应函数和分数分布。最后,我们通过一个实证例子证明,我们的匹配测试框架很好地描述了匹配测试的行为。

MSC公司:

91E10型 认知心理学
62英尺15英寸 贝叶斯推断
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Aiken,L.R.,《心理测试与评估》(1997),Allyn&Bacon
[2] 安德斯,R。;Batchelder,W.H.,有序数据案例的文化共识理论,《心理测量学》,80,1,151-181(2015)·Zbl 1314.62267号
[3] 安德斯,R。;Oravecz,Z。;Batchelder,W.,《持续反应的文化共识理论:信息池的潜在评估模型》,《数学心理学杂志》,61,1-13(2014)·Zbl 1309.91108号
[4] Andrich,D.,有序反应类别的评级公式,《心理测量学》,43,561-573(1978)·Zbl 0438.62086号
[5] 巴顿,医学硕士。;Lord,F.M.,三参数逻辑项响应模型的上渐近线技术报告(1981),教育测试服务:新泽西州普林斯顿教育测试服务
[6] Batchelder,W.H。;Romney,A.K.,《没有答案的测试理论》,《心理测量学》,53,1,71-92(1988)·Zbl 0718.62260号
[7] Bean,T.W。;塞尔,D。;辛格,H。;Cowen,S.,《通过图形类比和类比学习指南从生物文本中学习概念》,《教育研究杂志》,84,4,233-237(1990)
[8] 贝根,A.A。;Glas,C.A.,多维IRT模型的MCMC估计和一些模型-效应分析,《心理测量学》,66,4,541-561(2001)·Zbl 1293.62234号
[9] Benson,J.,《内容有效性的重新定义,教育和心理测量》,41,3,793-802(1981)
[10] Benson,J。;克罗克,L.,《项目格式和阅读能力对客观测试成绩的影响:效度问题、教育和心理测量》,39,2,381-387(1979)
[11] Birnbaum,A.,《一些潜在特征模型及其在推断考生能力中的应用》,(心理测试分数统计理论(1968),Addison-Wesley)
[12] Bock,R.D.,《当对两个或多个潜在类别的反应进行评分时,估计项目参数和潜在能力》,《心理测量学》,29-51(1972)·Zbl 0233.62016号
[13] 布拉德洛,E.T。;Wainer,H。;Wang,X.,《小样本贝叶斯随机效应模型》,《心理测量学》,64,2,153-168(1999)·Zbl 1365.62451号
[14] 克雷格,S.D。;高尔森,B。;Driscoll,D.M.,《多媒体教育环境中的动画教学代理:代理属性、图片特征和冗余的影响》,《教育心理学杂志》(2002)
[15] Fox,J.-P.,贝叶斯项目响应建模(2010),施普林格·Zbl 1271.62012年
[16] 盖尔曼,A。;卡林,J.B。;斯特恩,H.S。;邓森,D.B。;Vehtari,A。;Rubin,D.B.,贝叶斯数据分析(2014),CRC出版社:佛罗里达州博卡拉顿CRC出版社·Zbl 1279.62004号
[17] Gronlund,N.E.,《学生成绩评估》(1998),Allyn&Bacon
[18] Haynie,W.J.,多项选择和匹配测试对中学后金属技术延迟记忆的影响,《工业教师教育杂志》,40,2(2003)
[19] Heywood,J.,《高等教育评估》(1977),John Wiley&Sons
[20] Lee,医学博士。;Steyvers,M。;德扬,M。;Miller,B.,《知识和预测排名任务中的推断专长》,《认知科学专题》,第4期,第151-163页(2012年)
[21] Lee,医学博士。;Steyvers,M。;Miller,B.,《聚合人们排名的认知模型》,《公共科学图书馆·综合》,第9期,第5期,第e96431页(2014年)
[22] Lord,F.M.先生。;Wingersky,M.S.,IRT真实分数与等分观察核心“等值”的比较,应用心理测量,8,4,453-461(1984)
[23] Masters,G.N.,部分信用评分的Rasch模型,《心理测量学》,47,149-174(1982)·Zbl 0493.62094号
[24] McDonald,R.P.,《测试理论:统一治疗》(2013),心理学出版社:纽约心理学出版社
[25] 米勒,医学博士。;Linn,R.L。;Gronlund,N.E.,《教学中的测量与评估》(2009),Merrill/Pearson
[26] Molenaar,I.W.,项目参数估算,(Fischer,G.H.;Molenaar,I.W。,Rasch模型:基础、最新发展和应用(1995),Springer-Verlag:Springer-Verlag纽约),39-51·Zbl 0831.62093号
[27] Moore,K.D.,《课堂教学技能》(2001年),McGraw-Hill:McGraw-Hill纽约
[28] 莫雷诺,R。;Mayer,R.E.,《多媒体学习的认知原则:情态和邻接的作用》,《教育心理学杂志》,91,358-368(1999)
[29] Nitko,A.J。;Brookhart,S.M.,《学生教育评估》(2010年),皮尔逊
[30] 奥斯古德,D.W。;麦克莫里斯,B.J。;Potenza,M.T.,《犯罪和偏差的多项目测量分析I:项目反应理论量表》,《定量犯罪学杂志》,18,3,267-296(2002)
[31] 奥斯特威尔,D。;Mulford,P。;Syndulko,K。;Martin,M.,《居住设施中老年和高龄居民的认知功能:与年龄、教育和痴呆的关系》,《美国老年医学会杂志》,42,7,766-773(1994)
[32] Popp,H.M.,《字母的视觉识别》,《阅读教师》(1964年)
[33] Rasch,G.,《一些智力和成就测试的概率模型》(1960年),丹麦Paedagogiske研究所:丹麦哥本哈根Paedagogiske研究所
[34] Reise,S.P。;Waller,N.G.,建立心理变态项目模型需要多少IRT参数?,心理学方法,8,2,164-184(2003)
[35] A.K.罗姆尼。;Batchelder,W.H。;Weller,S.C.,《文化共识理论的最新应用》,《美国行为科学家》,31,2,163-177(1987)
[36] Samejima,F.,使用分级分数的反应模式评估能力,(《心理测量学》专著,第17期(1969年))
[37] Shaha,S.H.,《Matching-tests:减轻焦虑和提高考试有效性》,《教育和心理测量》,44,4,869-881(1984)
[38] Sinharay,S。;约翰逊医学博士。;Stern,H.S.,项目反应理论模型的后验预测评估,应用心理测量,30,4,298-321(2006)
[39] 蒂森,D。;斯坦伯格,L.,多项选择题的反应模型,《心理测量学》,49,501-519(1984)
[40] 蒂森,D。;斯坦伯格,L。;Wainer,H.,使用项目反应模型的参数检测差异项目功能,(Holland,P.W.;Wainer,H.,差异项目功能(2012),Routledge:Routledge-NewYork,NY)
[41] Zeigenfuse,医学博士。;Steyvers,M.,匹配测试绩效的项目反应理论模型:Stan Code。osf.io/gp6s4(2020年)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。