×

具有多策略的多目标响应的诊断树模型。 (英语) Zbl 1409.62242号

小结:构建的应答项目已被证明适用于认知诊断评估,因为可以观察到学生的问题解决过程,为推断他们的熟练程度提供了直接证据。然而,学生使用的多种策略使得项目评分和心理测量分析具有挑战性。本研究将所谓的两位数计分法引入诊断评估,以记录学生的部分学分及其策略。本研究还提出了一种诊断树模型(DTM),将认知诊断模型与树模型相结合,以分析使用两位数量规评分的项目。收敛树结构和发散树结构都被认为可以适应各种评分规则。MMLE/EM算法用于DTM的项目参数估计,仿真研究表明,该算法能够在各种条件下提供良好的参数恢复。分析了TIMSS 2007数学评估的一组数据,以说明两位数评分方案和DTM的使用。

MSC公司:

第62页,共15页 统计学在心理学中的应用
62D05型 抽样理论、抽样调查
62J20型 诊断、线性推理和回归
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Arbuckle,J.L.(2016)。IBM SPSS Amos 24用户指南。伊利诺伊州芝加哥:IBM SPSS。
[2] Batchelder,W.H.和Riefer,D.M.(1999)。多项式过程树建模的理论和实证综述。{《心理学通报与评论》},6,57-86。https://doi.org/10.3758/bf03210812
[3] Birenbaum,M.和Tatsuoka,K.K.(1987)。开放式响应格式与多选响应格式——这确实对诊断目的有所不同。{应用心理测量},11385-395。https://doi.org/10.1177/014662168701100404
[4] Birenbaum,M.、Tatsuoka,K.K.和Gutvirtz,Y.(1992年)。回答形式对学业成绩诊断评估的影响。{应用心理测量},16,353-363。https://doi.org/10.1177/014662169201600406
[5] Bock,R.D.和Aitkin,M.(1981年)。项目参数的边际最大似然估计:EM算法的应用。{\it Psychometrica},46,443-459。https://doi.org/10.1007/BF02293801
[6] Böckenholt,U.(2012年)。对判断和选择中的多重反应过程进行建模。{心理学方法},17,665-678。https://doi.org/10.1037/a0028111
[7] Böckenholt,U.,&Meiser,T.(2017)。使用阈值和多过程IRT模型的响应风格分析:综述和教程。《英国数学与统计心理学杂志》,701591-181。https://doi.org/10.1111/bmsp.12086 ·兹比尔1406.91340
[8] Butenko,S.和Pardalos,P.(2014)。数值方法与优化:简介。佛罗里达州博卡拉顿:CRC出版社·Zbl 1288.65001号
[9] Chen,J.(2017)。基于残差的方法验证Q矩阵规范。{应用心理测量},41,277-293。https://doi.org/0146621616686021
[10] Chen,J.,&Zhou,H.(2017)。在通用标称诊断模型框架下进行测试设计和建模。{\it PLoS ONE},12,1-14。https://doi.org/10.1371/journal.pone.0180016
[11] DeCarlo,L.T.(2011)。分数减法数据分析:DINA模型、分类、潜在班级规模和Q矩阵。{应用心理测量},35,8-26。https://doi.org/10.1177/0146621610377081
[12] de la Torre,J.(2010年7月)。部分信贷DINA模型。在佐治亚州雅典举行的心理测量学会国际会议上提交的论文。
[13] de la Torre,J.(2011)。广义DINA模型框架。《心理测量学》,76179-199。https://doi.org/10.1007/s11336-011-9207-7 ·Zbl 1284.62775号
[14] de la Torre,J.和Chiu,C.‐Y。(2016). 经验Q矩阵验证的一般方法。{\it Psychometrica},81,253-273。https://doi.org/10.1007/s11336-015-9467-8 ·Zbl 1345.62167号
[15] de la Torre,J.和Douglas,J.(2008)。认知诊断中的模型评估和多种策略:分数减法数据分析。{\it Psychometrica},73,595-624。https://doi.org/10.1007/s11336-008-9063-2 ·Zbl 1284.62777号
[16] de la Torre,J.和Minchen,N.(2014)。认知诊断评估和认知诊断模型框架。{\it Psicología Educativa},20,89-97。https://doi.org/10.1016/j.pse.2014.11.001
[17] Foy,P.和Olson,J.F.(2009年)。TIMSS 2007国际数据库用户指南。马萨诸塞州Chestnut Hill:波士顿学院国际研究中心。
[18] 古德曼,洛杉矶(1974年)。使用可识别和不可识别模型进行探索性潜在结构分析。{\it Biometrika},61,215-231。https://doi.org/10.1093/biomet/61.2215 ·Zbl 0281.62057号
[19] Gu,Y.,&Xu,G.(2017)。DINA模型可识别性和可估计性的充分必要条件(arXiv:1711.03174[stat.ME])。检索自http://arxiv.org/abs/1711.03174 ·Zbl 1431.62536号
[20] Haertel,E.H.(1989)。使用限制性潜在类模型映射成就项目的技能结构。{教育测量杂志},26301-321。https://doi.org/10.1111/j.1745-3984.1989.tb00336.x
[21] Hansen,M.(2013)。认知诊断的层次项目反应模型(未发表的博士论文)。加州大学洛杉矶分校。
[22] Hartz,S.M.(2002)。评估认知能力统一模型的贝叶斯框架:理论与实践相结合(未发表的博士论文)。伊利诺伊大学香槟分校。
[23] Henson,R.A.、Templin,J.L.和Willse,J.T.(2009年)。使用带有潜在变量的对数线性模型定义认知诊断模型系列。{\it Psychometrica},第74页,第191-210页。https://doi.org/10.1007/s11336-008-9089-5 ·Zbl 1243.62140号
[24] 洪,C.-Y。,Chang,Y.‐W.和蔡,R.‐C。(2016). 具有阶数限制的广义DINA模型的估计。{分类杂志},33,460-484。https://doi.org/10.1007/s00357-016-9215-5 ·Zbl 1364.62271号
[25] Jeon,M.和De Boeck,P.(2016年)。心理评估的广义项目反应树模型。{行为研究方法},481070-1085。https://doi.org/10.3758/s13428-015-0631-y
[26] Kuo,B.-C。,陈,C.‐H。,Yang,C.‐W.和Mok,M.M.C.(2016)。多选题和建构回答题测试的认知诊断模型。{教育心理学},361115-1133。https://doi.org/10.1080/0143410.2016.1166176
[27] Lee,Y.‐S。,Johnson,M.S.、Park,J.Y.、Sachdeva,R.、Zhang,J.和Waldman,M.(2013年4月)。一种MDS方法,用于调查学生在TIMSS 2007数学评估中的认知弱点和优势。在旧金山美国教育研究协会年会上提交的论文。
[28] Leighton,J.和Gierl,M.(2007年)。教育认知诊断评估:理论与应用。英国剑桥:剑桥大学出版社。https://doi.org/10.1017/CBO9780511611186
[29] Lie,S.、Taylor,A.和Harmon,M.(1996年)。评分技术和标准。M.Martin&D.Kelly(编辑),第三次国际数学和科学研究(TIMSS)技术报告,第一卷:设计和开发。马萨诸塞州Chestnut Hill:波士顿学院。
[30] Ma,W.和de la Torre,J.(2016)。多发性反应的序贯认知诊断模型。{英国数学与统计心理学杂志},69,253-275。https://doi.org/10.1111/bmsp.12070 ·Zbl 1406.91334号
[31] Ma,W.和de la Torre,J.(2017)。GDINA:通用DINA模型框架[计算机软件]。检索自https://CRAN.R-project.org/package=GDINA
[32] Ma,W.、Iaconangelo,C.和de la Torre,J.(2016)。模型相似性、模型选择和属性分类。{\ it Applied Psychological Measurement}(应用心理测量),40200-217。https://doi.org/10.1177/0146621615621717
[33] Maris,E.(1999)。估计多分类潜在类模型。{《心理测量学》,64,187-212。https://doi.org/10.1007/BF02294535 ·Zbl 1291.62229号
[34] Maris,G.和Bechger,T.(2009年)。等效诊断分类模型。{it测量:跨学科研究与视角},7,41-46。https://doi.org/10.1080/15366360802715478
[35] Martinez,M.E.和Bennett,R.E.(1992年)。审查用于大规模评估的自动评分构建响应项目类型。《ETS研究报告系列》,1992年(2),i-34。https://doi.org/10.1002/j.2333-8504.1992.tb01473.x
[36] McDonald,R.P.和Krane,W.R.(1977年)。关于渐近似然比检验中的局部可识别性和自由度的注记。{英国数学与统计心理学杂志},30198-203。https://doi.org/10.1111/j.2044-8317.1977.tb00739.x
[37] Mertler,C.A.(2001)。为你的课堂设计评分标准。{实践评估、研究与评估},7,1-10。
[38] Mislevy,R.J.(1996)。重新理解测试理论。{教育测量杂志},33379-416。https://doi.org/10.1111/j.1745-3984.1996.tb00498.x
[39] Muthén,L.K.,&Muthán,B.(2017年)。Mplus用户指南(第8版)。加利福尼亚州洛杉矶:作者。
[40] R核心团队(2017)。R: 用于统计计算的语言和环境。奥地利维也纳:R统计计算基金会。
[41] Read,T.R.,&Cressie,N.A.(1988年)。离散多元数据的拟合优度统计。纽约州纽约市:斯普林格。https://doi.org/10.1007/978-1-4612-4578-0 ·Zbl 0663.62065号
[42] Revuelta,J.(2008)。二进制设计项目的广义logit线性项目响应模型。{\it Psychometrica},73,385-405。https://doi.org/10.1007/s11336-007-9048-6 ·兹比尔1301.62124
[43] Tatsuoka,K.K.(1983年)。规则空间:基于项目反应理论处理误解的方法。{教育测量杂志},20,345-354。https://doi.org/10.1111/j.1745-3984.1983.tb00212.x
[44] Templin,J.L.和Henson,R.A.(2006年)。使用认知诊断模型测量心理障碍。{心理学方法},11287-305。https://doi.org/101037/1082-989x.11.3.287
[45] Templin,J.L.、Henson,R.A.、Rupp,A.A.、Jang,E.和Ahmed,M.(2008年3月)。标称响应数据的认知诊断模型。在纽约举行的全国教育计量委员会年会上发表的论文。
[46] Tutz,G.(1997年)。有序响应的顺序模型。范德林登·W·J·R·K·汉布尔顿(编辑),《现代项目反应理论手册》(第139-152页)。纽约州纽约市:斯普林格。https://doi.org/10.1007/978-1-4757-2691-6
[47] von Davier,M.(1997)。稀疏分类数据的自举拟合优度统计:蒙特卡罗研究结果。{心理研究在线方法},2(2),29-48。https://doi.org/10.1111/mono.12110
[48] von Davier,M.(2008)。应用于语言测试数据的通用诊断模型。{英国数学与统计心理学杂志},61287-307。https://doi.org/10.1348/000711007x193957
[49] von Davier,M.(2014)。DINA模型作为约束通用诊断模型:模型等效性的两种变体。{英国数学与统计心理学杂志},67,49-71。https://doi.org/10.1111/bmsp.12003 ·Zbl 1406.91392号
[50] Xu,G.(2017)。具有二进制响应的受限潜在类模型的可识别性。{统计学年鉴},45675-707。https://doi.org/10.1214/16-AOS1464网址 ·Zbl 1371.62010年
[51] Xu,G.和Zhang,S.(2016年
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。