×

具有最佳设计标准的多维自适应测试用于项目选择。 (英语) Zbl 1243.62144号

小结:对优化设计文献中的几个标准进行了检查,以用于多维适应性测试中的项目选择。特别是,它检查了哪些标准适用于适应性测试,其中所有能力都是有意的,一些应被视为令人讨厌的,或者兴趣在于测试能力的组合。本文的理论分析和对模拟数据的研究都表明,当所有能力都是有意的时,A-最优和D-最优的准则会导致最准确的估计,前者略优于后者。对于这种自适应测试,E-最优准则偶尔会表现出不稳定的行为,不建议使用它。如果某些能力是令人讨厌的,建议应用A(s)-最优性(或D-s)-最佳性标准,该标准侧重于意向能力的子集。对于能力的线性组合的测量,(C)-最优性标准产生了最佳结果。还评估了每个标准对具有特定参数值模式的项目的偏好。研究发现,标准的差异主要在于他们对具有不同值模式的项目的偏好,以及他们的判别参数。

MSC公司:

第62页第15页 统计学在心理学中的应用
62K05美元 最佳统计设计
62H15型 多元分析中的假设检验
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Berger,M.P.F.和Wong,W.K.(编辑)(2005年)。应用优化设计。伦敦:威利·Zbl 1076.62538号
[2] Bernaerts,K.、Servaes,R.D.、Kooyman,S.、Versyck,K.J.和Van Impe,J.F.(2002年)。平方根模型参数估计的最佳温度输入设计:参数精度和模型有效性限制。国际食品微生物学杂志,73145-157·doi:10.1016/S0168-1605(01)00645-6
[3] Bloxom,B.和Vale,C.D.(1987年)。多维自适应测试:更新的近似程序。在心理测量学会的会议上。加拿大蒙特利尔,6月。
[4] Boughton,K.A.、Yao,L.和Lewis,D.M.(2006年)。报告由复杂结构组成的测试的诊断子量表分数。在国家教育计量委员会会议上。加利福尼亚州旧金山,4月。
[5] Chang,H.-H.(2004)。理解计算机自适应测试:从Robbins Monro到Lord及其他。D.Kaplan(Ed.),《社会科学定量方法手册》(第117-133页)。千橡:鼠尾草。
[6] Chang,H.-H.,&Ying,Z.(1996)。计算机化自适应测试的全球信息方法。应用心理测量,20,213-229·doi:10.1177/014662169602000303
[7] Fan,M.和Hsu,Y.(1996)。多维计算机自适应测试。在美国教育研究协会年会上。纽约市,纽约州,4月。
[8] Lehmann,E.L.(1999)。大样本理论的要素。纽约:斯普林格·Zbl 0914.62001号
[9] Luecht,R.M.(1996)。多维计算机自适应测试。应用心理测量,20389–404·doi:10.1177/014662169602000406
[10] 麦克唐纳,R.P.(1967年)。非线性因素分析。心理测量专著第15号·Zbl 0183.24602号
[11] McDonald,R.P.(1997)。正态-给定多维模型。W.J.van der Linden和R.K.Hambleton(编辑),《现代项目反应理论手册》(第258-270页)。纽约:斯普林格。
[12] R.J.欧文(1969)。定制测试的贝叶斯方法(研究报告69-92)。新泽西州普林斯顿:教育测试服务。
[13] Owen,R.J.(1975年)。自适应心理测试中定量反应的贝叶斯序贯程序。美国统计协会杂志,70351-356·Zbl 0324.62061号 ·doi:10.2307/2285821
[14] 医学博士Reckase(1985)。测试多项能力的难度。应用心理测量,9401–412·doi:10.1177/014662168500900409
[15] 医学博士Reckase(1997)。二分项目响应数据的线性逻辑多维模型。W.J.van der Linden和R.K.Hambleton(编辑),《现代项目反应理论手册》(第271-286页)。纽约:斯普林格。
[16] Samejima,F.(1974年)。多维潜在空间中连续响应水平的正态ogive模型。《心理测量学》,39,111-121·Zbl 0295.92018号 ·doi:10.1007/BF02291580
[17] Segall,D.O.(1996年)。多维自适应测试。《心理测量学》,61331-354·Zbl 0863.62087号 ·doi:10.1007/BF02294343
[18] Segall,D.O.(2000)。多维适应性测试原理。W.J.van der Linden和C.A.W.Glas(编辑),《计算机自适应测试:理论与实践》(第53-73页)。波士顿:Kluwer学院。
[19] Silvey,S.D.(1980)。优化设计。伦敦:查普曼和霍尔·兹伯利0468.62070
[20] Sympson,J.B.和Hetter,R.D.(1985年)。控制计算机自适应测试中的项目暴露率。军事测试协会第27届年会会议记录(第973-977页)。加利福尼亚州圣地亚哥:海军人事研究与发展中心。
[21] Tanner,M.A.(1993年)。统计推断工具。纽约:斯普林格·Zbl 0777.62003年
[22] 范德林登,W.J.(1996)。用于测量多种性状的组合测试。应用心理测量,20373–388·doi:10.1177/014662169602000405
[23] 范德林登,W.J.(1999)。基于最小误差方差准则的多维自适应测试。《教育与行为统计杂志》,24398-412。
[24] van der Linden,W.J.(2005)。用于优化测试设计的线性模型。纽约:斯普林格·Zbl 1084.62115号
[25] van der Linden,W.J.和Glas,C.A.W.(编辑)(2000年)。计算机自适应测试:理论与实践。波士顿:Kluwer学院。
[26] van der Linden,W.J.和Glas,C.A.W.(2007)。适应性测试的统计方面。C.R.Rao和S.Sinharay(编辑),统计手册:第27卷。心理测量学(第801-838页)。阿姆斯特丹:荷兰北部·Zbl 1460.62193号
[27] van der Linden,W.J.和Veldkamp,B.P.(2007年)。使用项目合格概率的适应性测试中的条件项目暴露控制。《教育与行为统计杂志》,32,398–418·doi:10.3102/1076998606298044
[28] Veldkamp,B.P.和van der Linden,W.J.(2002)。具有测试内容约束的多维自适应测试。《心理测量学》,67575-588·Zbl 1297.62243号 ·doi:10.1007/BF02295132
[29] Wainer,H.(编辑)(2000年)。计算机自适应测试:初级。希尔斯代尔:Lawrence Erlbaum Associates。
[30] Yao,L.和Boughton,K.A.(2007年)。一种多维项目反应建模方法,用于改进子量表熟练程度估计和分类。应用心理测量,31,83–105·doi:10.1177/0146621606291559
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。