×

统一测试组件。 (英语) Zbl 1143.62091号

摘要:在教育实践中,测试装配问题被描述为由测试规范引起的不平等系统。系统的每个解决方案都是一个测试,由0-1向量表示,其中每个元素对应于测试中包含(1)或不包含(0)的项目。因此,0-1向量的大小等于给定项目池中的项目数。所有解构成一个可行集——一个维向量空间中单位立方体顶点的子集。如果可行集合中的每个测试被组装的概率相等,那么测试组件是一致的。
本文演示了统一测试集在教育实践中的几个重要应用。基于D.斯莱宾的不等式[Bell Syst.Tech.J.41,463–501(1962)],对一个二进制程序进行了分析研究,作为统一测试程序集的候选。这项研究的结果建立了组合优化和概率不等式之间的联系。它们确定了可行集的组合属性,从而控制二进制编程测试程序集的一致性。给出了说明本文概念的计算机实验。

MSC公司:

第62页,共15页 统计学在心理学中的应用
90C27型 组合优化
60埃15 不平等;随机排序

软件:

CPLEX公司
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Armstrong,R.D.、Jones,D.H.和Kunce,C.S.(1998年)。使用网络流编程的IRT测试程序集。应用心理测量,22237–247·doi:10.1177/01466216980223004
[2] Belov,D.I.(2005)。计算机自适应测试中题库可用性的反问题。在4月于加拿大蒙特利尔举行的国家教育计量委员会年会上发表。
[3] Belov,D.I.和Armstrong,R.D.(2005a)。用于项目库分析和扩展的蒙特卡罗测试程序集。应用心理测量,29239-261·doi:10.1177/0146621605275413
[4] Belov,D.I.和Armstrong,R.D.(2005b)。用于评估和设计多阶段自适应测试的蒙特卡罗方法。在4月于加拿大蒙特利尔举行的国家教育计量委员会年会上发表。
[5] Belov,D.I.和Armstrong,R.D.(2006年)。一种约束编程方法,用于提取最大数量的非重叠测试表格。计算优化与应用,33(2/3),319–332·Zbl 1103.90079号 ·doi:10.1007/s10589-005-3058-z
[6] Belov,D.I.和Armstrong,R.D.(出版中)。多阶段自适应测试的设计、组装和评估的蒙特卡罗方法。应用心理测量。
[7] Boekkooi-Timinga,E.(1990年)。基于IRT的试题库的平行测试构建。《教育统计杂志》,15129-145·数字对象标识代码:10.2307/1164766
[8] Garey,M.R.和Johnson,D.S.(1979年)。计算机与难处理性:NP-完备性理论指南。纽约:弗里曼·Zbl 0411.68039号
[9] ILOG公司(2003)。CPLEX 9.0[计算机程序和手册],山景城:IL OS,Inc.[www.ilog.com]。
[10] Lord,F.M.(1980)。项目反应理论在实际测试问题中的应用。希尔斯代尔:劳伦斯·埃尔鲍姆。
[11] Luecht,R.M.(1998年)。使用优化启发式的计算机辅助测试装配。应用心理测量,22224-236·doi:10.1177/01466216980223003
[12] Luecht,R.M.和Hirsch,T.M.(1992年)。使用目标信息函数的平均增长近似值进行项目选择。应用心理测量,16,41–51·doi:10.1177/014662169201600104
[13] Slepian,D.(1962年)。高斯噪声的单边势垒问题。贝尔系统技术期刊,41,463–501。
[14] Theunissen,T.J.J.M.(1985)。二进制编程和测试设计。《心理测量学》,50411-420·doi:10.1007/BF02296260
[15] Tong,Y.L.(1980)。多元分布中的概率不等式。纽约:学术出版社·兹比尔0455.60003
[16] Tong,Y.L.(1990)。多元正态分布。纽约:斯普林格·Zbl 0689.62036号
[17] van der Linden,W.J.(1998)。心理和教育测试的最佳组合。应用心理测量,2195-211·doi:10.1177/01466216980223001
[18] 范德林登,W.J.(2005a)。用于优化测试设计的线性模型。纽约:斯普林格·兹比尔1084.62115
[19] 范德林登,W.J.(2005b)。个人沟通。
[20] van der Linden,W.J.和Adema,J.J.(1998)。同时组装多个测试表格。教育测量杂志,35185-198·doi:10.1111/j.1745-3984.1998.tb00533.x
[21] van der Linden,W.J.、Ariel,A.和Veldkamp,B.P.(2006年)。将CAT项目库组装为一组线性测试。《教育与行为统计杂志》,31(1),81-99·数字对象标识代码:10.3102/10769986031001081
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。