徐雪丽;杰夫·道格拉斯 非参数IRT模型下的计算机自适应测试。 (英语) Zbl 1306.62518号 心理测量学 71,第1期,121-137(2006). 摘要:非参数项目反应模型已被开发成相对不灵活的参数项目反应模式的替代品。一个悬而未决的问题是,使用非参数模型管理计算机化自适应测试是否可行和实用。本文探讨了在使用非参数项目反应模型时进行计算机自适应测试的可能性。一个中心问题是,项目特征曲线的导数可能无法很好地估计,这消除了标准最大费希尔信息标准的可用性。作为替代方案,提出了基于Shannon熵和Kullback-Leibler信息的方法。对于长时间的测试,这些不需要项目特征欧氏导数的程序等效于最大费希尔信息标准。通过与随机项目选择的比较,对这两个程序的行为进行了模拟研究。研究表明,基于Shannon熵和Kullback-Leibler信息的程序在均方根误差方面表现相似,并且性能远优于随机项目选择。研究还表明,为了使这些方法切实可行,需要解决项目暴露率问题。 引用于三文件 MSC公司: 第62页第15页 统计学在心理学中的应用 62G10型 非参数假设检验 62B10型 信息理论主题的统计方面 关键词:香农熵;Kullback-Leibler信息;非参数项目反应模型;项目反应理论 软件:COBS公司;测试GRAF PDF格式BibTeX公司 XML格式引用 \textit{X.Xu}和textit{J.Douglas},《心理测量学》71,第1期,121-137(2006;Zbl 1306.62518) 全文: 内政部 参考文献: [1] Akaike,H.(1973年)。信息论和最大似然原理的推广。在B.N.Petrov中;F.Csaki(编辑),第二届信息理论国际研讨会(第267-281页);布达佩斯:Akadémiai Kiadó·Zbl 0283.62006号 [2] Birnbaum,A.(1968年)。一些潜在特征模型及其在推断考生能力中的应用。在F.M.Lord中;M.R.Novick(编辑),《心理测试分数的统计理论》(第397-479页),马萨诸塞州雷丁:Addison-Wesley。 [3] Chang,H.H.和;斯托特,W.F.(1993)。IRT模型中潜在特征的渐近后正态性。《心理测量学》,58、37–52·Zbl 0785.62099号 ·doi:10.1007/BF02294469 [4] Chang,H.H.和;Ying,Z.(1996)。计算机化自适应测试的全球信息方法。应用心理测量,20213-229·doi:10.1177/014662169602000303 [5] 封面、T.M.和;Thomas,J.A.(1991年)。信息论要素。纽约:Wiley·Zbl 0762.94001号 [6] DeGroot M.H.(1962年)。不确定性、信息和顺序实验。《数理统计年鉴》,33404-419·Zbl 0151.22803号 ·doi:10.1214/aoms/1177704567 [7] Douglas,J.(1997)。非参数项目特征曲线与能力估计的联合一致性。《心理测量学》,62,7–28·Zbl 1003.62546号 ·doi:10.1007/BF02294778 [8] Eubank,R.L.(1988)。样条平滑和非参数回归。纽约,马塞尔·德克尔·Zbl 0702.62036号 [9] Grayson,D.A.(1988年)。潜在特质理论中的两组分类:具有单调似然比的分数。《心理测量学》,53383–392·Zbl 0718.62147号 ·doi:10.1007/BF02294229文件 [10] 他、X、&;Ng,P.(1998)。COBS:通过线性规划进行质量约束平滑。SCOBS的未出版手册·Zbl 0941.62037号 [11] Nadaraya,E.A.(1964年)。关于估计回归。概率论及其应用,9141-142·doi:10.1137/1109020 [12] Ramsay,J.O.(1991年)。非参数项目特征曲线估计的核平滑方法。《心理测量学》,56611-630·Zbl 0850.62357号 ·doi:10.1007/BF02294494 [13] Ramsay,J.O.(2000年)。TESTGRAF:一个对多项选择测试和问卷数据进行图形分析的程序[计算机程序]。蒙特利尔:麦吉尔大学。 [14] Ramsay,J.O.和;Abrahamowicz,M.(1989)。单调样条的二项回归:一个心理测量应用。美国统计协会杂志,84,906–915·doi:10.1080/01621459.1989.10478854 [15] Ramsay,J.O.和;Winsberg,S.(1991年)。半参数项目分析的最大边际似然估计。《心理测量学》,56365-379·Zbl 04505799号 ·doi:10.1007/BF02294480 [16] Rossi,N.、Wang,X.和;Ramsay,J.O.(2002年)。用EM算法估计非参数项目响应函数。《教育与行为统计杂志》,27,291–317·doi:10.3102/10769986027003291 [17] Shannon,C.E.(1948年)。通信的数学理论,贝尔系统技术期刊,27379-423623-656·Zbl 1154.94303号 ·doi:10.1002/j.1538-7305.1948.tb01338.x [18] Tatsuoka,C.(2002)。潜在偏序分类模型的数据分析方法。英国皇家统计学会杂志,C辑,51,337-350·兹比尔1111.62381 ·数字对象标识代码:10.1111/1467-9876.00272 [19] Tatsuoka,C.和;Ferguson,T.(2003)。空间有序集上的序列分类。英国皇家统计学会杂志,B辑,65,143-158·Zbl 1063.62113号 ·doi:10.1111/1467-9868.00377 [20] 范德林登,W.J.,&;Glas,C.A.W.(2000)。计算机自适应测试:理论与实践。多德雷赫特:克鲁沃学院。 [21] Walker,A.M.(1969年)。关于后验分布的渐近行为。英国皇家统计学会杂志,B辑,31,80–88·Zbl 0176.48901号 [22] Watson,G.S.(1964年)。平滑回归分析。Sankhya,A系列,第26、359–372页·兹伯利0137.13002 [23] Xu X.、Chang、H.和;Douglas,J.(2003)。比较认知诊断CAT策略的模拟研究。在2003年4月于芝加哥举行的国家教育计量委员会年会上发表。 此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。