×

观察得分等值:概述。 (英语) Zbl 1288.62194号

摘要:从统一的等值框架的角度对观测核心等值(OSE)过程进行了概述[作者,“等值测试分数的统计观点”,载于:作者(编辑),《测试等值、缩放和链接的统计模型》,纽约:Springer.1-17(2011)]。该框架包括所有OSE方法。讨论了与测试、常见项目和抽样设计相关的问题及其与测量和等值的关系。文中还介绍了等值过程、模型假设和等值评估方法面临的挑战。通过许可测试的实际数据示例,逐步说明了均衡过程。

MSC公司:

第62页,共15页 统计学在心理学中的应用

软件:

SAS/IML公司
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Berger,M.P.F.(1997年)。潜在变量模型的优化设计:综述。在J.Rost&R.Langeheine(编辑),《潜在特质和潜在阶级模型在社会科学中的应用》(第71-79页)。梅恩斯特:瓦克斯曼。
[2] Bishop、Y.M.M.、Fienberg、S.E.和;Holland,P.W.(1975)。离散多元分析:理论与实践。剑桥:麻省理工学院出版社·Zbl 0332.62039号
[3] Bozdogan,H.(1987)。模型选择和Akaike信息准则(AIC):一般理论及其分析扩展。《心理测量学》,52(3),345-370·Zbl 0627.62005号 ·doi:10.1007/BF02294361
[4] H.I.布劳恩;Holland,P.W.(1982)。观察得分测试等值:对一些ETS等值程序的数学分析。在P.W.Holland&&;D.B.Rubin(编辑),《测试等式》(第9-49页)。纽约:学术出版社。
[5] 张伯伦,T.C.(1899)。在克莱文勋爵关于地球作为适合生命居住的地方的时代的讲话中。史密森学会年度报告,1899年,223-246。
[6] Chen,H.、Livingston,S.和;Holland,P.W.(2011)。NEAT设计的广义等值函数。A.A.von Davier(编辑),测试等值、缩放和链接的统计模型(第185-200页)。纽约:斯普林格。
[7] Chen,H.,Yan,D.,Han,N.和;von Davier,A.A.(2006年)。LOGLIN/KE用户指南:2.1版。普林斯顿:ETS。
[8] Cook,L.L.,Eignor,D.R.和;Taft,H.L.(1988)。教学对IRT和常规项目参数统计稳定性影响的比较研究。《教育测量杂志》,25(1),31–45·doi:10.1111/j.1745-3984.1988.tb00289.x
[9] 新泽西州多兰斯(2002)。重新调整SAT分数分布:如何以及为什么。《教育测量杂志》,39(1),59-84·doi:10.1111/j.1745-3984.2002.tb01135.x
[10] 新泽西州多兰斯;费根鲍姆医学博士(1994年)。SAT和PSAT/NMSQT变更引起的均衡问题(ETS研究备忘录编号RM-94-10)。普林斯顿:ETS。
[11] 新泽西州多兰斯;Holland,P.W.(2000)。测试的总体不变性和公平性:基本理论和线性案例。《教育测量杂志》,37(4),281-306·doi:10.1111/j.1745-3984.2000.tb01088.x
[12] 新泽西州多兰斯、T·摩西和;Eignor,D.(2011)。平衡考试成绩:走向最佳实践。A.A.von Davier(编辑),测试等值、缩放和链接的统计模型(第21–42页)。纽约:斯普林格。
[13] 新泽西州Dorans、M.Pommerich和;Holland,P.W.(编辑)(2007年)。链接和对齐分数和刻度。纽约:斯普林格·Zbl 1183.62195号
[14] Duong,M.Q.和;von Davier,A.A.(2012年)。观察得分等同于异质目标人群。国际测试杂志,12(3),224–251·网址:10.1080/15305058.2011.620725
[15] ETS(2011)。LOGLIN/KE软件版本2[计算机软件]。普林斯顿:ETS。
[16] Feuer,M.J.、Holland,P.W.、Green,B.F.、Bertental,M.W.和;Hemphill,F.C.(编辑)(1999年)。不常见的措施:教育考试之间的对等和联系(国家研究委员会教育考试对等和联系委员会的报告)。华盛顿:美国国家科学院出版社。
[17] 哈伯曼,S.J.(2011)。使用指数族进行等值。A.A.von Davier(编辑),测试等值、缩放和链接的统计模型(第125-140页)。纽约:斯普林格。
[18] Holland,P.W.和;新泽西州多兰斯(2006)。链接和等值。R.L.Brennan(编辑),《教育测量》(第四版,第189-220页)。韦斯特波特:普雷格。
[19] Holland,P.W.和;Hoskens,M.(2003)。作为一阶项目反应理论的经典测试理论:应用于可能非平行测试的真实分数预测。《心理测量学》,68、123–149·Zbl 1306.62430号 ·doi:10.1007/BF02296657
[20] Holland,P.W.和;Thayer,D.T.(1987)。关于使用对数线性模型拟合离散概率分布的说明(ETS研究报告编号RR-87-31)。普林斯顿:ETS。
[21] Holland,P.W.和;Thayer,D.T.(1989)。等值分数分布的核心方法(ETS研究报告编号89-07)。普林斯顿:ETS。
[22] Holland,P.W.和;Thayer,D.T.(2000)。离散测试分数分布的单变量和双变量对数线性模型。《教育与行为统计杂志》,第25期,第133-183页·兹伯利02340817 ·doi:10.3102/10769986025002133
[23] Holland,P.W.和;Wainer,H.(1993)。差异项目功能。希尔斯代尔:埃尔鲍姆。
[24] Jiang,Y.、von Davier,A.A.和;Chen,H.(2012)。评估等值结果:链式内核等值的相对误差百分比。《教育测量杂志》,49,39–58·doi:10.1111/j.1745-3984.2011.00159.x
[25] 卡拉巴索斯(Karabatsos,G.);Walker,S.G.(2011年)。用于测试等值的贝叶斯非参数模型。A.A.von Davier(编辑),测试等值、缩放和链接的统计模型(第175-185页)。纽约:斯普林格。
[26] 医学博士肯德尔;Stuart,A.(1977年)。高级统计学理论(第四版)。纽约:麦克米伦出版社·Zbl 0353.62013.中
[27] M.J.科伦;Brennan,R.J.(2004)。测试等值:方法和实践(第二版)。纽约:斯普林格·兹比尔1059.62120
[28] Lee,Y.和;von Davier,A.A.(2013年出版)。通过质量控制图、基于模型的方法和时间序列技术监控量表分数随时间的变化。心理测量学·Zbl 1284.62722号
[29] Lee,Y.-H.,&;von Davier,A.A.(2011年)。通过替代核进行等式运算。A.A.von Davier(编辑),测试等值、缩放和链接的统计模型(第159-173页)。纽约:斯普林格。
[30] Li,D.,Jiang,Y.和;von Davier,A.A.(2012年)。一系列IRT真实分数等值的准确性和一致性。《教育测量杂志》,49,167–189·doi:10.1111/j.1745-3984.2012.00167.x
[31] Li,D.,Li,S.和;von Davier,A.A.(2011年)。应用时间序列分析来检测尺度漂移。A.A.von Davier(编辑),测试等值、缩放和链接的统计模型(第381-398页)。纽约:斯普林格。
[32] Liang,L.,Dorans,N.J.和;Sinharay,S.(2009)。考生的第一语言及其与等值的关系(ETS研究报告编号RR-09-05)。普林斯顿:ETS。
[33] Livingston,S.A.(2004)。等式测试分数(无IRT)。普林斯顿:教育测试服务。
[34] Lord、F.M.和;Novick,M.R.(1968年)。心理测试成绩的统计理论。阅读:艾迪森·卫斯理·Zbl 0186.53701号
[35] Morris,C.N.(1982年)。在测试等值的基础上。在P.W.荷兰&D.B.Rubin(编辑),《测试等值》(第9-49页)。纽约:学术出版社。
[36] 摩西·T·;Holland,P.W.(2008)。对数线性平滑模型的选择策略对等值函数的影响(ETS研究报告编号RR-08-25)。普林斯顿:ETS。
[37] 摩西·T·;von Davier,A.A.(2011年)。用于对数线性平滑的SAS IML宏应用了心理测量。应用心理测量,35(3),250-251·doi:10.1177/0146621610373255
[38] Qian,J.、von Davier,A.A.和;姜瑜(2013年提交)。使用多种形式实现稳定的评估量表——在IRT链接中对测试样本进行加权。定量心理学的新发展:第77届心理测量学会国际会议记录。纽约:斯普林格。
[39] Rao,C.R.(1973)。线性统计推断及其应用(第二版)。纽约:Wiley·Zbl 0256.6202号
[40] Rubin,D.(1982)。关于“观察分数测试等值:对一些ETS等值程序的数学分析”的讨论。在P.W.Holland&&;D.B.Rubin(编辑),测试等值(第51–54页)。纽约:学术出版社。
[41] Sinharay,S.、Haberman,S.和Holland,P;Lewis,C.(2012)。关于在等值中选择锚定测试的注释(ETS研究报告编号RR-12-14)。普林斯顿:ETS。
[42] Sinharay,S.和;Holland,P.W.(2010)。NEAT设计的缺失数据假设及其对测试等值的影响。Psycholometrika,75309–327岁·Zbl 1234.62159号 ·doi:10.1007/s11336-010-9156-6
[43] Sinharay,S.,Holland,P.W.和;von Davier,A.A.(2011年)。评估链和后分层等值方法的缺失数据假设。A.A.von Davier(编辑),测试等值、缩放和链接的统计模型(第381-398页)。纽约:斯普林格。
[44] 范德林登,W.J.(2000)。观测核等值的测试理论方法。《心理测量学》,65、437–456·Zbl 1291.62260号 ·doi:10.1007/BF02296337
[45] van der Linden,W.J.(2011年)。局部观测-核心等值。A.A.von Davier(编辑),等式、缩放和链接的统计模型(第201–223页)。纽约:斯普林格。
[46] von Davier,A.A.(2007年)。实际等值问题的潜在解决方案。在N.J.Dorans、M.Pommerich和;P.W.Holland(编辑),链接和校准分数和量表,纽约:Springer。
[47] von Davier,A.A.(2010年)。观测核的测试等值:百分位秩、高斯核和IRT观测核等值方法。研讨会在佐治亚州雅典举行的心理测量学会国际会议上举行。
[48] von Davier,A.A.(2011年A)。测试等值、缩放和链接的统计模型。纽约:斯普林格·Zbl 1205.62200号
[49] von Davier,A.A.(2011年b)。从统计学角度看考试成绩相等。A.A.von Davier(编辑),《测试等值、缩放和链接的统计模型》(第1-17页)。纽约:斯普林格。
[50] von Davier,A.A.(2011年c)。应用质量控制和数据挖掘技术监测量表分数。在M.Pechenizkiy、T.Calders、C.Conati、S.Ventura、C.Romero和;J.Stamper(编辑),《第四届教育数据挖掘国际会议论文集》,埃因霍温,2011年7月6日至8日。埃因霍温:埃因霍芬科技大学图书馆。
[51] von Davier,A.A.(2012年)。国际标准化评估中的有效性问题以及对测试和抽样设计的影响。2012年3月,纽约州纽约市,在《教育评估、问责制和公平:全球有效性对话》上发表论文。
[52] von Davier,A.A.、Fournier-Zajac,S.和;Holland,P.W.(2007)。使用核等式方法的Levine线性观测分数等式函数的等百分比版本(ETS研究代表编号RR-07-14)。普林斯顿:ETS。
[53] von Davier,A.A.,荷兰,P.W;Thayer,D.T.(2004年a)。观测核等值的链和后分层方法:它们与种群不变性的关系。《教育测量杂志》,41(1),15-32·doi:10.1111/j.1745-3984.2004.tb01156.x
[54] von Davier,A.A.,荷兰,P.W;Thayer,D.T.(2004年b)。测试等值的核心方法。纽约:斯普林格·Zbl 1038.62122号
[55] 冯·达维尔,A.A.,&Kong,N.(2005)。非等价群设计线性等式的统一方法。《教育与行为统计杂志》,30(3),313–334·doi:10.3102/10769986030003313
[56] von Davier,A.A.,&;Wilson,C.(2007)。IRT真实分数测试等值:假设和应用指南。《教育与心理测量杂志》,67(6),940-957·数字对象标识代码:10.1177/0013164407301543
[57] Wang,T.(2011)。另一种连续化方法:连续对数线性方法。A.A.von Davier(编辑),测试等值、缩放和链接的统计模型(第141-158页)。纽约:斯普林格。
[58] Wiberg,M.、van der Linden,W.J.和;von Davier,A.A.(2012年)。局部观测核等值。论文提交给温哥华国家教育计量委员会。
[59] Zumbo,B.D.(2007年)。有效性:基本问题和统计方法。在C.R.Rao&S.Sinharay(编辑),《统计手册:第26卷心理测量学》(第45-79页)。荷兰:爱思唯尔·Zbl 1256.91039号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。