文件Zbl 1288.62194-zbMATH Open

观察得分等值：概述。（英语） Zbl 1288.62194号

心理测量学 78，第4号，605-623（2013）.

摘要：从统一的等值框架的角度对观测核心等值（OSE）过程进行了概述[作者，“等值测试分数的统计观点”，载于：作者（编辑），《测试等值、缩放和链接的统计模型》，纽约：Springer.1-17（2011）]。该框架包括所有OSE方法。讨论了与测试、常见项目和抽样设计相关的问题及其与测量和等值的关系。文中还介绍了等值过程、模型假设和等值评估方法面临的挑战。通过许可测试的实际数据示例，逐步说明了均衡过程。

引用于1文件

MSC公司：

第62页，共15页

统计学在心理学中的应用

关键词：

测试等值；观测到的磁芯；核等值；局部等值；对数线性模型；项目反应理论

软件：

SAS/IML公司

PDF格式 BibTeX公司 XML格式引用

全文：内政部

参考文献：

[1]	Berger，M.P.F.（1997年）。潜在变量模型的优化设计：综述。在J.Rost&amp；R.Langeheine（编辑），《潜在特质和潜在阶级模型在社会科学中的应用》（第71-79页）。梅恩斯特：瓦克斯曼。
[2]	Bishop、Y.M.M.、Fienberg、S.E.和；Holland，P.W.（1975）。离散多元分析：理论与实践。剑桥：麻省理工学院出版社·Zbl 0332.62039号
[3]	Bozdogan，H.（1987）。模型选择和Akaike信息准则（AIC）：一般理论及其分析扩展。《心理测量学》，52（3），345-370·Zbl 0627.62005号 ·doi:10.1007/BF02294361
[4]	H.I.布劳恩；Holland，P.W.（1982）。观察得分测试等值：对一些ETS等值程序的数学分析。在P.W.Holland&&；D.B.Rubin（编辑），《测试等式》（第9-49页）。纽约：学术出版社。
[5]	张伯伦，T.C.（1899）。在克莱文勋爵关于地球作为适合生命居住的地方的时代的讲话中。史密森学会年度报告，1899年，223-246。
[6]	Chen，H.、Livingston，S.和；Holland，P.W.（2011）。NEAT设计的广义等值函数。A.A.von Davier（编辑），测试等值、缩放和链接的统计模型（第185-200页）。纽约：斯普林格。
[7]	Chen，H.，Yan，D.，Han，N.和；von Davier，A.A.（2006年）。LOGLIN/KE用户指南：2.1版。普林斯顿：ETS。
[8]	Cook，L.L.，Eignor，D.R.和；Taft，H.L.（1988）。教学对IRT和常规项目参数统计稳定性影响的比较研究。《教育测量杂志》，25（1），31–45·doi:10.1111/j.1745-3984.1988.tb00289.x
[9]	新泽西州多兰斯（2002）。重新调整SAT分数分布：如何以及为什么。《教育测量杂志》，39（1），59-84·doi:10.1111/j.1745-3984.2002.tb01135.x
[10]	新泽西州多兰斯；费根鲍姆医学博士（1994年）。SAT和PSAT/NMSQT变更引起的均衡问题（ETS研究备忘录编号RM-94-10）。普林斯顿：ETS。
[11]	新泽西州多兰斯；Holland，P.W.（2000）。测试的总体不变性和公平性：基本理论和线性案例。《教育测量杂志》，37（4），281-306·doi:10.1111/j.1745-3984.2000.tb01088.x
[12]	新泽西州多兰斯、T·摩西和；Eignor，D.（2011）。平衡考试成绩：走向最佳实践。A.A.von Davier（编辑），测试等值、缩放和链接的统计模型（第21–42页）。纽约：斯普林格。
[13]	新泽西州Dorans、M.Pommerich和；Holland，P.W.（编辑）（2007年）。链接和对齐分数和刻度。纽约：斯普林格·Zbl 1183.62195号
[14]	Duong，M.Q.和；von Davier，A.A.（2012年）。观察得分等同于异质目标人群。国际测试杂志，12（3），224–251·网址：10.1080/15305058.2011.620725
[15]	ETS（2011）。LOGLIN/KE软件版本2[计算机软件]。普林斯顿：ETS。
[16]	Feuer，M.J.、Holland，P.W.、Green，B.F.、Bertental，M.W.和；Hemphill，F.C.（编辑）（1999年）。不常见的措施：教育考试之间的对等和联系（国家研究委员会教育考试对等和联系委员会的报告）。华盛顿：美国国家科学院出版社。
[17]	哈伯曼，S.J.（2011）。使用指数族进行等值。A.A.von Davier（编辑），测试等值、缩放和链接的统计模型（第125-140页）。纽约：斯普林格。
[18]	Holland，P.W.和；新泽西州多兰斯（2006）。链接和等值。R.L.Brennan（编辑），《教育测量》（第四版，第189-220页）。韦斯特波特：普雷格。
[19]	Holland，P.W.和；Hoskens，M.（2003）。作为一阶项目反应理论的经典测试理论：应用于可能非平行测试的真实分数预测。《心理测量学》，68、123–149·Zbl 1306.62430号 ·doi:10.1007/BF02296657
[20]	Holland，P.W.和；Thayer，D.T.（1987）。关于使用对数线性模型拟合离散概率分布的说明（ETS研究报告编号RR-87-31）。普林斯顿：ETS。
[21]	Holland，P.W.和；Thayer，D.T.（1989）。等值分数分布的核心方法（ETS研究报告编号89-07）。普林斯顿：ETS。
[22]	Holland，P.W.和；Thayer，D.T.（2000）。离散测试分数分布的单变量和双变量对数线性模型。《教育与行为统计杂志》，第25期，第133-183页·兹伯利02340817 ·doi:10.3102/10769986025002133
[23]	Holland，P.W.和；Wainer，H.（1993）。差异项目功能。希尔斯代尔：埃尔鲍姆。
[24]	Jiang，Y.、von Davier，A.A.和；Chen，H.（2012）。评估等值结果：链式内核等值的相对误差百分比。《教育测量杂志》，49，39–58·doi:10.1111/j.1745-3984.2011.00159.x
[25]	卡拉巴索斯（Karabatsos，G.）；Walker，S.G.（2011年）。用于测试等值的贝叶斯非参数模型。A.A.von Davier（编辑），测试等值、缩放和链接的统计模型（第175-185页）。纽约：斯普林格。
[26]	医学博士肯德尔；Stuart，A.（1977年）。高级统计学理论（第四版）。纽约：麦克米伦出版社·Zbl 0353.62013.中
[27]	M.J.科伦；Brennan，R.J.（2004）。测试等值：方法和实践（第二版）。纽约：斯普林格·兹比尔1059.62120
[28]	Lee，Y.和；von Davier，A.A.（2013年出版）。通过质量控制图、基于模型的方法和时间序列技术监控量表分数随时间的变化。心理测量学·Zbl 1284.62722号
[29]	Lee，Y.-H.，&；von Davier，A.A.（2011年）。通过替代核进行等式运算。A.A.von Davier（编辑），测试等值、缩放和链接的统计模型（第159-173页）。纽约：斯普林格。
[30]	Li，D.，Jiang，Y.和；von Davier，A.A.（2012年）。一系列IRT真实分数等值的准确性和一致性。《教育测量杂志》，49，167–189·doi:10.1111/j.1745-3984.2012.00167.x
[31]	Li，D.，Li，S.和；von Davier，A.A.（2011年）。应用时间序列分析来检测尺度漂移。A.A.von Davier（编辑），测试等值、缩放和链接的统计模型（第381-398页）。纽约：斯普林格。
[32]	Liang，L.，Dorans，N.J.和；Sinharay，S.（2009）。考生的第一语言及其与等值的关系（ETS研究报告编号RR-09-05）。普林斯顿：ETS。
[33]	Livingston，S.A.（2004）。等式测试分数（无IRT）。普林斯顿：教育测试服务。
[34]	Lord、F.M.和；Novick，M.R.（1968年）。心理测试成绩的统计理论。阅读：艾迪森·卫斯理·Zbl 0186.53701号
[35]	Morris，C.N.（1982年）。在测试等值的基础上。在P.W.荷兰&amp；D.B.Rubin（编辑），《测试等值》（第9-49页）。纽约：学术出版社。
[36]	摩西·T·；Holland，P.W.（2008）。对数线性平滑模型的选择策略对等值函数的影响（ETS研究报告编号RR-08-25）。普林斯顿：ETS。
[37]	摩西·T·；von Davier，A.A.（2011年）。用于对数线性平滑的SAS IML宏应用了心理测量。应用心理测量，35（3），250-251·doi:10.1177/0146621610373255
[38]	Qian，J.、von Davier，A.A.和；姜瑜（2013年提交）。使用多种形式实现稳定的评估量表——在IRT链接中对测试样本进行加权。定量心理学的新发展：第77届心理测量学会国际会议记录。纽约：斯普林格。
[39]	Rao，C.R.（1973）。线性统计推断及其应用（第二版）。纽约：Wiley·Zbl 0256.6202号
[40]	Rubin，D.（1982）。关于“观察分数测试等值：对一些ETS等值程序的数学分析”的讨论。在P.W.Holland&&；D.B.Rubin（编辑），测试等值（第51–54页）。纽约：学术出版社。
[41]	Sinharay，S.、Haberman，S.和Holland，P；Lewis，C.（2012）。关于在等值中选择锚定测试的注释（ETS研究报告编号RR-12-14）。普林斯顿：ETS。
[42]	Sinharay，S.和；Holland，P.W.（2010）。NEAT设计的缺失数据假设及其对测试等值的影响。Psycholometrika，75309–327岁·Zbl 1234.62159号 ·doi:10.1007/s11336-010-9156-6
[43]	Sinharay，S.，Holland，P.W.和；von Davier，A.A.（2011年）。评估链和后分层等值方法的缺失数据假设。A.A.von Davier（编辑），测试等值、缩放和链接的统计模型（第381-398页）。纽约：斯普林格。
[44]	范德林登，W.J.（2000）。观测核等值的测试理论方法。《心理测量学》，65、437–456·Zbl 1291.62260号 ·doi:10.1007/BF02296337
[45]	van der Linden，W.J.（2011年）。局部观测-核心等值。A.A.von Davier（编辑），等式、缩放和链接的统计模型（第201–223页）。纽约：斯普林格。
[46]	von Davier，A.A.（2007年）。实际等值问题的潜在解决方案。在N.J.Dorans、M.Pommerich和；P.W.Holland（编辑），链接和校准分数和量表，纽约：Springer。
[47]	von Davier，A.A.（2010年）。观测核的测试等值：百分位秩、高斯核和IRT观测核等值方法。研讨会在佐治亚州雅典举行的心理测量学会国际会议上举行。
[48]	von Davier，A.A.（2011年A）。测试等值、缩放和链接的统计模型。纽约：斯普林格·Zbl 1205.62200号
[49]	von Davier，A.A.（2011年b）。从统计学角度看考试成绩相等。A.A.von Davier（编辑），《测试等值、缩放和链接的统计模型》（第1-17页）。纽约：斯普林格。
[50]	von Davier，A.A.（2011年c）。应用质量控制和数据挖掘技术监测量表分数。在M.Pechenizkiy、T.Calders、C.Conati、S.Ventura、C.Romero和；J.Stamper（编辑），《第四届教育数据挖掘国际会议论文集》，埃因霍温，2011年7月6日至8日。埃因霍温：埃因霍芬科技大学图书馆。
[51]	von Davier，A.A.（2012年）。国际标准化评估中的有效性问题以及对测试和抽样设计的影响。2012年3月，纽约州纽约市，在《教育评估、问责制和公平：全球有效性对话》上发表论文。
[52]	von Davier，A.A.、Fournier-Zajac，S.和；Holland，P.W.（2007）。使用核等式方法的Levine线性观测分数等式函数的等百分比版本（ETS研究代表编号RR-07-14）。普林斯顿：ETS。
[53]	von Davier，A.A.，荷兰，P.W；Thayer，D.T.（2004年a）。观测核等值的链和后分层方法：它们与种群不变性的关系。《教育测量杂志》，41（1），15-32·doi:10.1111/j.1745-3984.2004.tb01156.x
[54]	von Davier，A.A.，荷兰，P.W；Thayer，D.T.（2004年b）。测试等值的核心方法。纽约：斯普林格·Zbl 1038.62122号
[55]	冯·达维尔，A.A.，&amp；Kong，N.（2005）。非等价群设计线性等式的统一方法。《教育与行为统计杂志》，30（3），313–334·doi:10.3102/10769986030003313
[56]	von Davier，A.A.，&；Wilson，C.（2007）。IRT真实分数测试等值：假设和应用指南。《教育与心理测量杂志》，67（6），940-957·数字对象标识代码：10.1177/0013164407301543
[57]	Wang，T.（2011）。另一种连续化方法：连续对数线性方法。A.A.von Davier（编辑），测试等值、缩放和链接的统计模型（第141-158页）。纽约：斯普林格。
[58]	Wiberg，M.、van der Linden，W.J.和；von Davier，A.A.（2012年）。局部观测核等值。论文提交给温哥华国家教育计量委员会。
[59]	Zumbo，B.D.（2007年）。有效性：基本问题和统计方法。在C.R.Rao&amp；S.Sinharay（编辑），《统计手册：第26卷心理测量学》（第45-79页）。荷兰：爱思唯尔·Zbl 1256.91039号

此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配，可能包含数据转换错误。在某些情况下，zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献，而不要求完整或完全匹配。

任何	在任何地方
一个	内部文档标识符
澳大利亚	作者、编辑
人工智能	内部作者标识符
钛	标题
洛杉矶	语言
所以	来源
ab公司	回顾，摘要
第页	出版年份
车辆	评审员
复写的副本	MSC代码
美国犹他州	关键字
日期	文档类型(j个：期刊文章；b条：book；一：图书文章）

一&b条	逻辑和
一\|b条	逻辑或
!ab公司	逻辑不
美国广播公司*	右通配符
"ab c公司"	短语
(ab c公司)	圆括号

示例

领域

操作员

观察得分等值：概述。（英语） Zbl 1288.62194号

MSC公司：

关键词：

软件：

参考文献：

示例

领域

操作员

观察得分等值：概述。 （英语） Zbl 1288.62194号

MSC公司：

关键词：

软件：

参考文献：

观察得分等值：概述。（英语） Zbl 1288.62194号