卡罗琳·斯特罗布尔;朱莉娅·科普夫;阿希姆·泽利斯 Rasch树:一种检测Rasch模型中差异项功能的新方法。 (英语) Zbl 1322.62341号 心理测量学 80,第2期,289-316(2015). 总结:在Rasch模型中,已经提出了多种统计方法来检测差异项目功能(DIF)。大多数这些方法都是为了比较预先指定的焦点组和参考组,如男性和女性。另一方面,潜在类方法允许检测以前未知的显示DIF的组。然而,这种方法并不能根据人的特征直接解释群体。在这里,我们提出了一种新的基于模型递归分区的DIF检测方法,该方法可以被视为这两个极端之间的折衷。通过这种方法,可以检测出出现DIF的受试者群体,这些受试者不是预先指定的,而是由观察到的协变量组合而成的。这些群体是可以直接解释的,因此可以帮助产生关于DIF心理来源的假设。通过一个有指导意义的例子介绍了新方法的统计背景和结构,并进行了大量的模拟研究来支持和说明该方法的统计特性,然后将其应用于一般知识测验的经验数据。该方法的软件实现可在R系统中免费获得,用于统计计算。 引用于14文件 MSC公司: 第62页,共15页 统计学在心理学中的应用 62H30型 分类和区分;聚类分析(统计方面) 关键词:项目反应理论;IRT公司;Rasch模型;差异项目功能;DIF公司;测量恒等性;结构变化;基于模型的递归分区 软件:ltm公司;麦克卢斯特;R(右);电子风险管理;精神病院 PDF格式BibTeX公司 XML格式引用 \textit{C.Strobl}等人,《心理测量学》80,第2期,289--316(2015;Zbl 1322.62341) 全文: 内政部 链接 参考文献: [1] Andersen,E.(1972)。Rasch模型的拟合优度检验。《心理测量学》,第38期,第123-140页·Zbl 0276.62048号 ·doi:10.1007/BF02291180 [2] Andrews,D.W.K.(1993)。未知变化点的参数不稳定性和结构变化测试。《计量经济学》,61,821-856·Zbl 0795.62012号 ·doi:10.2307/2951764 [3] Ben-Shakhar,G.和Sinai,Y.(1991年)。多项选择测验中的性别差异:差异猜测倾向的作用。《教育测量杂志》,28(1),23-35·doi:10.1111/j.1745-3984.1991.tb00341.x [4] 伯恩鲍姆,A。;Lord,F.(编辑);Novick,M.(编辑),一些潜在特征模型及其在推断考生能力中的应用(1968年),阅读 [5] Boulesteix,A.L.(2006)。标称变量的最大选择二叉统计和二进制分割。《生物医学杂志》,48(5),838-848·Zbl 1442.62280号 ·doi:10.1002/bimj.200510191 [6] Breiman,L.、Friedman,J.、Olshen,R.和Stone,C.(1984)。分类和回归树。纽约:查普曼和霍尔出版社·Zbl 0541.62042号 [7] Cohen,A.和Bolt,D.(2005年)。差异项目功能的混合模型分析。教育测量杂志,42(3),133-148·doi:10.1111/j.1745-3984.2005.0007 [8] 多布拉,A。;Gehrke,J。;Brodley,C.E.(编辑);Danyluk,A.P.(编辑),分类树构建中的偏差修正,威廉姆斯学院,马萨诸塞州威廉斯敦,美国,圣马特奥 [9] Fischer,G.和Molenaar,I.(编辑)(1995年)。Rasch模型:基础、最新发展和应用。纽约:斯普林格·Zbl 0815.00010号 [10] Fraley,C.和Raftery,A.(2002年)。基于模型的聚类、判别分析和密度估计。《美国统计协会杂志》,97(458),611-631·Zbl 1073.62545号 ·doi:10.1198/016214502760047131 [11] Fraley,C.和Raftery,A.(2012年)。mclust:基于模型的聚类/正态混合建模。R包版本3.4.11。http://CRAN.R-project.org/package=mclust。 ·Zbl 0795.62012号 [12] Gelin,M.、Carleton,B.、Smith,M..和Zumbo,B.(2004年)。迷你哮喘生活质量问卷(MiniAQLQ)的维度和性别差异项目功能。社会指标研究,68,91-105·doi:10.1023/B:SOCI.000025580.54702.90 [13] Gustafsson,J.(1980)。测试并获得Rasch模型中的数据拟合。《英国数学与统计心理学杂志》,33(2),205-233·doi:10.1111/j.2044-8317.1980.tb00609.x [14] Hancock,G.和Samuelsen,K.(编辑)(2007年)。潜在变量混合模型的进展。夏洛特:信息时代。 [15] Hochberg,Y.和Tamhane,A.(编辑)(1987年)。多重比较程序。纽约:Wiley·Zbl 0731.62125号 [16] Hothorn,T.、Hornik,K.和Zeileis,A.(2006年)。无偏递归划分:一个条件推理框架。计算与图形统计杂志,15(3),651-674·doi:10.1198/106186006X133933 [17] Hothorn,T.和Lausen,B.(2003年)。关于最大选择秩统计量的精确分布。计算统计与数据分析,43(2),121-137·Zbl 1429.62542号 ·doi:10.1016/S0167-9473(02)00225-6 [18] Hothorn,T.和Zeileis,A.(2008)。广义最大选择统计。生物统计学,64(4),1263-1269·Zbl 1151.62086号 ·doi:10.1111/j.1541-0420.2008.00995.x [19] Hubert,L.和Arabie,P.(1985)。比较分区。分类杂志,2(1),193-218·doi:10.1007/BF01908075 [20] Kelderman,H.和MacReady,G.(1990年)。使用对数线性模型评估显性和隐性考生群体的差异项目功能。《教育测量杂志》,27(4),307-327·doi:10.1111/j.1745-3984.1990.tb00751.x [21] Koziol,J.(1991)。关于最大选择的X平方统计。生物统计学,47(4),1557-1561·doi:10.2307/2532406 [22] Liou,M.(1994)。更多关于Rasch模型中初等对称函数的高阶导数的计算。应用心理测量,18(1),53-62·doi:10.1177/014662169401800105 [23] Maij-de Meij,A.、Kelderman,H.和Van der Flier,H.(2008)。将混合项目反应理论模型与人格问卷数据拟合:表征潜在类别并调查改进预测的可能性。应用心理测量,32(8),611-631·doi:10.1177/0146621607312613 [24] Mair,P.和Hatzinger,R.(2007年)。扩展Rasch建模:R.统计软件杂志中IRT模型应用的eRm包,20,9。http://www.jstatsoft.org/v20/i09/。 [25] Mair,P.、Hatzinger,R.和Maier,M.(2012)。eRm:扩展Rasch建模。R包版本0.15-0。http://CRAN.R-project.org/package=eRm。 [26] Marcus,R.、Peritz,E.和Gabriel,K.(1976年)。封闭测试程序,特别参考有序方差分析。《生物特征》,63(3),655-660·Zbl 0353.62037号 ·doi:10.1093/biomet/63.3.655 [27] Masters,G.(1982年)。部分信用评分的Rasch模型。《心理测量学》,47(2),149-174·Zbl 0493.62094号 ·doi:10.1007/BF02296272 [28] Merkle,E.C.、Fan,J.和Zeileis,A.(2013年)。关于序数变量的测量不变性测试。《心理测量学》,即将出版·Zbl 1303.62106号 [29] Merkle,E.C.和Zeileis,A.(2013年)。无子群测量不变性检验:经典方法的推广。《心理测量学》,78(1),59-82·Zbl 1284.62733号 ·doi:10.1007/s11336-012-9302-4 [30] Miller,R.和Siegmund,D.(1982年)。最大选择卡方统计。生物统计学,38(4),1011-1016·Zbl 0502.62091号 ·doi:10.2307/2529881 [31] Milligan,G.和Cooper,M.(1986年)。层次聚类分析外部标准的可比性研究。多元行为研究,21(4),441-458·doi:10.1207/s15327906mbr2104_5 [32] Mislevy,R.和Verhelst,N.(1990年)。当不同的受试者采用不同的解决策略时,对项目反应进行建模。《心理测量学》,55(2),195-215·doi:10.1007/BF02295283 [33] Pedraza,O.、Graff-Radford,N.、Smith,G.、Ivnik,R.、Willis,F.、Petersen,R.和Lucas,J.(2009年)。波士顿命名测验在认知正常的非洲裔美国人和白人老年人中的项目功能差异。国际神经心理学会杂志,15(05),758-768·doi:10.1017/S1355617709990361 [34] Penfield,D.(2007年)。使用普通比值比估计器评估多体项目中的差异步长功能。《教育测量杂志》,44(3),187-210·数字对象标识代码:10.1111/j.1745-3984.2007.0034.x [35] Penfield,D.、Alvarez,K.和Lee,O.(2009年)。使用差异步骤功能分类法改进对多词项目中DIF的解释:一个示例。教育中的应用测量,22(1),61-78·doi:10.1080/08957340802558367 [36] Perkins,A.、Stump,T.、Monahan,P.和McHorney,C.(2006年)。MOS SF-36健康调查中人口统计学比较的差异项目功能评估。生活质量研究,15,331-348·doi:10.1007/s11136-005-1551-6 [37] R开发核心团队(2012年)。R: 用于统计计算的语言和环境。维也纳:R统计计算基金会。国际标准图书编号(ISBN)3-900051-07-0。http://www.R-project.org/。 [38] Rijmen,F.、Tuerlinckx,F.,De Boeck,P.和Kuppens,P.(2003)。项目反应理论的非线性混合模型框架。心理学方法,8(2),185-205·doi:10.1037/1082-989X.8.2.185 [39] Rizopoulos,D.(2006年)。ltm:用于潜在变量建模和项目响应分析的R包。统计软件杂志,17,5。http://www.jstatsoft.org/v17/i05/。 [40] Rizopoulos,D.(2012)。ltm:IRT下的潜在特征模型。R包版本0.9-9。http://CRAN.R-project.org/package=ltm。 [41] Rost,J.(1990)。潜在类中的Rasch模型:两种项目分析方法的集成。应用心理测量,14(3),271-282·doi:10.1177/014662169001400305 [42] Shih,Y.S.(2004年)。关于分类树中分裂选择偏差的注记。计算统计与数据分析,45(3),457-466·Zbl 1429.62264号 ·doi:10.1016/S0167-9473(03)00064-1 [43] Smit,J.、Kelderman,H.和Van der Flier,H.(2000)。混合Birnbaum模型:使用附带信息进行估计。心理研究方法在线,5,1-13。 [44] Strobl,C.、Boulesteix,A.L.和Augustin,T.(2007)。基于基尼指数的分类树无偏分割选择。计算统计与数据分析,52(1),483-501·兹比尔1452.62469 ·doi:10.1016/j.csda.2006.12.030 [45] Strobl,C.、Malley,J.和Tutz,G.(2009年)。递归分割简介:分类树、回归树、套袋林和随机林的原理、应用和特点。心理学方法,14(4),323-348·doi:10.1037/a0016973 [46] Strobl,C.、Wickelmaier,F.和Zeileis,A.(2011年)。通过递归分区说明布莱德雷-特里模型中的个别差异。《教育与行为统计杂志》,36(2),135-153。 [47] Trepte,S.和Verbeet,M.(编辑)(2010年)。德国Allgemeinbildung-Rekenntnisse aus dem SPIEGEL Studentenpisa-测试。威斯巴登:VS Verlag。 [48] Van den Noortgate,W.和De Boeck,P.(2005)。使用logistic混合模型评估和解释差异项目功能。《教育与行为统计杂志》,30(4),443-464·doi:10.3102/10769986030004443 [49] Westers,P.和Kelderman,H.(1992年)。检查由于项目难度和替代吸引力而导致的项目功能差异。《心理测量学》,57(1),107-118·doi:10.1007/BF02294661 [50] Woods,C.、Oltmanns,T.和Turkheimer,E.(2009年)。MIMIC模型DIF测试与非适应性和适应性人格时间表的说明。《精神病理学与行为评估杂志》,31,320-330·doi:10.1007/s10862-008-9118-9 [51] Zeileis,A.和Hornik,K.(2007年)。参数不稳定性的广义m-涨落检验。Neerlandica统计,61(4),488-508·兹比尔1152.62014 ·文件编号:10.1111/j.1467-9574.2007.00371.x [52] Zeileis,A.、Hothorn,T.和Hornik,K.(2008年)。基于模型的递归分区。计算与图形统计杂志,17(2),492-514·doi:10.1198/106186008X319331 [53] Zeileis,A.、Strobl,C.、Wickelmaier,F.和Kopf,J.(2012)。心理树:基于心理测量模型的递归划分。R包版本0.12-2。http://CRAN.R-project.org/package=精神树。 此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。