×

潜在变量模型的贝叶斯比较:条件可能性与边际可能性。 (英语) 兹比尔1431.62551

摘要:对于具有潜在变量(或随机效应)的模型,典型的贝叶斯方法涉及直接对潜在变量和模型参数进行采样。因此,在模型定义的高级软件代码中(例如使用BUGS、JAGS、Stan),可能性被指定为潜在变量的条件。这可以引导研究人员通过条件似然进行模型比较,其中潜在变量被视为模型参数。然而,在其他情况下,典型的模型比较涉及潜在变量被整合出来的边际可能性。尽管这种区别会对利益比较产生很大影响,但它往往被忽视。在本文中,我们澄清并说明了这些问题,重点比较了心理测量建模中的条件偏差信息准则和边际偏差信息准则(DIC)以及渡边赤池信息准则(WAIC)。条件/边际差异对应于模型是否应预测数据中的集群或新集群(其中“集群”通常对应于更高级别的单位,如人或学校)。相应地,我们表明边际WAIC对应于离开-集群-退出交叉验证,而条件WAIC对应着离开-单元-退出。这些结果导致了关于标准在具有潜在变量的模型中的一般应用的建议。

MSC公司:

第62页,共15页 统计学在心理学中的应用
62B10型 信息理论主题的统计方面
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Celeux,G.、Forbes,F.、Robert,C.P.和Titterington,D.M.(2006年)。缺失数据模型的偏差信息标准。贝叶斯分析,1(4),651-673·Zbl 1331.62329号
[2] daSilva,M.A.、Bazán,J.L.和Huggins-Manley,A.C.(2019年)。灵敏度分析和使用贝叶斯模型比较标准在替代的多元体IRT模型之间进行选择。统计学模拟与计算通信,48(2),601-620·Zbl 07551455号
[3] De Boeck,P.(2008)。随机项目IRT模型。《心理测量学》,73533-559·Zbl 1284.62699号
[4] Denwood,M.J.(2016)。runjags:一个R包,为JAGS中的MCMC模型提供接口实用程序、模型模板、并行计算方法和附加发行版。《统计软件杂志》,71(9),1-25。10.18637/jss.v071.i09。
[5] Efron,B.(1986年)。预测规则的明显错误率有多大偏差?美国统计协会杂志,81,461-470·兹比尔06216.2073
[6] Fox,J.P.(2010)。贝叶斯项目反应模型:理论与应用。纽约州纽约市:斯普林格·Zbl 1271.62012年
[7] Furr,D.C.(2017)。解释性项目反应模型的贝叶斯和频率交叉验证方法。(未发表的博士论文)。加州大学伯克利分校。
[8] Gelfand,A.E.、Sahu,S.K.和Carlin,B.P.(1995)。正态线性混合模型的有效参数化。《生物特征》,82,379-488·Zbl 0832.62064号
[9] Gelman,A.、Carlin,J.B.、Stern,H.S.、Dunson,D.B.、Vehtari,A.、Rubin,D.B.等人(2013年)。贝叶斯数据分析(第三版)。纽约:查普曼和霍尔/CRC。
[10] Gelman,A.、Hwang,J.和Vehtari,A.(2014)。了解贝叶斯模型的预测信息标准。统计与计算,24997-1016·Zbl 1332.62090号
[11] Gelman,A.、Jakulin,A.、Pittau,M.G.和Su,Y.S.(2008)。logistic和其他回归模型的弱信息默认先验分布。应用统计年鉴,21360-1383·Zbl 1156.62017年
[12] Gelman,A.、Meng,X.L.和Stern,H.(1996)。通过实现差异对模型适合性进行后验预测评估。中国统计局,6733-807·Zbl 0859.62028号
[13] Gelman,A.和Rubin,D.B.(1992年)。使用多序列从迭代模拟中进行推断(讨论)。统计科学,7457-511·Zbl 1386.65060号
[14] Gronau,Q.F.和Wagenmakers,E.J.(2018年)。贝叶斯的局限性为模型选择留出了一个交叉验证。计算大脑与行为,2(1),1-11。
[15] Hoeting,J.A.、Madigan,D.、Raftery,A.E.和Volinsky,C.T.(1999)。贝叶斯模型平均:教程。统计科学,14382-417·兹比尔1059.62525
[16] Kang,T.、Cohen,A.S.和Sung,H.J.(2009年)。多模项目的模型选择指数。应用心理医学,35499-518。
[17] Kaplan,D.(2014)。社会科学的贝叶斯统计。纽约州纽约市:吉尔福德出版社。
[18] Lancaster,T.(2000)。1948年以来的附带参数问题。《计量经济学杂志》,95391-413·Zbl 0967.62099号
[19] Levy,R.和Mislevy,R.J.(2016)。贝叶斯心理测量模型。佛罗里达州博卡拉顿:查普曼和霍尔·Zbl 1337.62003号
[20] Li,F.、Cohen,A.S.、Kim,S.H.和Cho,S.J.(2009年)。混合二分IRT模型的模型选择方法。《应用心理测量》,33,353-373。
[21] Li,L.,Qui,S.和Feng,C.X.(2016)。结合IS和WAIC,在贝叶斯潜在变量模型中近似交叉验证预测评估。统计与计算,26,881-897·Zbl 1505.62248号
[22] Lu,Z.H.、Chow,S.M.和Loken,E.(2017年)。因子分析模型的贝叶斯模型和频率模型选择方法的比较。《心理学方法》,22(2),361-381。
[23] Lunn,D.、Jackson,C.、Best,N.、Thomas,A.和Spiegelhalter,D.(2012)。BUGS书:贝叶斯分析的实用介绍。纽约州纽约市:查普曼和霍尔/CRC。
[24] Lunn,D.、Thomas,A.、Best,N.和Spiegelhalter,D.(2000)。WinBUGS——贝叶斯建模框架:概念、结构和可扩展性。统计与计算,10325-337。
[25] Luo,U.和Al-Harbi,K.(2017年)。LOO和WAIC作为IRT模型选择方法的性能。心理测试和评估模型,59183-205。
[26] Marshall,E.C.和Spiegelholter,D.J.(2007年)。识别贝叶斯层次模型中的异常值:一种基于仿真的方法。贝叶斯分析,2(2),409-444·Zbl 1331.62032号
[27] McElreath,R.(2015)。统计反思:贝叶斯课程,R和Stan中有例子。纽约州纽约市:查普曼和霍尔/CRC。
[28] Merkle,E.C.和Rosseel,Y.(2018年)。blavaan:通过参数展开的贝叶斯结构方程模型。统计软件杂志,85(4),1-30。
[29] Millar,R.B.(2009)。使用DIC和贝叶斯因子比较过分散计数数据的分层贝叶斯模型。生物统计学,65,962-969·Zbl 1172.62054号
[30] Millar,R.B.(2018)。使用WAIC和交叉验证对层次模型的预测损失进行条件与边际估计。统计与计算,28,375-385·Zbl 1384.62093号
[31] Mislevy,R.J.(1986)。项目反应模型中的贝叶斯模式估计。《心理测量学》,51177-195年·兹比尔0596.62114
[32] Muthén,B.和Asprouhov,T.(2012年)。贝叶斯结构方程建模:实质理论的更灵活表示。心理学方法,17,313-335。
[33] Navarro,D.(2018)。魔鬼与深海之间:科学判断与统计模型选择之间的紧张关系。计算大脑与行为,2(1),28-34。
[34] Naylor,J.C.和Smith,A.F.(1982年)。后验分布有效计算方法的应用。英国皇家统计学会学报C(应用统计学),31214-225·Zbl 0521.65017号
[35] Neyman,J.和Scott,E.L.(1948年)。基于部分一致观察结果的一致估计。《计量经济学》,16,1-32·Zbl 0034.07602号
[36] O'Hagan,A.(1976年)。关于后关节和边缘模式。生物特征,63329-333·兹比尔0332.62030
[37] Piironen,J.和Vehtari,A.(2017年)。贝叶斯预测方法在模型选择中的比较。统计与计算,27711-735·Zbl 1505.62321号
[38] Pinheiro,J.C.和Bates,D.M.(1995)。非线性混合效应模型中对数似然函数的近似。计算图形与统计杂志,4,12-35。
[39] 普卢默(2003)。JAGS:使用吉布斯抽样分析贝叶斯图形模型的程序。K.Hornik,Leisch,F.&Zeileis,A.(编辑),第三届分布式统计计算国际研讨会论文集。
[40] Plummer,M.(2008)。贝叶斯模型比较的惩罚损失函数。生物统计学,9(3),523-539·兹比尔1143.62003
[41] Rabe-Hesketh,S.、Skrondal,A.和Pickles,A.(2005)。具有嵌套随机效应的有限和离散因变量模型的最大似然估计。《计量经济学杂志》,128(2),301-323·Zbl 1336.62079号
[42] Raftery,A.E.和Lewis,S.M.(1995年)。迭代次数、收敛诊断和通用Metropolis算法。伦敦:查普曼和霍尔。
[43] Raudenbush,S.W.和Bryk,A.S.(2002年)。层次线性模型:应用和数据分析方法(第二版)。千橡树,加利福尼亚州:Sage·Zbl 1001.62004号
[44] Rosseel,Y.(2012)。lavan:结构方程建模的R包。统计软件杂志,48(2),1-36。
[45] Song,X.Y.和Lee,S.Y.(2012)。基本和高级贝叶斯结构方程建模:在医学和行为科学中的应用。英国奇切斯特:Wiley·Zbl 1282.62056号
[46] Spiegelhalter,D.J.、Best,N.G.、Carlin,B.P.和van der Linde,A.(2002)。模型复杂度和拟合度的贝叶斯度量。英国皇家统计学会期刊系列,B64,583-639·Zbl 1067.62010年
[47] 斯皮尔伯格,C.(1988)。州际愤怒表达清单研究版[计算机软件手册]。佛罗里达州:敖德萨。
[48] Stan开发团队。(2014). 斯坦建模语言用户指南和参考手册,2.5.0版[计算机软件手册]。http://mc-stan.org/。
[49] Trevisani,M.和Gelfand,A.E.(2003)。预期边际对数似然数之间的不等式,以及基于似然数的模型复杂性和比较度量的含义。加拿大统计杂志,31239-250·Zbl 1042.62027
[50] Vansteelandt,K.(2000年)。情境化人格心理学的形式模型(未发表的博士论文)。比利时:鲁汶-鲁汶大学。
[51] Vehtari,A.、Gelman,A.和Gabri,J.(2016)。loo:贝叶斯模型的高效leave-on-out交叉验证和WAIC。R包版本0.1.6。https://github.com/stan-dev/loo。 ·Zbl 1505.62408号
[52] Vehtari,A.、Gelman,A.和Gabry,J.(2017)。使用leave-on-out交叉验证和WAIC进行实用贝叶斯模型评估。统计与计算,271413-1432·Zbl 1505.62408号
[53] Vehtari,A.、Mononen,T.、Tolvanen,V.、Sivula,T.和Winther,O.(2016)。高斯隐变量模型的贝叶斯遗漏交叉验证近似。机器学习研究杂志,17,1-38·Zbl 1370.62020年
[54] Vehtari,A.、Simpson,D.P.、Yao,Y.和Gelman,A.(2018年)。“贝叶斯的局限性为模型选择留出了一个交叉验证”的局限性。计算大脑与行为,2(1),22-27。
[55] Watanabe,S.(2010年)。奇异学习理论中贝叶斯交叉验证的渐近等价性和广泛适用的信息准则。机器学习研究杂志,11,3571-3594·Zbl 1242.62024号
[56] 怀特,I.R.(2010)。simsum:模拟研究分析,包括蒙特卡罗误差。《统计杂志》,10369-385。
[57] Wicherts,J.M.、Dolan,C.V.和Hessen,D.J.(2005)。测试表现中的定型威胁和群体差异:测量不变性问题。《人格与社会心理学杂志》,89(5),696-716。
[58] Yao,Y.、Vehtari,A.、Simpson,D.和Gelman,A.(2018年)。使用叠加平均贝叶斯预测分布(讨论)。贝叶斯分析,13917-1007。https://doi.org/10.1214/17-BA1091。 ·Zbl 1407.62090号 ·doi:10.1214/17-BA1091
[59] Zhang,X.,Tao,J.,Wang,C.,&Shi,N.Z.(2019年)。多级IRT模型的贝叶斯模型选择方法:五种基于DIC的指数的比较。《教育测量杂志》,56,3-27。
[60] Zhao,&Severini,T.A.(2017)。综合似然计算方法。计算统计学,32,281-313·Zbl 1417.65059号
[61] Zhu,X.和Stone,C.A.(2012)。性能评估应用中备选分级响应模型的贝叶斯比较。教育和心理测量,7(2),5774-799。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。