×

数据增强、频率估计和多项式logit模型的贝叶斯分析。 (英语) Zbl 1247.60109号

摘要:我们描述了一种为多项式logit模型选择Metropolis-Hastings建议分布的简便方法。这涉及到两个关键思想。首先,多项式logit模型具有一种潜在的变量表示,类似于J.H.阿尔伯特S.芯片【美国法律总汇第88号,第422号,669–679页(1993年;Zbl 0774.62031号)]用于probit回归。对于具有极值误差的线性模型,增加潜在变量以完全数据似然代替多项式logit似然函数。虽然该模型没有共轭先验,但很容易获得参数的最小二乘估计。最小二乘估计的渐近采样分布是具有已知方差的高斯分布。本文的第二个关键思想是通过对估计器而不是完整数据集进行条件处理来生成Metropolis-Hastings建议分布。由此产生的采样器具有所谓的定制或近似Metropolis-Hastings采样器的许多优点。然而,由于建议分布是以封闭形式提供的,因此可以在不使用数值方法探索后验分布的情况下实现。该算法在几何上遍历收敛,计算量小,并且需要最少的用户输入。研究了取样器混合速度的改进。该算法还应用于部分学分模型,该模型描述了1998年国家教育进步评估中的有序项目响应数据。简要讨论了它在层次模型和泊松回归中的应用。

MSC公司:

60年22日 马尔可夫链中的计算方法
2015年1月62日 贝叶斯推断
62D05型 抽样理论、抽样调查
10层62层 点估计
65二氧化碳 蒙特卡罗方法

软件:

漏洞
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Abe M(1999)离散选择数据的广义加性模型。《公交车经济统计》17:271–284·Zbl 1006.91506号
[2] Agresti A(1990)分类数据分析。纽约威利·Zbl 0716.62001号
[3] Albert J(1992)使用吉布斯抽样对正常卵形项目响应曲线的贝叶斯估计。教育统计杂志17:251–269
[4] Albert JH,Chib S(1993)二值和多值响应数据的贝叶斯分析。美国统计协会杂志88:669–679·Zbl 0774.62031号 ·doi:10.1080/01621459.1993.10476321
[5] Allen NL、Donoghue JR、Schoeps TL(2000)NAEP 1998年技术报告。技术代表NCES 2001-509,美国教育部
[6] Baker SG(1994)多项式-泊松变换。统计学家43:495–504·Zbl 0843.73067号 ·doi:10.307/2348134
[7] Barnard J、McCulloch R、Meng X-L(2000),根据标准偏差和相关性对协方差矩阵进行建模,并应用于收缩。统计Sin 10(4):1281–1311·Zbl 0980.62045号
[8] Bradlow ET,Wainer H,Wang X(1999),测试样本的贝叶斯随机效应模型。《心理测量学》64(2):153–168·doi:10.1007/BF02294533
[9] Chen Z,Kuo L(2001)关于随机效应多项式logit模型估计的注记。美国统计局55:89–95·doi:10.1198/00031300175358545
[10] Chib S、Greenberg E(1995)《理解大都会——黑斯廷斯算法》。美国统计局49:327–335
[11] Cox DR,Oakes D(1984)生存数据分析。查普曼&纽约霍尔
[12] Dempster AP、Laird NM、Rubin DB(1977)通过EM算法从不完整数据中获得最大似然(C/R:p 22–37)。J R Stat Soc Ser B Methodol公司39:1–22
[13] Foster DP、Stine RA、Waterman RP(1998)《使用回归的商业分析》。柏林施普林格
[14] Frühwirth-Schnatter S,Frü.hwirth R(2007)辅助混合抽样及其在逻辑模型中的应用。计算统计数据分析51:3509–3528·Zbl 1161.62387号 ·doi:10.1016/j.csda.2006.10.006
[15] Frühwirth-Schnatter S,Wagner H(2006)参数驱动计数时间序列模型的辅助混合采样及其在状态空间建模中的应用。生物医学93:827–841·Zbl 1436.62421号 ·doi:10.1093/biomet/93.4.827
[16] Gelman A,Gilks WR,Roberts GO(1997)随机游走Metropolis算法的弱收敛性和最优缩放。Ann Appl Probab 7(1):110–120·Zbl 0876.60015号 ·doi:10.1214/aoap/1034625254
[17] Gilks WR,Wild P(1992)吉布斯采样的自适应拒绝采样。应用统计41:337–348·Zbl 0825.62407号 ·doi:10.2307/2347565
[18] Hastie T、Tibshirani R、Friedman J(2001)《统计学习的要素》。柏林施普林格·Zbl 0973.62007号
[19] Hastings WK(1970)使用马尔可夫链的蒙特卡罗采样方法及其应用。生物特征57:97–109·Zbl 0219.65008号 ·doi:10.1093/biomet/57.1.97
[20] Higdon DM(2001)“数据增强的艺术”讨论。J计算图统计10(1):69–74·doi:10.1198/10618600152418737
[21] Holmes CC,Held L(2006)二元和多项式回归的贝叶斯辅助变量模型。贝叶斯分析1(1):145–168·Zbl 1331.62142号 ·doi:10.1214/06-BA105
[22] Johnson NL,Kotz S,Balakrishnan N(1995)连续单变量分布,第2版,第2卷。Wiley Interscience,萨默塞特·Zbl 0821.62001号
[23] Johnson VE,Albert JH(1999)顺序数据建模。柏林施普林格
[24] Jones GL,Hobert JP(2001)《通过马尔可夫链蒙特卡罗对难处理概率分布的诚实探索》。统计科学16(4):312–334·Zbl 1127.60309号 ·doi:10.1214/ss/1015346317
[25] Lavine M(2003)边际遍历定理。收录:Bernardo JM、Bayarri MJ、Berger JO、Dawid AP、Heckerman D、Smith AFM、West M(eds)Bayesian statistics,第7卷。牛津大学出版社,牛津,第577-586页
[26] Le Cam LM,Yang GL(2000)统计学中的渐近:一些基本概念。柏林施普林格·Zbl 0952.62002号
[27] Liu JS,Wong WH,Kong A(1994)吉布斯采样器的协方差结构及其在估计量和增强方案比较中的应用。生物特征81:27–40·Zbl 0811.62080号 ·doi:10.1093/biomet/81.1.27
[28] Liu JS,Wong WH,Kong A(1995)吉布斯采样器不同扫描的协方差结构和收敛速度。J R Stat Soc Ser B Methodol杂志57:157–169·Zbl 0811.60056号
[29] Liu JS,Wu YN(1999)数据增强的参数扩展。美国统计协会94:1264–1274·Zbl 1069.62514号 ·doi:10.1080/01621459.1999.10473879
[30] Lord FM,Novick MR(1968),心理测试分数的统计理论。Addison Wesley,雷丁·Zbl 0186.53701号
[31] McCullagh P,Nelder JA(1989)《广义线性模型》,第2版。查普曼&纽约霍尔·Zbl 0744.62098号
[32] McCulloch R,Rossi PE(1994)多项式概率模型的精确似然分析。《经济学杂志》64:207–240·doi:10.1016/0304-4076(94)90064-7
[33] McFadden D(1974)定性选择行为的条件逻辑分析。摘自:Zarembka P(eds)《计量经济学前沿》。都柏林学术出版社,第105–142页
[34] Meng X-L,van Dyk DA(1999)通过条件和边缘增强寻求有效的数据增强方案。生物医学86(2):301–320·Zbl 1054.62505号 ·doi:10.1093/biomet/86.2.301
[35] Mengersen KL,Tweedie RL(1996)黑斯廷斯和大都会算法的收敛速度。安统计24:101–121·Zbl 0854.60065号 ·doi:10.1214/aos/1033066201
[36] Metropolis N、Rosenbluth AW、Rosenbruth MN、Teller AH和Teller E(1953)快速计算机器的状态方程计算。化学物理杂志21:1087–1092·数字对象标识代码:10.1063/1.1699114
[37] Muraki E(1992)广义部分信用模型:EM算法的应用。应用心理测量16:159–176·doi:10.1177/014662169201600206
[38] Neal RM(2003)切片取样。Ann Stat 31(3):705–767·Zbl 1051.65007号 ·doi:10.1214/aos/1056562461
[39] Patz R,Junker BW(1999)项目反应模型的马尔可夫链蒙特卡罗方法的直接方法。J Educe Behav统计24:146–178
[40] Rosenthal JS(1995)马尔可夫链蒙特卡罗的少数化条件和收敛速度(corr:95v90 p 1136)。美国统计协会J Am Stat Assoc 90:558–566·Zbl 0824.60077号 ·doi:10.1080/01621459.1995.10476548
[41] Rousseeuw PJ,Molenberghs G(1994)相关矩阵的形状。美国统计局48:276–279
[42] Rubin DB(1984)应用统计学家的贝叶斯合理相关频率计算。安统计12:1151-1172·Zbl 0555.62010号 ·doi:10.1214/aos/1176346785
[43] Scott SL,Ip EH(2002),潜在变量层次模型中的经验贝叶斯和项目聚类效应:来自国家教育进步评估的案例研究。美国统计协会97(458):409–419·Zbl 1073.62512号 ·doi:10.1198/016214502760046961
[44] Spiegelhalter DJ、Thomas A、Best NG、Gilks WR(1996)BUGS:使用吉布斯抽样的贝叶斯推断,0.5版(ii版)。http://www.mrc-bsu.cam.ac.uk/bugs
[45] Tanner MA,Wong WH(1987)通过数据增强计算后验分布(c/r:P 541-550)。美国统计协会J Am Stat Assoc 82:528–540·doi:10.1080/01621459.1987.10478458
[46] Tierney L(1994)马尔可夫链用于探索后验分布(光盘:P1728-1762)。Ann Stat 22:1701–1728年·Zbl 0829.62080号 ·doi:10.1214操作系统/117625750
[47] 训练KE(2003)离散选择方法与模拟。剑桥大学出版社,纽约。网址:http://elsa.berkeley.edu/books/choice2.html ·Zbl 1047.62098号
[48] Tüchler R(2008)使用辅助混合抽样的逻辑模型的贝叶斯变量选择。J计算图表统计17(1):76–94·doi:10.1198/106186008X289849
[49] van Dyk DA,Meng X-L(2001)《数据增强的艺术》(光盘:P 51–111)。J计算图统计10:1–50·doi:10.1198/10618600152418584
[50] Wainer H、Bradlow ET、Du Z(2000)《Testlet响应理论:在基于测试的自适应测试中有用的第三方物流模型的模拟》。内容:计算机自适应测试:理论与实践。Kluwer Academic Publishers,多德雷赫特,第245-269页
[51] Zellner A(1997)贝叶斯矩量法(BMOM):理论与应用。高级经济12:85–105·doi:10.1108/S0731-9053(1997)0000012005
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。