×

马尔可夫链蒙特卡罗方法和贝叶斯混合建模中的标签切换问题。 (英语) Zbl 1100.62032号

摘要:在过去十年中,人们对有限混合模型的贝叶斯分析的兴趣急剧增加。这主要是因为马尔可夫链蒙特卡罗(MCMC)方法的出现。虽然MCMC提供了一种从复杂统计模型中进行推断的便捷方法,但与混合物的MCMC分析相关的问题还有很多,可能尚未得到充分认识。这些问题主要是由对称先验下的分量不可识别引起的,这导致MCMC输出中出现所谓的标签切换。这意味着特定分量的遍历平均值将是相同的,因此对于推断来说是无用的。我们回顾了标签切换问题的解决方案,如人工可识别性约束、重新标记算法和标签不变损失函数。我们还回顾了为混合模型建议的各种MCMC抽样方案,并讨论了对先验规范的后验灵敏度。

MSC公司:

2015年1月62日 贝叶斯推断
65立方厘米40 马尔可夫链的数值分析或方法
65立方厘米05 蒙特卡罗方法
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Aitkin,M.(2001)。混合物的可能性和贝叶斯分析。统计建模1 287–304·Zbl 1078.62001号
[2] Bartlett,M.S.(1957年)。对D.V.Lindley统计悖论的评论。生物特征44 533–534·Zbl 0073.35702号
[3] Baum,L.E.和Petrie,T.(1966年)。有限状态马尔可夫链概率函数的统计推断。安。数学。统计师。37 1554–1563. ·Zbl 0144.40902号 ·doi:10.1214/aoms/1177699147
[4] Baum,L.E.、Petrie,T.、Soules,G.和Weiss,N.(1970年)。马尔可夫链概率函数统计分析中出现的一种最大化技术。安。数学。统计师。41 164–171. ·Zbl 0188.49603号 ·doi:10.1214/网址/1177797196
[5] Beal,M.J.、Ghahramani,Z和Rasmussen,C.E.(2002年)。无限隐马尔可夫模型。神经信息处理系统14(T.G.Diettrich,S.Becker和Z.Ghahramani,eds.)577-584。麻省理工学院出版社,马萨诸塞州剑桥。
[6] Bernardo,J.M.和Girón,F.J.(1988)。简单混合问题的贝叶斯分析。贝叶斯统计3(J.M.Bernardo、M.H.DeGroot、D.V.Lindley和A.F.M.Smith编辑)67–78。牛津大学出版社·Zbl 0706.62029号
[7] Boys,R.J.和Henderson,D.A.(2003年)。隐马尔可夫模型中推理的数据增强和边缘更新方案。纽卡斯尔大学技术报告。
[8] Boys,R.J.和Henderson,D.A.(2004年)。DNA序列分割的贝叶斯方法(带讨论)。生物统计学60 573–588·Zbl 1274.62728号 ·doi:10.1111/j.0006-341X.2004.00206.x
[9] Cappé,O.、Robert,C.P.和Rydén,T.(2001)。可逆跳跃MCMC收敛到生灭MCMC和更通用的连续时间采样器。巴黎多芬大学技术报告·Zbl 1063.62133号
[10] Cappé,O.、Robert,C.P.和Rydén,T.(2003)。可逆跳跃、生死和更一般的连续时间马尔可夫链蒙特卡罗采样器。J.R.统计社会服务。B统计方法。65 679–700. ·Zbl 1063.62133号 ·doi:10.1111/1467-9868.00409
[11] Casella,G.、Mengersen,K.L.、Robert,C.P.和Titterington,D.M.(2002)。适用于混合分布的完美采样器。J.R.统计社会服务。B统计方法。64 777–790. ·Zbl 1067.62028号 ·doi:10.1111/1467-9868.00360
[12] Celeux,G.(1997年)。S.Richardson和P.J.Green对“未知组分数混合物的贝叶斯分析”的讨论。J.罗伊。统计师。Soc.序列号。B 59 775–776·数字标识代码:10.1111/1467-9868.00095
[13] Celeux,G.(1998年)。混合物的贝叶斯推断:标签切换问题。在COMPSTAT 98 Proc。计算统计学(R.Payne和P.J.Green编辑)227–232。海德堡物理学·Zbl 0951.62018号
[14] Celeux,G.、Hurn,M.和Robert,C.P.(2000年)。混合后验分布的计算和推断困难。J.Amer。统计师。协会95 957–970·Zbl 0999.62020号 ·doi:10.2307/2669477
[15] Ciuperca,G.、Ridolfi,A.和Idier,J.(2003)。正态混合物的惩罚最大似然估计。扫描。J.统计。30 45–59. ·Zbl 1034.62018年 ·doi:10.111/1467-9469.00317
[16] Dellaportas,P.和Papageorgiou,I.(2004年)。具有未知分量数的多元混合法线。雅典大学技术报告。
[17] Dellaportas,P.、Stephens,D.A.、Smith,A.F.M.和Guttman,I.(1996)。使用双组分混合模型对围产儿死亡率进行的比较研究。贝叶斯生物统计学(D.A.Berry和D.K.Stangl编辑)601-616。纽约州德克尔。
[18] Dempster,A.、Laird,N.和Rubin,D.(1977年)。通过EM算法获得不完整数据的最大似然(讨论后)。J.罗伊。统计师。Soc.序列号。B 39 1–38·Zbl 0364.62022号
[19] Diebolt,J.和Robert,C.P.(1994年)。通过贝叶斯抽样估计有限混合分布。J.罗伊。统计师。Soc.序列号。B 56 363–375·Zbl 0796.62028号
[20] Escobar,M.D.和West,M.(1995)。使用混合物的贝叶斯密度估计和推断。J.Amer。统计师。协会90 577–588·Zbl 0826.62021号 ·doi:10.2307/2291069
[21] Fearnhead,P.(2004)。多变点问题的精确有效贝叶斯推理。兰卡斯特大学技术报告。
[22] Frühwirth-Schnatter,S.(2001)。经典和动态切换及混合模型的马尔可夫链蒙特卡罗估计。J.Amer。统计师。协会96 194–209·Zbl 1015.62022号 ·doi:10.19198/0162114501750333063
[23] Green,P.J.(1995)。可逆跳跃马尔可夫链蒙特卡罗计算和贝叶斯模型确定。生物特征82 711–732·Zbl 0861.62023号 ·doi:10.1093/biomet/82.4.711
[24] 格林,P.J.(2003)。跨维马尔可夫链蒙特卡罗。《高度结构化随机系统》(P.J.Green、N.L.Hjort和S.Richardson编辑)179-196。牛津大学出版社。
[25] Green,P.J.和Richardson,S.(2002年)。隐马尔可夫模型和疾病映射。J.Amer。统计师。协会97 1055–1070·Zbl 1046.62117号 ·doi:10.1198/016214502388618870
[26] Gruet,M.-A,Philippe,A.和Robert,C.P.(1999年)。指数混合估计的MCMC控制电子表格。J.计算。图表。统计师。8 298–317.
[27] 黑斯廷斯,W.K.(1970)。使用马尔可夫链的蒙特卡罗抽样方法及其应用。生物特征57 97–109·Zbl 0219.65008号 ·doi:10.1093/biomet/57.1.97
[28] Hurn,M.、Justel,A.和Robert,C.P.(2003年)。估计回归的混合。J.计算。图表。统计师。12 55–79. ·doi:10.1198/1061860031329
[29] Jasra,A.、Stephens,D.A.和Holmes,C.C.(2005年)。基于种群的可逆跳马尔可夫链蒙特卡罗。伦敦帝国理工学院技术报告·Zbl 1158.62019号
[30] Jennison,C.(1997)。S.Richardson和P.J.Green对“未知组分数混合物的贝叶斯分析”的讨论。J.罗伊。统计师。Soc.序列号。B 59 778–779·数字标识代码:10.1111/1467-9868.00095
[31] Liang,F.和Wong,W.H.(2001)。实参数进化蒙特卡罗及其在贝叶斯混合模型中的应用。J.Amer。统计师。协会96 653–666·Zbl 1017.62022号 ·doi:10.1198/016214501753168325
[32] Lindley,D.V.(1957)。统计悖论。生物特征44 187–192·Zbl 0084.35806号 ·doi:10.1093/biomet/44.1-2.179
[33] Liu,J.S.(2001)。科学计算中的蒙特卡罗策略。纽约州施普林格·兹比尔0991.65001
[34] Marin,J.-M.、Mengersen,K.L.和Robert,C.P.(2005)。混合分布的贝叶斯建模和推断。在贝叶斯模型和混合分布推断中。《统计手册》25(D.Dey和C.R.Rao编辑)。荷兰北部,阿姆斯特丹。
[35] McLachlan,G.J.和Peel,D.(2000)。有限混合模型。奇切斯特·威利·兹比尔0963.62061
[36] Mengersen,K.L.和Robert,C.P.(1996年)。混合物测试:贝叶斯熵方法(带讨论)。贝叶斯统计5(J.O.Berger、J.M.Bernardo、A.P.Dawid、D.V.Lindley和A.F.M.Smith编辑)255-276。牛津大学出版社。
[37] Neal,R.(1996)。使用回火过渡从多峰分布中取样。统计师。计算。4 353–366.
[38] 纽科姆·S(1886)。为了获得最佳结果而组合观测的广义理论。阿默尔。数学杂志。8 343–366.
[39] Pearson,K.(1894年)。对进化数学理论的贡献。菲洛斯。事务处理。罗伊。Soc.伦敦Ser。A 185 71–110。
[40] Postman,M.、Huchra,J.P.和Geller,M.J.(1986年)。北日冕地区大规模结构的探测。《天文学杂志》92 1238–1246。
[41] Rao,C.R.(1948)。生物分类问题中多重测量的应用(与讨论)。J.罗伊。统计师。Soc.序列号。B 10 159–203·Zbl 0034.07902号
[42] Richardson,S.和Green,P.J.(1997)。关于成分数量未知的混合物的贝叶斯分析(附讨论)。J.罗伊。统计师。Soc.序列号。B 59 731–792·Zbl 0891.62020号 ·数字标识代码:10.1111/1467-9868.00095
[43] Robert,C.P.(1997)。S.Richardson和P.J.Green对“未知组分数混合物的贝叶斯分析”的讨论。J.罗伊。统计师。Soc.序列号。B 59 758–764·doi:10.111/1467-9868.00095
[44] Robert,C.P.和Casella,G.(2004年)。蒙特卡洛统计方法,第二版,施普林格,纽约·Zbl 1096.62003年
[45] Robert,C.P.、Rydén,T.和Titterington,D.M.(2000)。通过可逆跳马尔可夫链蒙特卡罗方法在隐马尔可夫模型中进行贝叶斯推理。J.R.统计社会服务。B统计方法。62 57–75. ·Zbl 0941.62090号 ·doi:10.1111/1467-9868.00219
[46] Roeder,K.(1990年)。以超星系团和星系空洞为例的置信集密度估计。J.Amer。统计师。协会85 617–624·Zbl 0704.62103号 ·doi:10.2307/2289993
[47] Stephens,M.(1997a)。正态分布混合的贝叶斯方法。牛津大学统计系博士Phil论文。
[48] Stephens,M.(1997年b)。S.Richardson和P.J.Green对“未知组分数混合物的贝叶斯分析”的讨论。J.罗伊。统计师。Soc.序列号。B 59 768–769。
[49] Stephens,M.(2000年a)。成分数目未知的混合模型的贝叶斯分析——可逆跳跃方法的替代方法。安。统计师。28 40–74. ·Zbl 1106.62316号 ·doi:10.1214/aos/1016120364
[50] Stephens,M.(2000年b)。处理混合模型中的标签切换。J.R.统计社会服务。B统计方法。62 795–809. ·Zbl 0957.62020号 ·doi:10.1111/1467-9868.00265
[51] Tierney,L.(1994)。用于探索后验分布的马尔可夫链(带讨论)。安。统计师。22 1701–1762. JSTOR公司:·Zbl 0829.62080号 ·doi:10.1214/aos/1176325750
[52] Titterington,D.M.、Smith,A.F.M.和Makov,U.E.(1985)。有限混合分布的统计分析。奇切斯特·威利·Zbl 0646.62013.中
[53] West,M.(1997)。S.Richardson和P.J.Green对“未知组分数混合物的贝叶斯分析”的讨论。J.罗伊。统计师。Soc.序列号。B 59 783–784·数字标识代码:10.1111/1467-9868.00095
[54] Yeung,K.Y.、Fraley,C.、Murua,A.、Raftery,A.E.和Ruzzo,W.L.(2001)。基于模型的基因表达数据聚类和数据转换。生物信息学17 977–987。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。