×

具有未知浓度参数的Dirichlet过程混合模型的采样:大数据实现中的混合问题。 (英文) Zbl 1332.62093号

摘要:我们考虑了一个一般的带浓度参数的破胶Dirichlet过程混合模型的马尔可夫链蒙特卡罗抽样问题。本文介绍了一种Gibbs采样算法,该算法结合了S.G.沃克【Commun.Stat.,Simulation Compute.36,No.1,45-54(2007;Zbl 1113.62058号)]以及O.帕帕斯皮利奥普洛斯G.O.罗伯茨【生物统计学95,第1期,169–186页(2008年;兹比尔1437.62576)]. 我们的通用算法是作为高效的开源C++软件实现的,作为R包提供,并且基于类似于O.帕帕斯皮利奥普洛斯【关于Dirichlet混合模型后验抽样的注释。华威大学工作论文(2008),http://www2.warwick.ac.uk/fac/sci/statistics/crism/research/2008/08-20wv2.pdf]并由实施C.姚等【《贝叶斯非参数隐马尔可夫模型在基因组学中的应用》,J.R.Stat.Soc.,Ser.B,Stat.Methodol.73,No.1,37-57(2011),http://www.jstor.org/stable/41057424]. 我们讨论了在大型数据集中实现这种性质的MCMC采样器良好混合的困难,并研究了初始化的敏感性。此外,我们还考虑了当添加额外的层次层以便在\(\alpha\)上进行联合推断时的挑战。为了克服这些困难,我们引入了一种新的标签切换运动,并计算了后边缘分割。我们的工作使用剖面回归应用程序进行了说明,在该应用程序中,我们展示了合成和真实示例的良好混合行为。

MSC公司:

2015年1月62日 贝叶斯推断
60年22日 马尔可夫链中的计算方法
60G57型 随机测量
62D05型 抽样理论、抽样调查
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Antoniak,C.E.:Dirichlet过程与贝叶斯非参数问题应用的混合。Ann.Stat.2(6),1152-1174(1974)·兹比尔0335.60034 ·doi:10.1214/aos/1176342871
[2] Bigelow,J.L.,Dunson,D.B.:功能预测因子的贝叶斯半参数联合模型。《美国统计协会期刊》104(485),26-36(2009)·Zbl 1388.62181号 ·doi:10.1198/jasa.2009.0001
[3] Blackwell,D.,MacQueen,J.B.:通过Polya Urn Schemes的Ferguson分配。Ann.Stat.1(2),353-355(1973)·Zbl 0276.62010 ·doi:10.1214/aos/1176342372
[4] 邓森,D.B.:随机效应的非参数贝叶斯局部分割模型。生物特征96(2),249-262(2009)·Zbl 1163.62084号 ·doi:10.1093/biomet/asp021
[5] Dunson,D.B.,Herring,A.B.,Siega-Riz,A.M.:关于预测聚类反应密度变化的贝叶斯推断。《美国统计协会期刊》103(484),1508-1517(2008)·兹比尔1286.62092 ·doi:10.1198/01621450080001039
[6] Escobar,M.D.,West,M.:使用混合物的贝叶斯密度估计和推断。《美国统计协会期刊》90(430),577-588(1995)·Zbl 0826.62021号 ·网址:10.1080/01621459.1995.10476550
[7] Ferguson,T.S.:一些非参数问题的贝叶斯分析。Ann.Stat.1(2),209-230(1973)·Zbl 0255.62037号 ·doi:10.1214/aos/1176342360
[8] Fritsch,A.,Ickstadt,K.等人:基于后验相似矩阵的改进聚类标准。贝叶斯分析。4(2), 367-391 (2009) ·Zbl 1330.62249号 ·doi:10.1214/09-BA414
[9] Hastie,D.I.、Liverani,S.、Azizi,L.、Richardson,S.和Stücker,I.:一种半参数方法,用于评估与多维暴露特征相关的风险函数:吸烟和肺癌的应用。BMC医学研究方法。13, 129 (2013). doi:10.1186/1471-2288-13-129·doi:10.1186/1471-2288-13-129
[10] Ishwaran,H.,James,L.F.:突破先验的吉布斯采样方法。《美国统计协会期刊》96(453),161-173(2001)·Zbl 1014.62006年 ·doi:10.1198/016214501750332758
[11] Jain,S.,Neal,R.M.:Dirichlet过程混合模型的一个分裂大马尔可夫链蒙特卡罗程序。J.计算。图表。《统计》第13卷,第158-182页(2004年)·doi:10.1198/1061860043001
[12] Jain,S.,Neal,R.M.:非共轭dirichlet过程混合模型的分解和合并组件。贝叶斯分析。2(3), 445-472 (2007) ·Zbl 1331.62145号 ·doi:10.1214/07-BA219
[13] Jasra,A.、Holmes,C.C.、Stephens,D.A.:马尔可夫链蒙特卡罗方法和贝叶斯混合建模中的标签切换问题。统计科学。20(1), 50-67 (2005) ·Zbl 1100.62032号 ·doi:10.1214/088342305000000016
[14] Kalli,M.、Griffin,J.E.、Walker,S.G.:切片取样混合模型。统计计算。21(1),93-105(2011)·Zbl 1256.65006号 ·doi:10.1007/s11222-009-9150-年
[15] Liverani,S.、Hastie,D.I.、Richardson,S.:PReMiuM:使用Dirichlet过程的剖面回归混合模型的R包,预印本可从arXiv:1303.2836(2013)获得
[16] Molitor,J.、Papathomas,M.、Jerrett,M.和Richardson,S.:贝叶斯轮廓回归及其在全国儿童健康调查中的应用。生物统计学11(3),484-498(2010)·Zbl 1437.62560号 ·doi:10.1093/biostatistics/kxq013
[17] 莫里托,J.,苏,J.G.,莫里托,N.T.,鲁比奥,V.G.,理查森,S.,哈斯蒂,D.,莫雷洛·罗斯奇,R.,杰雷特,M.:通过检查多污染物特征与贫困之间的关联来确定弱势群体。环境。科学。Technol公司。45(18), 7754-7760 (2011)
[18] Neal,R.M.:Dirichlet过程混合模型的马尔可夫链抽样方法。J.计算。图表。《法令》第9(2)、249(2000)条·Zbl 0826.62021号
[19] Papaspiliopoulos,O.:关于Dirichlet混合模型后验抽样的注释。技术报告8,CRISM论文(2008)·Zbl 1330.62249号
[20] Papaspiliopoulos,O.,Roberts,G.O.:Dirichlet过程层次模型的回顾性马尔可夫链蒙特卡罗方法。Biometrika 95(1),169-186(2008)·Zbl 1437.62576号
[21] Papathomas,M.,Molitor,J.,Richardson,S.,Riboli,E.,Vineis,P.:使用暴露风险概况检查多种风险因素的联合影响:非吸烟者的肺癌。环境。健康展望。11984-91(2011年)·doi:10.1289/ehp.1002118
[22] Papathomas,M.,Molitor,J.,Hoggart,C.,Hastie,D.I.,Richardson,S.:利用贝叶斯变量选择和Dirichlet过程探索遗传关联研究的数据:应用于搜索基因\[times\]×基因模式。遗传学。流行病。6(36), 663-674 (2012) ·doi:10.1002/gepi.21661
[23] Pitman,J.,Yor,M.:从稳定子函数导出的双参数Poisson-Dirichlet分布。安·普罗巴伯。25(2), 855-900 (1997) ·Zbl 0880.60076号 ·doi:10.1214/aop/1024404422
[24] Porteous,I.,Ihler,A.,Smyth,P.,Welling,M.:棒断裂表示中(耦合)无限混合模型的吉布斯采样。摘自:《第22届人工智能不确定性年会论文集》(UAI-06),弗吉尼亚州阿灵顿AUAI出版社(2006)·Zbl 0276.62010
[25] Richardson,S.,Green,P.J.:关于成分数量未知的混合物的贝叶斯分析。J.Royal Stat.Soc.,爵士。B Methodol公司。59(4), 731-792 (1997) ·Zbl 0891.62020号 ·数字标识代码:10.1111/1467-9868.00095
[26] Sethuraman,J.:Dirichlet先验的建设性定义。统计正弦。4, 639-650 (1994) ·Zbl 0823.62007号
[27] Ulker,Y.,Gunsel,B.,Cegil,A.T.:非参数贝叶斯混合模型的退火SMC采样器。IEEE信号处理。莱特。2011年3月18日至6日·doi:10.1109/LSP.2010.2072919
[28] Walker,S.G.:用切片对Dirichlet混合模型进行采样。Commun公司。统计-模拟。计算。36, 45-54 (2007) ·Zbl 1113.62058号 ·doi:10.1080/03610910601096262
[29] Yau,C.,Papaspiliopoulos,O.,Roberts,G.O.,Holmes,C.:贝叶斯非参数隐马尔可夫模型及其在基因组学中的应用。J.Royal Stat.Soc.,爵士。B统计方法。73, 37-57 (2011) ·Zbl 1411.62247号 ·文件编号:10.1111/j.1467-9868.2010.00756.x
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。