×

用于大数据贝叶斯分析的双平行蒙特卡罗。 (英语) Zbl 1430.62278号

摘要:本文提出了一种简单、实用、高效的MCMC算法,用于大数据的贝叶斯分析。该算法建议将大数据集划分为一些较小的子集,并提供了一种简单的方法来聚集子集后验以近似全数据后验。为了进一步加快计算速度,该算法采用人口随机近似蒙特卡罗算法(一种并行MCMC算法)从每个子集的后验点进行模拟。由于该算法由数据并行和模拟并行两个层次组成,因此被称为“双并行蒙特卡罗”。该算法的有效性在数学和数值上得到了验证。

MSC公司:

2007年6月62日 大数据和数据科学的统计方面
65二氧化碳 蒙特卡罗方法
2015年1月62日 贝叶斯推断

软件:

科恩光滑
PDF格式BibTeX公司 XML格式引用
全文: 内政部 链接

参考文献:

[1] Andrieu,C.,Moulines,E.,Priouret,P.:可验证条件下随机近似的稳定性。SIAM J.控制优化。44, 283-312 (2005). https://doi.org/10.1137/S0363012902417267 ·Zbl 1083.62073号 ·doi:10.1137/S0363012902417267
[2] Carvalho,C.M.,Polson,N.G.,Scott,J.G.:稀疏信号的马蹄形估计器。《生物特征》97,465-480(2010)·Zbl 1406.62021号 ·doi:10.1093/biomet/asq017
[3] Geman,S.、Geman,D.:随机松弛、吉布斯分布和图像的贝叶斯恢复。IEEE传输。模式分析。机器。智力。6, 721-741 (1984). https://doi.org/10.1109/TPAMI.1984.4767596 ·Zbl 0573.62030号 ·doi:10.1109/TPAMI.1984.4767596
[4] Hasting,W.:使用马尔可夫链的蒙特卡罗采样方法及其应用。《生物特征》57,97-109(1970)。https://doi.org/10.1093/biomet/57.1.97 ·Zbl 0219.65008号 ·doi:10.1093/biomet/57.1.97
[5] 卡斯,RE;蒂尔尼,L。;巴蒂斯特·卡丹;Geisser,S.(编辑);Hodges,JS(编辑);出版社,SJ(编辑);ZeUnerv,A.(编辑),《基于拉普拉斯方法的后扩张有效性》,第7期,473-488(1990),阿姆斯特丹·Zbl 0734.62034号
[6] Li,C.,Srivastava,S.,Dunson,D.B.:简单、可扩展和准确的后验区间估计。Biometrika 104,665-680(2017)·Zbl 07072234号
[7] Liang,F.:关于蒙特卡罗积分中随机近似蒙特卡罗的使用。统计概率。莱特。79, 581-587 (2009) ·兹比尔1156.62344 ·doi:10.1016/j.spl.2008.10.007
[8] Liang,F.,Liu,C.,Carroll,R.J.:蒙特卡罗计算中的随机近似。《美国统计协会期刊》102、305-320(2007)·Zbl 1226.65002号 ·doi:10.1198/0162145000001202
[9] Metropolis,N.、Rosenbluth,A.W.、Rosenbruth,M.N.、Teller,A.H.、Teler,E.:快速计算机器的状态方程计算。化学杂志。物理学。21, 1087 (1953) ·Zbl 1431.65006号 ·数字对象标识代码:10.1063/1.1699114
[10] Minsker,S.、Srivastava,S.,Lin,L.、Dunson,D.B.:通过子集后验中位数的稳健可扩展贝叶斯。ArXiv电子版(2014)·Zbl 1442.62056号
[11] Neiswanger,W.,Wang,C.,Xing,E.P.:渐近精确,令人尴尬的平行MCMC,In:第三十届人工智能不确定性会议论文集,UAI’14,第623-632页,AUAI出版社,阿灵顿。http://dl.acm.org/citation.cfm?id=3020751.3020816 (2014)
[12] Ripley,B.D.:随机模拟。威利,纽约(1987)·Zbl 0613.65006号 ·数字对象标识代码:10.1002/9780470316726
[13] Robbins,H.,Monro,S.:一种随机近似方法。安。数学。《美国联邦法律大全》第22卷,第400-407页(1951年)。https://doi.org/10.1214/aoms/117729586 ·Zbl 0054.05901号 ·doi:10.1214/oms/1177729586
[14] Roe,B.P.,Yang,H.-J.,Zhu,J.,Liu,Y.,Stancu,I.,McGregor,G.:增强决策树作为人工神经网络的替代品,用于粒子识别。编号。仪器。方法物理学。研究部分。A加速度。光谱学。检测。Assoc.Equip.543,577-584(2005)·doi:10.1016/j.nima.2004.12.018
[15] Scott,S.L.,Blocker,A.W.,Bonassi,F.V.:贝叶斯和大数据:共识蒙特卡罗算法。国际管理杂志。科学。工程管理。11, 78-88 (2016)
[16] Song,Q.,Wu,M.,Liang,F.:种群与单链随机近似MCMC算法的弱收敛速度。高级申请。可能性。46, 1059-1083 (2014). https://doi.org/10.1239/aap/1418396243 ·Zbl 1305.60065号 ·doi:10.1239/aap/1418396243
[17] Srivastava,S.,Cevher,V.,Tran-Dinh,Q.,Dunson,D.B.:WASP:通过子集后验的重心可缩放贝叶斯。收录于:AISTATS,JMLR第38卷:研讨会和会议记录(JMLR.org)(2015a)
[18] Srivastava,S.,Li,C.,Dunson,D.B.:通过Wasserstein空间中的重心可缩放贝叶斯。ArXiv电子版(2015b)·兹比尔1444.62037
[19] Tibshirani,R.:通过套索进行回归收缩和选择。《美国法律总汇》第58卷第267-288页(1996年)·Zbl 0850.62538号
[20] Wand,M.:KernSmooth:支持Wand&Jones(1995)的核平滑函数。r程序包版本2.23-15(2015)
[21] Wang,X.,Dunson,D.:通过Weierstrass采样器并联MCMC。ArXiv电子版(2013)
[22] Wang,X.,Guo,F.,Heller,K.A.,Dunson,D.B.:用随机分区树并行MCMC。收录于:Cortes,C.,Lawrence,N.D.,Lee,D.D.,Sugiyama,M.,Garnett,R.(编辑)《神经信息处理系统进展》,第28卷,第451-459页。Curran Associates公司。http://papers.nips.cc/paper/5986-parallelizing-mcmc-with-random-partition-trees.pdf (2015)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。