×

通过有效的数据子采样加速MCMC。 (英语) Zbl 1420.62121号

小结:我们提出了子抽样马尔可夫链蒙特卡罗(MCMC),这是一个MCMC框架,其中观测值的似然函数是从观测值的随机子集估计的。我们引入了一种基于控制变量的对数似然的高效无偏估计,使得计算成本远小于标准MCMC中的完全对数似然。似然估计经过了偏差校正,并用于两个相关的伪边缘算法中,以从扰动后验点采样,为此我们分别导出了关于(n)和(m)的渐近误差。我们提出了一个实际的误差估计量,并表明在我们的应用中,即使是很小的误差也可以忽略不计。我们证明,在给定的计算预算下,子采样MCMC在采样效率方面比标准MCMC更有效,并且它优于文献中提出的其他MCMC子采样方法。

MSC公司:

2015年1月62日 贝叶斯推断
62-07 数据分析(统计)(MSC2010)
62D05型 抽样理论、抽样调查
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Andrieu,C。;Roberts,G.O.,《有效蒙特卡罗计算的伪边缘方法》,《统计年鉴》,第37期,第697-725页(2009年)·Zbl 1185.60083号
[2] 巴尔迪,P。;萨多夫斯基,P。;怀特森,D.,《通过深度学习在高能物理中寻找奇异粒子》,《自然通讯》,5(2014)
[3] Bardenet,R。;Doucet,A。;Holmes,C.,《迈向扩展马尔可夫链蒙特卡罗:一种自适应子抽样方法》,第31届机器学习国际会议论文集,405-413(2014)
[4] Bardenet,R。;Doucet,A。;Holmes,C.,《关于高数据的马尔可夫链蒙特卡罗方法》,《机器学习研究杂志》,18,1-43(2017)·Zbl 1433.68394号
[5] Beaumont,M.A.,《遗传监测人群中人口增长或下降的估计》,遗传学,1641139-1160(2003)
[6] Ceperley,D。;Dewing,M.,具有不确定能量的随机行走的惩罚方法,化学物理杂志,110,9812-9820(1999)
[7] Chen,C.-F.,《关于贝叶斯含义下极限密度函数的渐近正态性》,英国皇家统计学会杂志,47,540-546(1985)·Zbl 0607.62015年
[8] 科洛伯特,R。;Bengio,S。;Bengio,Y.,超大规模问题的SVM并行混合,神经计算,141105-1114(2002)·Zbl 1003.68135号
[9] Dahlin,J。;Lindsten,F。;Kronander,J。;Schön,T.B.,通过关联辅助变量加速伪边际大都市黑斯廷斯(2015)
[10] Dang,K.-D。;基罗兹,M。;科恩,R。;Tran,M.-N。;Villani,M.,《哈密尔顿蒙特卡罗与节能子采样》(2017)
[11] 迪安·J。;Ghemawat,S.,MapReduce:大型集群上的简化数据处理,ACM通信,51,107-113(2008)
[12] Deligiannidis,G。;Doucet,A。;Pitt,M.K.,相关伪边际法(2016)
[13] Doucet,A。;皮特,M。;Deligiannidis,G。;Kohn,R.,《使用无偏似然估计时马尔可夫链蒙特卡罗的有效实现》,生物统计学,102295-313(2015)·Zbl 1452.62055号
[14] 盖尔芬德,A.E。;Smith,A.F.,《基于抽样的边缘密度计算方法》,美国统计协会杂志,85,398-409(1990)·Zbl 0702.62020号
[15] Gelman,A。;罗伯茨,G。;Gilks,W.,《有效都市跳跃规则》,贝叶斯统计,5599-608(1996)
[16] 佐丹尼,P。;雅各布森,T。;Schedvin,E。;Villani,M.,《考虑扭曲:用财务比率样条预测企业破产风险》,《财务与定量分析杂志》,49,1071-1099(2014)
[17] 格拉芙,S。;Luschgy,H.,经验量化误差的收敛速度,《概率年鉴》,30874-897(2002)·Zbl 1018.60032号
[18] 霍维茨,D.G。;汤普森,D.J.,《有限宇宙中不替换抽样的推广》,美国统计协会杂志,47663-685(1952)·兹比尔0047.38301
[19] 哈伯德,B。;哈伯德,J.,《向量微积分、线性代数和微分形式:统一方法》(1999),新泽西州上鞍河:普伦蒂斯·霍尔,新泽西上鞍河·Zbl 0918.00001
[20] 科拉提卡拉,A。;陈,Y。;Welling,M.,《MCMC土地的紧缩:削减大都会-黑斯廷斯预算》,第31届机器学习国际会议论文集(ICML-14),181-189(2014)
[21] 刘,S。;Mingas,G。;Bouganis,C.-S.,《定制精度制度下的精确MCMC加速器》,《现场可编程技术国际会议论文集》,120-127(2015)
[22] Lyne,A.-M。;Girolma,M。;阿查德,Y。;斯特拉赫曼,H。;Simpson,D.,《关于具有双重不可测可能性的贝叶斯推断的俄罗斯轮盘赌估计》,《统计科学》,30,443-467(2015)·Zbl 1426.62092号
[23] 麦克劳林(D.Maclaurin)。;Adams,R.P.,《萤火虫蒙特卡罗:具有数据子集的精确MCMC》,《第30届人工智能不确定性会议论文集》(UAI 2014)。(2014年)
[24] 明斯克,S。;Srivastava,S。;林,L。;Dunson,D.,通过中位数后验的可伸缩和稳健贝叶斯推断,第31届机器学习国际会议论文集(ICML-14),1656-1664(2014)
[25] 内斯旺格,W。;王,C。;Xing,E.,《渐近精确,令人尴尬的并行MCMC》,第三十届人工智能不确定性年会论文集(UAI-14),623-632(2014),俄勒冈州科瓦利斯:俄勒冈州科瓦利斯AUAI出版社
[26] 奈梅特,C。;Sherlock,C.,通过高斯过程近似合并MCMC次后验,贝叶斯分析,13507-530(2018)·Zbl 1407.62081号
[27] 尼科尔斯,G.K。;福克斯,C。;Watt,A.M.,《MCMC与随机接受概率的耦合》(2012)
[28] 皮特,M.K。;席尔瓦,R。;佐丹尼,P。;Kohn,R.,《基于粒子滤波的马尔可夫链蒙特卡罗模拟方法的一些性质》,《计量经济学杂志》,171134-151(2012)·Zbl 1443.62499号
[29] 普卢默,M。;贝斯特,N。;Cowles,K。;Vines,K.,CODA:MCMC的收敛诊断和输出分析,R News,6,7-11(2006)
[30] 基罗兹,M。;Tran,M.-N。;维拉尼,M。;Kohn,R.,《通过延迟接受和数据子采样加速MCMC》,《计算与图形统计杂志》,27,12-22(2018)·Zbl 07498963号
[31] 基罗兹,M。;Tran,M.-N。;维拉尼,M。;科恩,R。;Dang,K.-D.(2018年)
[32] Roberts,G.O。;Gelman,A。;Gilks,W.R.,《随机漫步都市算法的弱收敛性和最优尺度》,《应用概率年鉴》,第7期,第110-120页(1997年)·Zbl 0876.60015号
[33] 塞恩达尔,C.-E。;斯文森,B。;Wretman,J.,模型辅助调查抽样(2003年),纽约:施普林格,纽约·Zbl 1027.62004号
[34] 斯科特·S·L。;拦截器,A.W。;F.V.博纳西。;Chipman,H。;乔治·E。;Mcculloch,R.,《贝叶斯与大数据:共识蒙特卡罗算法》,《EFaBBayes 250会议论文集》,16(2013)
[35] 夏洛克,C。;Thiery,A.H。;Roberts,G.O。;Rosenthal,J.S.,《伪边缘随机游走都市算法的效率》,《统计年鉴》,43,238-275(2015)·Zbl 1326.65015号
[36] Tran,M.-N。;科恩,R。;基罗兹,M。;Villani,M.,《块状伪边缘采样器》(2017)
[37] Tran,M.-N。;Scharth,M。;皮特,M.K。;Kohn,R.,潜在变量模型中贝叶斯推断的重要性抽样平方(2016)
[38] 瓦尔迪,Y。;Zhang,C.-H.,《多元L1-中位数和相关数据深度》,《国家科学院学报》,971423-1426(2000)·Zbl 1054.62067号
[39] Villani,M.,向量自回归的稳定状态先验,应用计量经济学杂志,24630-650(2009)
[40] Wagner,W.,随机微分方程解的泛函的蒙特卡罗评价。方差减少和数值示例,随机分析和应用,6447-468(1988)·Zbl 0671.60058号
[41] 王,X。;Dunson,D.B.,通过Weierstrass采样器进行的平行MCMC(2014)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。