×

用于在状态空间模型中加速推理的粒子MCMC算法和体系结构。 (英语) Zbl 1404.68030号

摘要:粒子马尔可夫链蒙特卡罗(pMCMC)是一种随机算法,用于在概率分布密度不允许闭合形式表达式时,从概率分布中生成样本。pMCMC最常用于状态空间模型(SSM)中的贝叶斯后验分布抽样,这是一类用于许多科学应用的概率模型。然而,在处理具有大量数据的复杂SSM时,由于pMCMC的计算成本很高,并且在后验数据表现出多模态时性能较差,因此这项任务是禁止的。本文旨在通过以下两个方面解决这两个问题:1)提出一种新的pMCMC算法(称为ppMCMC),该算法使用多个马尔可夫链(而不是pMCMC使用的马尔可夫链条)来提高多模态后验的采样效率;2)引入定制的并行硬件体系结构,这是为pMCMC和ppMCMC量身定制的。这些体系结构是在现场可编程门阵列(FPGA)上实现的,FPGA是一种具有大规模并行能力的硬件加速器。新算法和两种FPGA架构通过遗传学的大规模案例研究进行了评估。结果表明,当使用顺序CPU实现时,ppMCMC的采样效率比pMCMC高1.96倍。pMCMC的FPGA架构比pMCMC最先进的并行CPU和GPU实现快12.1倍和10.1倍,能效高达53倍;ppMCMC的FPGA架构将这些加速比分别提高到34.9倍和41.8倍,并且能效提高了173倍,使得以前难以处理的基于SSM的数据分析变得唾手可得。

MSC公司:

68平方米 计算机系统环境下的性能评估、排队和调度
2015年1月62日 贝叶斯推断
65二氧化碳 蒙特卡罗方法
2007年7月68日 计算机体系结构的数学问题
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 布鲁克斯,S。;盖尔曼,A。;琼斯,G.L。;Meng,X.-L.,《马尔可夫链蒙特卡罗手册》(2011),查普曼和霍尔/CRC·Zbl 1218.65001号
[2] 吉尔克斯,W。;Spiegelhalter,D.,《马尔可夫链蒙特卡罗实践》(1996),查普曼和霍尔/CRC·Zbl 0832.00018号
[3] Andrieu,C。;Doucet,A。;Holenstein,R.,《粒子马尔可夫链蒙特卡罗方法》,J.R.Stat.Soc.,Ser。B、 统计方法。,72, 3, 269-342 (2010) ·Zbl 1411.65020号
[4] J.欧文。;威尔金森,D。;Gillespie,C.,具有难以处理的可能性的马尔可夫过程的可缩放推理,统计计算。,25, 1, 145-156 (2015) ·Zbl 1331.62065号
[5] Everitt,R.G.,潜在马尔可夫随机场和社交网络的贝叶斯参数估计,J.Compute。图表。统计,21,4,940-960(2012)
[6] Andrieu,C。;Roberts,G.O.,《有效蒙特卡罗计算的伪边缘方法》,《Ann.Stat.》,第37、2、697-725页(2009年)·兹比尔1185.60083
[7] Doucet,A。;Johansen,A.M.,《粒子滤波与平滑教程:十五年后》(《非线性滤波手册》(2009)),656-704·Zbl 1513.60043号
[8] 彼得斯,G.W。;Hosack,G.R。;Hayes,K.R.,通过自适应粒子马尔可夫链蒙特卡罗(AdPMCMC)选择生态非线性状态空间模型
[9] Nevat,我。;彼得斯,G.W。;Doucet,A。;Yuan,J.,基于自适应粒子MCMC的中继网络信道跟踪
[10] Murray,L.,使用LibBi,J.Stat.Softw.对高性能硬件进行贝叶斯状态空间建模。,67, 1, 1-36 (2015)
[11] 多德,M。;琼斯,E。;Parslow,J.,《海洋生物地球化学模型数据同化的统计概述和展望》,环境计量学,25,4,203-213(2014)
[12] 亨德比,G。;卡尔森,R。;Gustafsson,F.,《粒子滤波:对速度的需求》,EURASIP J.高级信号处理。,2010, 1, 181403 (2010) ·Zbl 1204.68263号
[13] Rackham,O.J.L.,WGBSSuite:模拟全基因组亚硫酸氢盐测序数据和基准差异DNA甲基化分析工具,生物信息学,31,14,2371-2373(2016)
[14] 夏洛克,C。;Thiery,A.H。;Roberts,G.O。;Rosenthal,J.S.,《伪边缘随机行走大都会算法的效率》,《Ann.Stat.》,43,1,238-275(2015)·Zbl 1326.65015号
[15] 托德曼,T.J。;Constantinides,G.A。;Wilton,S.J.E。;曼瑟,O。;卢克,W。;Cheung,P.Y.K.,可重构计算:体系结构和设计方法,IEE Proc。,计算。数字。技术,193-207(2005)
[16] Betkaoui,B。;托马斯·D·。;Luk,W.,《FPGA和GPU用于高生产率计算的性能和能效比较》,(现场可编程技术国际会议,现场可编程科技国际会议,FPT,2010(2010)),94-101
[17] 丛,J。;刘,B。;Neuendorffer,S。;Noguera,J。;Vissers,K。;Zhang,《FPGA的高级综合:从原型到部署》,IEEE Trans。计算-辅助设计。集成。电路系统。,30, 4, 473-491 (2011)
[18] Niccolai,J.是英特尔第一款具有性能提升FPGA的处理器,将于明年初上市(2015年)
[19] Henriksen,S。;Wills,A.G。;肖恩,T.B。;Ninness,B.,在GPU上并行实现粒子MCMC方法,(第16届IFAC系统识别研讨会(2012)),1143-1148
[20] 刘,S。;Mingas,G。;Bouganis,C.-S.,FPGA上粒子过滤器的并行重采样,(现场可编程技术国际会议,现场可编程科技国际会议,FPT,2014(2014)),191-198
[21] Doucet,A。;皮特,M.K。;Deligiannidis,G。;Kohn,R.,《使用无偏似然估计量时马尔可夫链蒙特卡罗的有效实现》,生物统计学(2016)·Zbl 1452.62055号
[22] H街。;马蒂诺,S。;肖邦,N.,《利用集成嵌套拉普拉斯近似对潜在高斯模型进行近似贝叶斯推断》,J.R.Stat.Soc.,Ser。B、 统计方法。,71219-392(2009年)·Zbl 1248.62156号
[23] Jasra,A。;斯蒂芬斯,D.A。;Holmes,C.C.,《基于群体的静态推理模拟》,《统计计算》。,263-279(2007年)
[24] Jensen,J.,《数学学报》。,30, 1, 175-193 (1906) ·JFM 37.0422.02号
[25] Earl,D.J。;Deem,M.W.,《平行回火:理论、应用和新观点》,《物理学》。化学。化学。物理。,7, 3910-3916 (2005)
[26] 苏亚迪,A。;科里根,E.C。;Constantinides,G.A.,嵌入式优化的快速FPGA原型工具箱,(欧洲控制会议,欧洲控制大会,ECC,2015(2015),IEEE),2589-2594
[27] Kass,R.E。;卡林,B.P。;盖尔曼,A。;Neal,R.M.,《实践中的马尔可夫链蒙特卡罗:圆桌讨论》,《美国统计》,52,2,93-100(1998)
[28] 蒂比特,M。;哈兰,M。;Liechty,J.,平行多元切片采样,统计计算。,21, 3, 415-430 (2011) ·Zbl 1253.60082号
[29] Kullback,S。;Leibler,R.A.,《信息与充分性》,《数学年鉴》。《统计》,22,1,79-86(1951)·Zbl 0042.38403号
[30] 锡林克斯功率估计器
[32] Nvidia C2050规格
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。