×

用于快速贝叶斯推理的并行集成嵌套拉普拉斯近似。 (英语) 兹比尔1502.62016

摘要:由于更高的数据可用性和高维模型参数空间,对执行大规模贝叶斯推理任务的需求越来越大。在这项工作中,我们提出了集成嵌套拉普拉斯近似(INLA)方法的并行化策略,INLA是一个流行的框架,用于对一类潜在高斯模型进行近似贝叶斯推理。我们的方法利用了嵌套线程级并行、在INLA优化阶段使用稳健回归的并行线搜索过程以及最先进的稀疏线性求解器PARDISO。我们在算法中利用相互独立的函数求值以及高级稀疏线性代数技术。通过这种方式,我们可以灵活地利用当今多核架构的强大功能。我们在许多不同的实际应用程序上演示了新的并行化方案的性能。并行性的引入使所有大型模型的速度提高了10倍甚至更多。我们的工作已经集成到当前版本的开源R-INLA包中,使其改进的性能方便所有用户使用。

MSC公司:

62-08 统计问题的计算方法
2015年1月62日 贝叶斯推断
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] 阿里西多,MW;加伊坦,C。;桑切廷,D。;Rubino,A.,多模型集合中气候模型偏差空间分析的贝叶斯层次方法,斯托克。环境。Res.风险评估。,31, 10, 2645-2657 (2017) ·doi:10.1007/s00477-017-1383-2
[2] 阿舍尔,U.M.,格雷夫,C.:关于数值方法的第一门课程。西亚姆(2011)。数字对象标识代码:10.1137/978089871997·Zbl 1326.65001号
[3] Atkinson,A.C.,Riani,M.,Riany,M.:稳健诊断回归分析,第2卷。斯普林格(2000)。doi:10.1007/978-1-4612-1160-0·Zbl 0964.62063号
[4] Bakka,H。;H街。;佐治亚州Fuglstad;Riebler,A。;Bolin,D。;伊利安·J。;Krainski,E。;D.辛普森。;Lindgren,F.,《R-INLA空间建模:综述》,《WIREs Compute》。统计,10,6,e1443(2018)·doi:10.1002/wics.1443
[5] 巴托门,B。;欧文,H。;Carabali,M。;卡瓦略,理学硕士;Ruggiero,ED;Brown,P.,《巴西脆弱的道路使用者死亡:时空分析的贝叶斯层次模型》,《国际损伤控制安全促进》。(2020) ·doi:10.1080/17457300.2020.1818788
[6] Baydin,AG公司;Pearlmutter,文学学士;Radul,AA;Simkind,JM,《机器学习中的自动差异化:一项调查》,J.Mach。学习。决议,18,1-43(2018)·Zbl 06982909号 ·doi:10.5555/3122009.3242010
[7] 巴特,S。;韦斯,D。;Cameron,E。;比桑齐奥,D。;Mappin,B。;美国达尔林普。;巴特尔,K。;莫耶斯,C。;A.亨利。;Eckhoff,P.,《2000年至2015年间疟疾控制对非洲恶性疟原虫的影响》,《自然》,526,7572,207-211(2015)·doi:10.1038/nature15535
[8] Bichot,C.-E.,Siarry,P.:图分区。Wiley,Hobroken(2013)。doi:10.1007/978-3-319-63962-8_312-1
[9] Bollhöfer,M.,Schenk,O.,Janalik,R.,Hamm,S.,Gullapalli,K.:最先进的稀疏直接解算器。计算科学与工程中的并行算法,第3-33页。斯普林格。(2020)doi:10.1007/978-3-030-43736-7_1·Zbl 1455.65003号
[10] 科尔,M。;佩尼诺,MG;Steenbeek,J。;J.Solé。;Bellido,JM,《预测海洋物种分布:食物网络和贝叶斯层次建模方法的互补性》,Ecol。型号1。,405, 86-101 (2019) ·doi:10.1016/j.ecolmodel.2019.05.005
[11] Congdon,P.:《应用贝叶斯模型》,第595卷。Wiley,Hobroken(2014)。数字对象标识代码:10.1002/9781118895047·Zbl 1291.62007年
[12] Davis,TA,稀疏线性系统的直接方法,SIAM(2006)·Zbl 1119.65021号 ·doi:10.1137/19780898718881
[13] 俄勒冈州德里维拉;布兰吉亚多,M。;López-Quílez,A。;Martín-Sanz,I.,《通过贝叶斯层次方法进行物种分布建模》,Theoret。经济。,12, 1, 49-59 (2019) ·doi:10.1007/s12080-018-0387-y
[14] Demmel,J.W.:应用数值线性代数。索契。Ind.申请。数学。doi:10.1137/19781611971446(1997)·Zbl 0879.65017号
[15] Diaz,J.M.、Pophale,S.、Hernandez,O.、Bernholdt,D.E.、Chandrasekaran,S.(2018)Openmp 4.5设备卸载验证套件。B.R.de Supinski、P.Valero-Lara、X.Martorell、S.Mateo Bellido和J.Labarta(编辑),《OpenMP for Evolving Architectures的演进》,第82-95页。查姆施普林格https://www.openmp.org
[16] EA法塔赫;Niekerk,合资公司;Rue,H.,Smart gradient-一种改进梯度估计的自适应技术,Found。数据科学。,4, 1, 123-136 (2022) ·Zbl 07547911号 ·doi:10.3934/fods.2021037
[17] George,A.,常规有限元网格的嵌套剖分,SIAM J.Numer。分析。,10, 2, 345-363 (1973) ·Zbl 0259.65087号 ·doi:10.1137/0710032
[18] A.乔治。;Liu,JW,最小度排序算法的进化,SIAM Rev.,31,1,1-19(1989)·Zbl 0671.65024号 ·数字对象标识代码:10.1137/1031001
[19] 健康,MT;Ng、E。;Peyton,BW,稀疏线性系统的并行算法,SIAM Rev.,33,3,420-460(1991)·Zbl 0738.65014号 ·数字对象标识代码:10.1137/1033099
[20] 亨德森,R。;Shimakura,S。;Gorst,D.,《白血病生存数据的空间变异建模》,《美国统计协会杂志》,第97、460、965-972页(2002年)·Zbl 1048.62102号 ·doi:10.1198/016214502388618753
[21] 新泽西州艾萨克;马萨诸塞州贾兹纳;Keil,P。;该死的,LI;Boersch-Supan,PH;勃朗宁,E。;弗里曼,SN;戈尔丁,N。;Guillera-Arroita,G。;宾夕法尼亚州亨利,物种分布大规模模型的数据集成,趋势。经济。进化。,35, 1, 56-67 (2020) ·doi:10.1016/j.tree.2019.08.006
[22] Karypis,G。;库马尔,V.,《一种快速高质量的划分不规则图的多级方案》,SIAM J.Scientit.Comp。,20, 1, 359-392 (1998) ·兹比尔0915.68129 ·doi:10.5555/305219.305248
[23] Konstantinoudis,G。;Padellini,T。;Bennett,J。;戴维斯,B。;埃扎蒂,M。;布兰吉亚多,M.,《英格兰长期暴露于空气污染和19型冠状病毒死亡率:层次空间分析》,环境。国际,146106316(2021)·doi:10.1016/j.envint.2020.106316
[24] Kontis,V.、Bennett,J.E.、Rashid,T.、Parks,R.M.、Pearson-Stuttard,J.、Guillot,M.、Asaria,P.、Zhou,B.、Battaglini,M.和Corsetti,G.等人:第一波新冠肺炎大流行对21个工业化国家全因死亡率影响的程度、人口统计学和动力学。《国家医学》26(12),1919-1928(2020)https://www.nature.com/articles/s41591-020-112-0
[25] Krainski,E.T.、Gómez-Rubio,V.、Bakka,H.、Lenzi,A.、Castro-Camilio,D.、Simpson,D.、Lindgren,F.、Rue,H.(2018年12月)使用R和INLA的随机偏微分方程高级空间建模。剑桥CRC出版社。Github版本www.r-inla.org/spde-book
[26] LeVeque,RJ,常微分方程和偏微分方程的有限差分方法:稳态和时间相关问题,SIAM,101137-19780898717839(2007)·Zbl 1127.65080号
[27] 李,S。;艾哈迈德,S。;Klimeck,G。;Darve,E.,使用FIND算法计算稀疏矩阵的逆项,J.Compute。物理。,227, 22, 9408-9427 (2008) ·Zbl 1214.82124号 ·doi:10.1016/j.jcp.2008.06.033
[28] 利里尼,R。;Tittarelli,A。;贝托尔迪,M。;里奇,D。;卡塔林菌A。;Pritzkuleit,R。;Launoy,G。;Launay,L。;纪尧姆,E。;《水和土壤污染:对公共卫生项目有用的生态环境研究方法》。文献综述,Rev.Environ。污染物。毒理学。,256179-214(2021)·doi:10.1007/398_2020_58
[29] Lindenmayer,D。;泰勒,C。;Blanchard,W.,《澳大利亚东南部影响火灾严重程度因素的实证分析》,生态圈,12,8,e03721(2021)·doi:10.1002/ecs2.3721
[30] 林格伦,F。;Bolin,D。;Rue,H.,《高斯和非高斯场的SPDE方法:10年且仍在运行》,Spat。统计(2022)·doi:10.1016/j.spasta.2022.100599
[31] 林格伦,F。;H街。;Lindström,J.,《高斯场和高斯-马尔可夫随机场之间的显式联系:随机偏微分方程方法》,J.Royal Stat.Soc.:B系列(Stat.Methodol.),73,4,423-498(2011)·Zbl 1274.62360号 ·文件编号:10.1111/j.1467-9868.2011.00777.x
[32] 卢,N。;Liang,S。;黄,G。;秦,J。;姚,L。;王,D。;Yang,K.,月最高和最低地表气温的分层贝叶斯时空估计,遥感环境。,211, 48-58 (2018) ·doi:10.1016/j.rse.2018.04.006
[33] 马丁内斯·米纳亚,J。;卡梅莱蒂,M。;Conesa,D。;Pennino,MG,《物种分布建模:以时空问题为重点的统计综述》,Stoch。环境。Res.风险评估。,32, 11, 3227-3244 (2018) ·doi:10.1007/s00477-018-1548-7
[34] 马丁斯,TG;D.辛普森。;林格伦,F。;Rue,H.,贝叶斯计算与嵌入:新功能,计算。统计与数据分析。,67, 68-83 (2013) ·兹比尔1471.62135 ·doi:10.1016/j.csda.2013.04.014
[35] Mejia,空军;Yu,Y。;Bolin,D。;林格伦,F。;Lindquist,MA,《皮层表面FMRI数据分析的贝叶斯一般线性建模方法》,美国统计协会,115,530,501-520(2020)·Zbl 1445.62283号 ·doi:10.1080/01621459.2019.1611582
[36] 密尔克,KP;克拉森,T。;Busana,M。;Heskes,T。;马萨诸塞州Huijbregts;Koffijberg,K。;Schipper,AM,物种分布模型中空间自相关的分离驱动因素,生态地理学,43,12,1741-1751(2020)·doi:10.1111/ecog.05134
[37] Nocedal,J.,Wright,S.:数值优化。施普林格,柏林(2006)。doi:10.1007/978-0-387-40065-5·Zbl 1104.65059号
[38] Opitz,T.(2017)。潜在高斯建模和嵌入:一篇关于时空应用的综述。《法国社会统计杂志》158(3),62-85。https://hal.archives-ouvertes.fr/hal-01394974 ·兹比尔1378.62095
[39] Pan,V.,Reif,J.(1985)线性系统的高效并行解。第十七届ACM计算理论研讨会论文集,第143-152页。数字对象标识代码:10.1145/22145.22161
[40] 帕迪索(2022)。7.2版。瑞士卢加诺:Panua Technologies。http://www.panua.ch网站
[41] Pimont,F.、Fargeon,H.、Opitz,T.、Ruffault,J.、Barbero,R.、Martin-StPaul,N.、Rigolot,E.、Rivière,M.、Dupuy,J.-L.:火灾概率贝叶斯框架中区域野火活动的预测。经济。申请。31(5),e02316(2021)。doi:10.1002/eap.2316
[42] 平托,G。;卢梭,F。;尼克拉森,M。;Drobyshev,I.,瑞典现代森林火灾的发生和规模对人类相关和生物景观特征的影响,Agricult。森林气象。,291, 108084 (2020) ·doi:10.1016/j.agrformet.2020.108084
[43] Rousseeuw,P.J.,Leroy,A.M.:稳健回归和异常值检测,第589卷。Wiley,Hobroken(2005)。doi:10.1002/0471725382·Zbl 0711.62030号
[44] Rue,H.,Held,L.:高斯马尔可夫随机场:理论和应用。CRC出版社,剑桥(2005)。doi:10.1201/9780203492024·邮编1093.60003
[45] H街。;Martino,S.,分层高斯马尔可夫随机场模型的近似贝叶斯推断,J.Stat.Plann。推断。,137, 10, 3177-3192 (2007) ·Zbl 1114.62025号 ·doi:10.1016/j.jspi.2006.07.016
[46] H街。;马蒂诺,S。;肖邦,N.,《使用集成嵌套拉普拉斯近似法对潜在高斯模型进行近似贝叶斯推断》,《皇家统计学会期刊:系列b(统计方法)》,71,2,319-392(2009)·Zbl 1248.62156号 ·doi:10.1111/j.1467-9868.2008.00700.x
[47] H街。;Riebler,A。;瑟比,SH;伊利安,JB;Simpson,DP;林德格伦,FK,《贝叶斯计算与INLA:综述》,Ann.Rev.Stat.Appl。,4, 395-421 (2017) ·doi:10.1146/年度统计060116-054045
[48] Rustand,D.,Van Niekerk,J.,Krainski,E.T.,Rue,H.,Proust-Lima,C.(2022)多元纵向和生存数据联合模型的快速灵活推理方法,使用集成嵌套拉普拉斯近似。arxiv公司:2203.06256
[49] Saad,Y.,稀疏线性系统的迭代方法,SIAM,101137-19780898718003(2003)·Zbl 1031.65046号
[50] 三亚,S。;罗切罗,T。;中国大陆Maesano;科姆·鲁埃尔,L。;Annesi Maesano,I.,户外空气污染对死亡率和发病率的长期影响:法国大都市的一项12年随访研究,国际环境杂志。公共卫生研究。,15, 11, 2487 (2018) ·doi:10.3390/ijerph15112487
[51] 沙迪克,G。;马萨诸塞州托马斯;阿米尼,H。;Broday,D。;科恩,A。;弗罗斯塔德,J。;格林,A。;Gumy,S。;刘,Y。;Martin,RV,《全球疾病负担评估中人口暴露于环境空气污染的数据集成》,环境。科技。,52, 16, 9069-9078 (2018) ·doi:10.1021/acs.est.8b02864
[52] 斯宾塞,D。;YR Yue;Bolin,D。;Ryan,S。;Mejia,AF,皮层表面的空间贝叶斯GLM在个体和群体中产生可靠的任务激活,NeuroImage(2022)·doi:10.1016/j.neuroimage.2022.118908
[53] 高桥,K.:稀疏母线阻抗矩阵的形成及其在短路研究中的应用。程序中。PICA会议,1973年6月
[54] 托莱多,S.(2003)。Taucs:稀疏线性解算器库。https://www.tau.ac.il网址/斯托利多/陶奇/
[55] Van Merriönboer,B.,Breuleux,O.,Bergeron,A.,Lamblin,P.(2018)《ML中的自动分化:我们在哪里,我们应该去哪里》。神经信息处理系统的进展31。https://proceedings.neurips.cc/paper/2018/file/770f8e448d07586afbf77bb59f698587-paper.pdf
[56] Van Niekerk,J.、Bakka,H.、Rue,H.和Schenk,O.:使用R.J.Stat.Softw中的INLA包进行贝叶斯建模的新领域。100(2), 1-28 (2021). doi:10.18637/jss.v100.i02
[57] Van Niekerk,J.、Bakka,H.、Rue,H.和Schenk,O.:使用R.J.Stat.Softw中的INLA包进行贝叶斯建模的新领域。100(2),1-28(2021).doi:10.18637/jss.v100.i02
[58] Van Niekerk,J.、E.Krainski,D.Rustand和H.Rue(2022年)。利用INLA进行贝叶斯推理的新途径。arXiv预印本arXiv:2204.06797
[59] Yannakakis,M.:计算最小填充是np-完全的。SIAM J.Algebr。离散。方法。2(1), 77-79 (1981). doi:10.1137/0602010·Zbl 0496.68033号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。