×

超大规模块结构自适应网格细化。 (英语) Zbl 06890193号

摘要:在本文中,我们提出了一种适用于极值并行的块结构自适应网格细化(AMR)新方法。所有数据结构都是这样设计的:每个分布式处理器内存中的元数据大小保持有界,与处理器数量无关。在AMR过程的所有阶段,我们只使用分布式算法。不使用诸如主进程或复制数据之类的中央资源,因此可以实现无限的可扩展性。特别是对于动态负载平衡,我们建议通过创建核心数据结构的轻量级临时副本来利用块结构域分区的层次性。此副本用作本地和完全分布式的代理数据结构。它不包含模拟数据,但仅提供有关将域划分为块的拓扑信息。最终,这种方法实现了一种廉价的、局部的、基于扩散的动态负载平衡方案。我们展示了我们的新AMR实现对于两个架构不同的PB级超级计算机的卓越性能和完全可扩展性。IBM Blue Gene/Q系统上的基准测试,该系统的网格包含3.7万亿个未知项,分布在458752个进程中,证实了未来极端规模并行机的适用性。本文中提出的算法对域划分产生的块进行操作。这个概念及其实现支持任意数据的存储。因此,该软件框架可以用于不同的仿真方法,包括基于网格的方法和无网格方法。在本文中,我们演示了基于晶格玻尔兹曼方法的流体模拟。

MSC公司:

2005年5月 并行数值计算
65年20月 数值算法的复杂性和性能
76P05号机组 稀薄气体流动,流体力学中的玻尔兹曼方程
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] M.Adams、P.Colella、D.T.Graves、J.N.Johnson、H.S.Johansen、N.D.Keen、T.J.Ligocki、D.F.Martin、P.W.McCorquodale、D.Modiano、P.O.Schwartz、T.D.Sternberg和B.V.Straalen,AMR应用程序的Chombo软件包–设计文档《技术报告》,劳伦斯伯克利国家实验室,2015年。
[2] C.K.Aidun和J.R.Clausen,复杂流动的格子Boltzmann方法,《流体力学年鉴》,年。流体力学版次。42,《年度评论》,2010年,第439-472页·Zbl 1345.76087号
[3] D.Bartuschat和U.Ruéde,微流体流动中带电粒子的并行多物理模拟,J.计算。科学。,8(2015),第1-19页。
[4] S.Becker、S.Kniesburges、S.Muöller、A.Delgado、G.Link、M.Kaltenbacher和M.Doöllinger,人声模型中的流-结构-声相互作用,J.Acust。Soc.Amer.,美国。,125(2009),第1351–1361页。
[5] J.E.Bowlat,图中的负载平衡和泊松方程,同意。公司-实际。E.,2(1990),第289-313页。
[6] E.G.Boman、U.V.Catalysturek、C.Chevalier和K.D.Devine,组合科学计算的Zoltan和Isorropia并行工具包:分区、排序和着色,科学。程序。,20(2012),第129-150页。
[7] Boost\CPP库,(2018-04-15访问)。
[8] J.Bordner和M.L.Norman,Enzo-P/Cello:天体物理学和宇宙学的可缩放自适应网格细化,《极限尺度研讨会论文集》,BW-XSEDE’12,伊利诺伊大学香槟分校,2012年,第4:1–4:11页。
[9] BoxLib,(2017年8月31日访问)。
[10] G.L.Bryan、M.L.Norman、B.W.O'Shea、T.Abel、J.H.Wise、M.J.Turk、D.R.Reynolds、D.C.Collins、P.Wang、S.W.Skillman、B.Smith、R.P.Harkness、J.Bordner、J.Kim、M.Kuhlen、H.Xu、N.Goldbaum、C.Hummels、A.G.Kritsuk、E.Tasker、S.Skory、C.M.Simpson、O.Hahn、J.Oishi、G.So、F.Zhao、R.Cen和Y.Li,ENZO:一种适用于天体物理的自适应网格细化代码《天体物理学》。J.Suppl.S.,211(2014),19。
[11] H.-J.Bungartz、M.Mehl、T.Neckel和T.Weinzierl,应用于流体动力学的PDE框架Peano:在类八叉树自适应笛卡尔网格上并行多尺度流体动力学求解器的有效实现,计算。机械。,46(2010),第103–114页·Zbl 1301.76056号
[12] C.Burstede、D.Calhoun、K.Mandli和A.R.Terrel,ForestLaw:适用于双曲守恒定律的八树AMR混合林,高级并行计算。,25(2014),第253-262页。
[13] C.Burstedde、L.C.Wilcox和O.Ghattas,p4est:八叉树森林上并行自适应网格细化的可伸缩算法,SIAM J.科学。计算。,33(2011),第1103–1133页·Zbl 1230.65106号
[14] 仙人掌(2018-04-15)·Zbl 1051.83539号
[15] P.M.Campbell、K.D.Devine、J.E.Flaherty、L.G.Gervasio和J.D.Teresco,基于空间填充曲线的动态八叉树负载平衡,技术报告CS-03-01,威廉姆斯学院计算机科学系,2003年。
[16] 地毯(2018-04-15)·Zbl 1010.60075号
[17] H.Chen、O.Filippova、J.Hoch、K.Molvig、R.Shock、C.Teixeira和R.Zhang,基于体积公式的格子Boltzmann方法的网格细化,物理。A、 362(2006),第158-167页。
[18] S.Chen和G.D.Doolen,流体流动的格子Boltzmann方法,《流体力学年鉴》,年。流体力学版次。30,《年度评论》,1998年,第329-364页·Zbl 1398.76180号
[19] C.Chevalier和F.Pellegrini,PT-Scotch:高效并行图排序工具,并行计算。,34(2008),第318–331页。
[20] G.Cybenko,分布式内存多处理器的动态负载平衡,J.平行分布计算。,7(1989),第279-301页。
[21] J.-C.Desplat、I.Pagonabaraga和P.Bladon,LUDWIG:复杂流体的并行Lattice-Boltzmann代码,计算。物理学。社区。,134(2001),第273-290页·兹比尔1032.76055
[22] A.Dubey、A.Almgren、J.Bell、M.Berzins、S.Brandt、G.Bryan、P.Colella、D.Graves、M.Lijewski、F.Lo¨ffler、B.O'Shea、E.Schnetter、B.V.Straalen和K.Weide,块结构自适应网格精化软件包中高层框架综述,J.平行分布计算。,74(2014),第3217–3227页。
[23] A.Dubey、K.Antypas、M.K.Ganapathy、L.B.Reid、K.Riley、D.Sheeler、A.Siegel和K.Weide,FLASH是一种大规模并行多物理仿真代码,基于可扩展组件的体系结构,并行计算。,35(2009),第512–522页。
[24] 酶-P/大提琴(2018-04-15)。
[25] A.Fakhari、M.Geier和T.Lee,不混溶两相流的一种具有动态网格细化的质量守恒格子Boltzmann方法,J.计算。物理。,315(2016),第434-457页·Zbl 1349.76678号
[26] A.Fakhari和T.Lee,基于块结构自适应网格细化技术的有限差分格子Boltzmann方法,物理。版本E(3),89(2014),033310。
[27] J.Fietz、M.J.Krause、C.Schulz、P.Sanders和V.Heuveline,复杂几何体上优化的混合平行格子Boltzmann流体流动模拟,摘自《2012年欧洲-保时捷并行处理》,施普林格出版社,2012年,第818–829页。
[28] FLASH,(2018-04-15访问)·Zbl 1321.94065号
[29] S.Freudiger、J.Hegewald和M.Krafczyk,基于层次网格的多物理格子Boltzmann原型的并行化概念,程序。计算。流体动力。,8(2008),第168–178页·Zbl 1388.76289号
[30] C.Godenschwager、F.Schornbaum、M.Bauer、H.Ko¨stler和U.Ru¨de,复杂几何形状下具有万亿个单元的混合平行流模拟框架,《高性能计算、网络、存储和分析国际会议论文集》,SC'13,ACM,2013年,第35:1–35:12页。
[31] T.Goodale、G.Allen、G.Lanfermann、J.Massoí、T.Radke、E.Seidel和J.Shalf,Cactus框架和工具包:设计和应用《向量与并行处理–VECPAR’2002》,第五届国际会议,计算机课堂讲稿。科学。2565年,施普林格出版社,2003年·Zbl 1027.65524号
[32] J.Go¨tz、K.Iglberger、M.Sturmermer和U.Ru¨de,294912处理器核上颗粒流的直接数值模拟,《2010年ACM/IEEE高性能计算、网络、存储和分析国际会议论文集》,IEEE计算机学会,2010年,第1-11页。
[33] D.Groen、O.Henrich、F.Janoschek、P.Coveney和J.Harting,流体动力学中的格子-玻尔兹曼方法:湍流和复杂胶体流体2011年,在朱利奇超级计算中心,朱利奇蓝色基因/P极限缩放研讨会上。
[34] D.Groen、J.Hetherington、H.B.Carver、R.W.Nash、M.O.Bernabeu和P.V.Coveney,HemeLB格子Boltzmann仿真环境的性能分析和建模,J.计算。科学。,4(2013),第412-422页。
[35] M.Hasert、K.Masilamani、S.Zimny、H.Klimach、J.Qi、J.Bernsdorf和S.Roller,基于并行树的Lattice Boltzmann求解器Musubi的复杂流体模拟,J.计算。科学。,5(2014年),第784-794页。
[36] V.Heuveline和J.Latt,OpenLB项目:格子Boltzmann方法的开源和面向对象实现,国际期刊修订版。物理学。C、 18(2007),第627–634页·Zbl 1388.76293号
[37] D.希尔伯特,Ueber die stetige Abbildung einer Linie auf ein Flaíchenstuck公司,数学。《年鉴》,38(1891),第459-460页·格式23.042.01
[38] L.V.Kale和G.Zheng,Charm++和AMPI:通过可移植对象实现自适应运行时策略,《并行和分布式自适应应用的高级计算基础设施》,John Wiley&Sons,2009年,第265-282页。
[39] D.Lagrava、O.Malaspinas、J.Latt和B.Chopard,多畴格子Boltzmann网格细化研究进展,J.计算。物理。,231(2012),第4808–4822页·Zbl 1246.76131号
[40] M.Lahnert、C.Burstedde、C.Holm、M.Mehl、G.Rempfer和F.Weik,朝向格子——动态自适应网格上的Boltzmann——ESPResSo中的最小无创网格交换,《2016年ECCOMAS大会论文集》,第七届欧洲应用科学与工程计算方法大会,2016年,第1-25页。
[41] LB3D,(2018-04-15访问)。
[42] P.MacNeice、K.M.Olson、C.Mobarry、R.de Fainchtein和C.Packer,PARAMESH:一个并行自适应网格细化社区工具包,计算。物理学。社区。,126(2000),第330-354页·Zbl 0953.65088号
[43] R.C.Martin,开闭原理《C++报告》,1996年。
[44] M.Mehl、T.Neckel和P.Neumann,Peano框架八叉树网格上的Navier-Stokes和Lattice-Boltzmann,国际。J.数字。方法流体,65(2011),第67-86页·Zbl 1427.76188号
[45] B.梅耶,面向对象的软件构造普伦蒂斯·霍尔出版社,1988年。
[46] G.M.Morton,面向计算机的大地测量数据库;和一种新的文件排序技术《技术报告》,IBM有限公司,1966年。
[47] P.Neumann和T.Neckel,八叉树网格上格子Boltzmann模拟的动态网格细化技术,计算。机械。,51(2013),第237–253页·Zbl 1312.76051号
[48] OpenLB,(2018-04-15访问)。
[49] Palabos,(2018-04-15访问)。
[50] 帕拉梅什(2018-04-15)。
[51] S.G.Parker,基于组件的并行多物理PDE仿真体系结构,未来一代。计算。系统。,22(2006),第204-216页。
[52] 帕梅蒂斯,(2018-04-15)。
[53] T.Preclik和U.Ruïde,非光滑颗粒动力学的超尺度模拟,计算。颗粒力学。,2(2015),第173–196页。
[54] PT-Scotch,(2018-04-15访问)。
[55] A.Randles,在大规模并行超级计算机上使用格子Boltzmann方法建模心血管血流动力学,哈佛大学博士论文,2013年。
[56] M.Rohde、D.Kandhai、J.J.Derksen和H.E.A.van den Akker,格子Boltzmann格式的一种通用、质量守恒的局部网格细化技术,国际。J.数字。方法流体,51(2006),第439–468页·Zbl 1276.76060号
[57] K.Schloegel、G.Karypis和V.Kumar,并行静态和动态多约束图划分,同意。公司-实际。E.,14(2002),第219-240页·Zbl 1012.68146号
[58] E.Schnetter、S.H.Hawley和I.Hawke,基于固定网格细化的三维数值相对论演化,类。量子引力。,21(2004),第1465-1488页·Zbl 1047.83002号
[59] M.Schoánherr、K.Kucher、M.Geier、M.Stiebler、S.Freudiger和M.Krafczyk,CPU和GPU非均匀网格上格子Boltzmann方法的多线程实现,计算。数学。申请。,61(2011),第3730–3743页。
[60] F.Schornbaum和U.Ruéde,非均匀网格上格子Boltzmann方法的大规模并行算法,SIAM J.科学。计算。,38(2016),第C96–C126页·Zbl 1381.76301号
[61] 恩佐项目(2018-04-15)。
[62] J.Toölke、S.Freudiger和M.Krafczyk,格子Boltzmann多相流模拟的分层网格自适应格式、计算和《流体》,35(2006),第820-830页·Zbl 1177.76332号
[63] Uintah,(2018-04-15访问)。
[64] waLBerla,(2018-04-15访问)。
[65] 余总和范力生,基于相互作用势的自适应网格细化格子Boltzmann方法在两相流模拟中的应用,J.计算。物理。,228(2009),第6456–6478页·Zbl 1261.76048号
[66] 佐尔坦(2018-04-15)。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。