×

在多核系统上设计三维并行存储软件格子Boltzmann算法。 (英语) Zbl 1514.76059号

Sousa,Leonel(编辑)等人,《2021年欧洲专利法:并行处理》。第27届并行和分布式计算国际会议,葡萄牙里斯本,2021年9月1日至3日。诉讼程序。查姆:斯普林格。莱克特。注释计算。科学。12820, 519-535 (2021).
摘要:格子Boltzmann方法(LBM)是解决计算流体力学(CFD)问题的一种很有前途的方法,但其内存边界的性质限制了几乎所有LBM算法在现代计算机体系结构上的性能。本文介绍了一种新颖的顺序和并行三维存储软件LBM算法,以优化其存储访问性能。引入的新算法结合了单拷贝分布、单扫描、交换算法、棱镜遍历和合并两个时间步长的特点。我们还设计了一种并行方法来保证并行LBM算法中的线程安全并减少同步。最后,我们评估了它们在三个高端多核系统上的性能,并证明我们新的3D内存LBM算法比最先进的Palabos软件(实现Fuse Swap Prism LBM解算器)性能高达89%。
关于整个系列,请参见[Zbl 1483.68013号].

理学硕士:

76米28 粒子法和晶格气体法
2005年5月 并行数值计算
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Bailey,P.、Myre,J.、Walsh,S.D.、Lilja,D.J.、Saar,M.O.:使用图形处理器加速晶格Boltzmann流体流动模拟。摘自:2009年并行处理国际会议,第550-557页。IEEE(2009)
[2] 科雷克萨斯州。;肖伯德,B。;Latt,J.,《格子Boltzmann框架中碰撞模型的综合比较:理论研究》,Phys。E版,100,3033305(2019年)·doi:10.1103/PhysRevE.100.033305
[3] 克里米亚,G。;Mantovani,F。;皮万蒂,M。;希法诺,旧金山;Tripiccione,R.,在Xeon-Phi协处理器上移植和运行Lattice Boltzmann代码的早期经验,Procedia Compute。科学。,18, 551-560 (2013) ·doi:10.1016/j.procs.2013.05.219
[4] Feichtinger,C。;Donath,S。;Köstler,H。;Götz,J。;Rüde,U.,WaLBerla:计算工程模拟的HPC软件设计,J.Compute。科学。,2, 2, 105-112 (2011) ·doi:10.1016/j.jocs.2011.01.004
[5] Fu,Y.,Li,F.,Song,F.和Zhu,L.:在多核系统上设计并行存储软件格子Boltzmann算法。摘自:第30届计算机体系结构与高性能计算国际研讨会,第97-106页。IEEE(2018)
[6] 盖尔,M。;Schönherr,M.,《Esoteric twist:大规模并行硬件上格子Boltzmann方法的一种高效就地流算法》,计算,5,2,19(2017)·doi:10.3390/计算5020019
[7] Habich,J.,Zeiser,T.,Hager,G.,Wellein,G.:通过多核软件波前并行化为晶格Boltzmann流求解器启用时间阻塞。摘自:第21届并行计算流体动力学国际会议,第178-182页(2009年)
[8] 尤夫林,V。;Latt,J.,《OpenLB项目:格子Boltzmann方法的开源和面向对象实现》,国际期刊Mod。物理学。C、 18、4、627-634(2007)·Zbl 1388.76293号 ·doi:10.1142/S0129183107010875
[9] Latt,J.:《技术报告:如何在每个节点只使用q个变量(而不是2q)的情况下实现DdQq动态,第1-8页。塔夫茨大学(2007)
[10] Latt,J.,Palabos:平行晶格Boltzmann解算器,计算。数学。申请。,81333-350(2020)·Zbl 1524.76288号 ·doi:10.1016/j.camwa.200.03.022
[11] Liu,S.,Zou,N.,et al.:利用时间局部性加速格子Boltzmann方法的并行化。摘自:并行和分布式处理及应用国际研讨会,第1186-1193页。IEEE(2017)
[12] Malas,T。;海格·G。;Ltaief,H.等人。;斯坦格尔,H。;Wellein,G。;Keyes,D.,用于优化模具更新的多核优化波前菱形块,SIAM J.Sci。计算。,37、4、C439-C464(2015)·Zbl 1331.68286号 ·doi:10.137/140991133
[13] 马蒂拉,K。;Hyväluoma,J。;罗西,T。;Aspnäs,M。;Westerholm,J.,格子Boltzmann方法的有效交换算法,计算。物理学。社区。,176, 3, 200-210 (2007) ·Zbl 1196.76066号 ·doi:10.1016/j.cpc.2006.09.005
[14] Mazzeo,医学博士;Coveney,PV,HemeLB:一种用于复杂几何中大规模流体流动的高性能并行格子Boltzmann代码,计算。物理学。社区。,178, 12, 894-914 (2008) ·Zbl 1196.76008号 ·doi:10.1016/j.cpc.2008.02.013
[15] 穆苏比(2021)。https://geb.sts.nt.uni-siegen.de/doxy/musubi/index.html
[16] OpenMP(2021)。网址:http://www.openmp.org
[17] 帕拉博斯(2021)。https://palabos.unige.ch网址/
[18] Perepelkina,A。;列夫琴科,V。;沃沃丁,V。;Sobolev,S.,用于LBM实现的带有非局部矢量化的LRnLA算法ConeFold,超级计算,101-113(2019),Cham:Springer,Cham·doi:10.1007/978-3-030-05807-4_9
[19] 波尔,T。;科瓦希克,M。;Wilke,J。;Iglberger,K。;Rüde,U.,并行格子Boltzmann码缓存性能的优化和剖析,并行过程。莱特。,第13页,第4页,第549-560页(2003年)·doi:10.1142/S0129626403001501
[20] Randles,A.P.,Kale,V.,Hammond,J.,Gropp,W.,Kaxiras,E.:超越Navier-Stokes的晶格玻尔兹曼模型的性能分析。摘自:第27届并行和分布式处理国际研讨会,第1063-1074页。IEEE(2013)
[21] Rivera,G.,Tseng,C.W.:三维科学计算的平铺优化。摘自:2000年ACM/IEEE超级计算会议记录,SC 2000,第32页。IEEE(2000)
[22] Rosales,C.等人:Remora:一个面向每个人的资源监控工具。摘自:第二届HPC用户支持工具国际研讨会论文集,第1-8页(2015年)
[23] Slaughter,E.等人:任务台:用于评估并行运行时性能的参数化基准。摘自:高性能计算、网络、存储和分析国际会议,SC 2020,第1-15页。IEEE(2020)
[24] Succi,S。;阿马蒂,G。;伯纳西,M。;Falcucci,G.,《迈向exascale晶格玻尔兹曼计算》,《计算》。流体,181107-115(2019)·Zbl 1410.76380号 ·doi:10.1016/j.compfluid.2019.01.005
[25] Valero-Lara,P.,减少GPU上大型LBM仿真的内存需求,并发计算。实际。有效期:29、24、e4221(2017)·doi:10.1002/cpe.4221
[26] Vardhan,M.,Gounley,J.,Hegele,L.,Draeger,E.W.,Randles,A.:大规模并行硬件上格子Boltzmann方法中的力矩表示。摘自:《高性能计算、网络、存储和分析国际会议记录》,SC 2019,第1-21页(2019)
[27] Wellein,G.、Hager,G.,Zeiser,T.、Wittmann,M.、Fehske,H.:通过多核软件波前并行化实现模板计算的高效时间块。收录于:第33届IEEE国际计算机软件和应用年会,第1卷,第579-586页。IEEE(2009)
[28] Witherden,F.D.,Jameson,A.:计算流体动力学的未来方向。摘自:第23届AIAA计算流体动力学会议,第3791页(2017年)
[29] Wittmann,M。;Zeiser,T。;海格·G。;Wellein,G.,格子Boltzmann方法不同传播步骤的比较,计算。数学。申请。,65, 6, 924-935 (2013) ·Zbl 1319.76043号 ·doi:10.1016/j.camwa.2012.05.002
[30] 扎沃兹基,G。;van Rooij,B。;阿齐兹,V。;Alowayyed,S。;Hoekstra,A.,《血细胞:高性能显微细胞库》,Procedia Comput。科学。,108, 159-165 (2017) ·doi:10.1016/j.procs.2017.05.084
[31] Zeiser,T。;韦莱因,G。;Nitsure,A。;Iglberger,K。;鲁德,美国。;Hager,G.,为格子Boltzmann方法引入并行缓存不经意阻塞方法,Prog。计算。流体动力学。国际期刊,8,1-4,179-188(2008)·Zbl 1388.76320号 ·doi:10.1504/PCFD.2008.018088
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。