吉、华;连富生;张,范 浸没边界法的GPU加速自适应网格细化。 (英语) Zbl 1390.65102号 计算。流体 118131-147(2015). 摘要:开发了一种新的基于补丁的自适应网格细化(AMR)代码。全线程树(FTT)数据结构[A.M.科克洛夫,J.计算。物理。143,第2期,519–543(1998年;Zbl 0934.76057号)]最初为基于单元的AMR开发的模型被扩展为组织基于补丁的自适应网格。通过对二维和三维Sedov爆炸波问题的模拟,我们证明了AMR代码的准确性。我们通过在单个CPU上解决不同网格分辨率下的相同问题来衡量代码的性能,其中详细的时序分析提供了当前AMR代码与传统的基于八叉树的AMR代码(FLASH 4.0.1)之间的比较[B.Fryxell公司等人,“FLASH:用于模拟天体物理热核闪光的自适应网格流体动力学代码”,《天体物理学》。补充期刊。131,第1期,273–334(2000年;doi:10.1086/317361)]. 对于二维情况,在有效网格分辨率为512^2的情况下,与FLASH 4.0.1相比,获得了58.23的最大加速比。对于三维情况,在有效网格分辨率为128^3的情况下,FLASH 4.0.1的最大加速比为32.16。我们介绍了在图形处理单元(GPU)上使用浸入边界法(IBM)的基于补丁的AMR算法的实现和性能。我们还在GPU计算中应用了一些优化,包括异步内存复制、CPU和GPU之间的并发执行以及MPI/OpenMP/GPU混合并行化。性能基准测试在SHARCNET上的GPU集群上进行(https://www.sharcnet.ca/)使用1–8个特斯拉M2070 GPU。使用一个GPU和8个GPU(有效分辨率为2048^3)分别证明了22.3和20.5的最大加速因子。 引用于三文件 MSC公司: 65M50型 涉及偏微分方程初值和初边值问题数值解的网格生成、细化和自适应方法 65日元10 特定类别建筑的数值算法 关键词:AMR公司;通用分组;浸入边界法 引文:Zbl 0934.76057号 软件:帕拉梅什;涅槃;CUDA公司;GAMER公司;闪存;cuIBM公司;RAMSES公司 PDF格式BibTeX公司 XML格式引用 \textit{H.Ji}等人,计算。液体118、131--147(2015;Zbl 1390.65102) 全文: 内政部 参考文献: [1] 阿夫托米斯,M.J。;伯杰,M.J。;Adomavicius,G.,《复杂几何形状飞行器外部空气动力学的平行笛卡尔方法》(《热与流体分析研讨会论文集》,(1999年),美国宇航局马歇尔航天中心亨茨维尔) [2] Anderson,J.D.,《现代可压缩流》(2003),纽约麦格劳希尔出版社 [3] 巴顿,P。;N.克拉克。;兰伯特,C。;Causon,D.,《关于HLLC黎曼解算器波速的选择》,SIAM科学计算杂志,18,1553,(1997)·Zbl 0992.65088号 [4] 伯杰,M.J。;Oliger,J.,《冲击流体动力学自适应网格优化》,《计算物理杂志》,53,484,(1984)·兹伯利0536.65071 [5] 伯杰,M.J。;Collela,P.,《冲击流体动力学的局部自适应网格细化》,《计算物理杂志》,64,82,(1989)·Zbl 0665.76070号 [6] Berger MJ,LeVeque RJ。任意几何形状欧拉方程的自适应笛卡尔网格算法。AIAA论文89-1930-CP;1989 [7] Che,S。;博伊尔,M。;孟,J。;Tarjan博士。;Sheaffer,J。;Skadron,K.,《使用CUDA的图形处理器上通用应用程序的性能研究》,J Parallel Distrib Compute,68,1370,(2008) [8] Bryson,A.E。;Gross,R.W.,《圆锥、圆柱和球体对强冲击的衍射》,《流体力学杂志》,10,1,(1960)·Zbl 0100.22103号 [9] 英伟达。CUDA参考手册5.5;2013 [10] Deiterding,R.,《用复杂域中详细化学动力学模拟冲击诱导燃烧的并行自适应方法》,计算结构,87,769,(2009) [11] Fedkiw,R.P。;Aslam,T。;Merriman,B。;Osher,S.,《多材料流动界面的非振荡欧拉方法(鬼流体方法)》,《计算物理杂志》,152,457,(1999)·Zbl 0957.76052号 [12] Ferziger,J.H。;Perić,M.,流体动力学的计算方法,(1996),柏林斯普林格-Verlag出版社·Zbl 0869.76003号 [13] Fryxell,B。;Olson,K。;Ricker,P.,FLASH:一种用于模拟天体物理热核闪光的自适应网格流体动力学代码,《天体物理学杂志补编》,131273,(2000) [14] Hubbard BJ、Chen HC。不可压缩粘性流的Chimera格式及其在潜艇流体动力学中的应用。AIAA论文94-2210;1994 [15] 纪浩。;留置权,F.S。;Yee,E.,求解不规则区域上具有跳跃条件的变系数泊松方程的一种高效的二阶精确割心方法,国际J数值方法流体,52,723,(2006)·Zbl 1108.65112号 [16] 纪浩。;留置权,F.S。;Yee,E.,一种新的自适应网格细化数据结构及其在爆炸中的应用,J Compute Phys,2298981,(2010)·兹比尔1207.80023 [17] Kaca J.对平面激波在半圆形圆柱体上衍射的干涉测量研究。多伦多大学航空航天研究所(UTIAS)。技术说明269;1988 [18] Khokhlov,A.M.,《自适应网格流体动力学模拟的全线程树算法》,《计算物理杂志》,143,519,(1998)·Zbl 0934.76057号 [19] Kao,K.H。;Liou,M.S.,《重叠电网方案的进展:从Chimera到DRAGON电网》,AIAA J,33,1809,(1995)·Zbl 0856.76060号 [20] Landau LD,Lifshitz EM.流体力学。牛津大学第二版;1987年·Zbl 0655.76001号 [21] Laytona SK、Krishnana A、Barbaa LA、cuIBM-一种GPU加速浸没边界法。参加:第23届并行计算流体动力学国际会议(ParCFD);2011 [22] Lawder,J.K。;King,P.J.H.,将状态图用于希尔伯特曲线映射,国际计算数学杂志,327,78,(2001)·Zbl 0991.68018号 [23] Lawder,J.K。;King,P.J.H.,使用希尔伯特填充曲线查询多维数据索引,ACM Sigmod Rec,19,30,(2001) [24] Löhner,R.,瞬态问题的自适应重网格,Comput Methods Appl Mech Eng,195,75,(1989)·Zbl 0689.68116号 [25] MacNeice,P。;Olson,K.M。;莫巴里,C。;德芬斯坦,R。;Packer,C.,PARAMESH:一个并行自适应网格细化社区工具包,Compute Phys Commun,126330,(2000)·Zbl 0953.65088号 [26] 米塔尔·R。;Iacarino,G.,浸没边界法,《流体力学年鉴》,37,239,(2005)·Zbl 1117.76049号 [27] J.D.欧文斯。;马萨诸塞州休斯顿。;Luebke,D。;格林,S。;斯通,J.E。;Phillips,J.C.,GPU计算,IEEE程序,96,879,(2008) [28] Quirk,J.J.,《计算任意复杂二维物体周围气体动力流动的非结构化网格的替代方法》,计算流体,23,125,(1994)·Zbl 0788.76067号 [29] Saltzman,J.,《双曲守恒律的非分裂三维迎风方法》,《计算物理杂志》,115,153,(1994)·Zbl 0813.65111号 [30] 希夫,H。;蔡,Y。;Chiueh,T.,GAMER:一种用于天体物理学的图形处理单元加速的自适应修正码,天体物理学J Suppl Ser,186,457,(2010) [31] 希夫,H。;张,U.-H。;Chiueh,T.,AMR中具有混合MPI/openmp/GPU并行化的定向非分裂流体动力学方案,Int J High Perform Comput Appl,26367,(2012) [32] Sedov,L.I.,《力学中的相似性和量纲方法》(1959),纽约学术出版社·Zbl 0121.18504号 [33] https://www.sharcnet.ca/。 [34] Teyssier,R.,《具有自适应网格细化的宇宙流体动力学:一种称为RAMSES的新的高分辨率代码》,《天体天体物理学》,385337,(2002) [35] Taira,K。;Colonius,T.,《浸没边界法:投影法》,《计算物理杂志》,225,2118,(2007)·Zbl 1343.76027号 [36] 汤姆森,J。;瓦尔西,Z.V.A。;Mastin,C.W.,《数值网格生成:基础和应用》(1985),纽约州北荷兰人·Zbl 0598.65086号 [37] Toro,E.F.,流体动力学的黎曼解算器和数值方法,(1997),施普林格柏林·Zbl 0888.76001号 [38] Uhlmann,M.,《模拟颗粒流的直接强迫浸没边界法》,《计算物理杂志》,209,448,(2005)·Zbl 1138.76398号 [39] Valero-Lara,P.,《基于浸没边界法在多核和GPU架构上加速固液相互作用》,《超级计算机杂志》,70,1,(2014) [40] Valero-Lara,P。;Pinelli,A。;Prieto-Matias,M.,《使用格子Boltzmann加速异质平台上的固液相互作用和浸没边界耦合模拟》,Proc-Comput-Sci,29,50,(2014) [41] Venkatakrishan,V.,《非结构化网格流求解器的透视》,AIAA J,34,533,(1996)·Zbl 0896.76002号 [42] 王,P。;Abel,T。;Kaehler,R.,GPU上的自适应网格流体模拟,New Astron,15,581,(2010) [43] 齐格勒,U.,《采用NIRVANA代码的自引力自适应网格磁流体动力学》,Astron Astrophys,385435,(2005) 此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。