×

一种有效的结构化三维LU-SGS波前并行算法。 (英语) Zbl 1390.76672号

摘要:并行计算是科学和工程算法/应用的一项有用技术。LU-SGS(lower-upper symmetric-Gauss-Seidel method)是一种高效且稳健的CFD(计算流体力学)方法,在计算中具有很强的数据依赖性。在本文中,我们提出了一种用于具有结构化网格的三维LU-SGS的有效波前并行算法。设计了相应的数据结构和内存访问方法,具有更好的数据局部性和通信优化。针对不同的问题规模,报告了所提出的并行算法的性能。还报告了一些讨论和性能问题。结果显示,与一个E5540内核相比,一个Intel E5540 CPU(4个CPU内核)的整体性能提升范围在2.23到2.95之间。与分布式内存集群系统上的32个进程相比,1024128个进程的并行效率高达35.68%,72.69%。M6机翼模型的CFD仿真表明了该并行算法的效果。

MSC公司:

76米25 其他数值方法(流体力学)(MSC2010)
2005年5月 并行数值计算
65平方米 含偏微分方程初值和初边值问题离散方程的数值解
76D05型 不可压缩粘性流体的Navier-Stokes方程
PDF格式BibTeX公司 XML格式引用
全文: DOI程序

参考文献:

[1] 李,X.-L。;Fu,D.-X。;马,Y.-W。;Liang,X.,可压缩湍流的直接数值模拟,机械学报,26,6,795-806,(2010)·Zbl 1270.76028号
[2] 李,X。;傅,D。;Ma,Y.,小攻角钝锥上高超音速边界层过渡的直接数值模拟,Phys Fluids,22,025105,(2010)·Zbl 1183.76308号
[3] Yoon,S。;Jameson,A.,Euler和Navier-Stokes方程的Lower-upper symmetric-Gauss-Seidel方法,AIAA J,26,9,1025-1026,(1988)
[4] 在非结构化网格上使用隐式和伴随方法提高基于RANS的分析和优化的效率。曼彻斯特大学博士论文;2006
[5] 莫,Z。;张,A。;曹,X。;刘,Q。;Xu,X。;An,H.,JASMIN:科学计算的并行软件基础设施,Front Compute Sci China,4,4,480-488,(2010)
[6] 陈,F。;沈,J.,矩形域椭圆方程的GPU并行谱方法,计算物理杂志,250,0,555-564,(2013)·Zbl 1349.65641号
[7] 叶,Y。;李凯。;Wang,Y。;邓,T.,CPU-GPU混合加速系统上熵格子Boltzmann方法的并行计算,计算流体,110,114-121,(2015)·Zbl 1390.76788号
[8] 王庆林。;刘杰。;龚,C.-Y。;Xing,Z.-C.,英特尔MIC架构上3D确定性粒子输运的可扩展性,核科技,26,5,50502,(2015)
[9] Yang,C.-q。;吴琼。;胡,H.-l。;史,Z.-c。;陈,J。;Tang,T.,GPU加速非均匀系统等离子体PIC模拟的快速加权方法,南方大学学报,20,6,1527-1535,(2013)
[10] 霍夫曼,J。;詹森,J。;de Abreu,R.V。;北卡罗来纳州德吉尔门奇。;Jansson,N。;Mller,K.,《独角兽:变形域和复杂几何中湍流和流体-结构相互作用的并行自适应有限元模拟》,Comput Fluids,80,0310-319,(2013)·Zbl 1284.76223号
[11] 吴琼。;杨,C。;Tang,T。;Xiao,L.,利用层次并行性研究PB级非均匀系统的分子动力学,J Parallel Distrib Compute,73,12,1592-1604,(2013)
[12] Velghe,A。;吉列,N。;Bohbot,J.,专门用于内燃机模拟的高效并行非结构化解算器,计算流体,45,1,116-121,(2011)·Zbl 1429.76022号
[13] 龚,C。;Bao,W。;Tang,G.,Riesz分数阶反应扩散方程的显式有限差分并行算法,分形计算应用分析,16,3,654-669,(2013)·Zbl 1312.65134号
[14] 龚,C。;Bao,W。;唐·G。;杨,B。;Liu,J.,Caputo分数阶反应扩散方程的高效并行解,J Supercomput,68,3,1521-1537,(2014)
[15] 龚,C。;Bao,W。;唐·G。;姜瑜。;Liu,J.,时间分数阶反应扩散方程的区域分解方法,科学世界杂志,2014,681707,(2014)
[16] 罗德里格斯,J.M。;O.萨赫尼。;小R.T.L。;Jansen,K.E.,用于多相流数值模拟的并行自适应网格方法,Comput Fluids,8715-131,(2013)·Zbl 1290.76072号
[17] 龚,C。;刘杰。;黄,H。;龚,Z.,GPU上非结构化网格的粒子传输,计算物理通讯,183,3,588-593,(2012)
[18] 龚,C。;Bao,W。;唐·G。;Wang,L。;刘杰。;胡琼,二维结构网格CFD LU-SGS时间步进并行算法,前沿计算科学技术杂志,7,10,916-923,(2013)
[19] Li X.OpenCFD-EC3D理论手册;2012年,版本0.77,(个人通信)。
[20] 罗,H。;沙洛夫,D。;鲍姆·J·D。;Löhner,R.,湍流的并行非结构化网格GMRES+LU-SGS方法,AIAA论文,273,(2003)
[21] Ananth Grama,G.K。;安舒尔·古普塔;库马尔,V.,《并行计算导论》,(2003),马萨诸塞州波士顿艾迪生-威斯利出版社
[22] 菲科,V。;艾默生·D·R。;Reese,J.M.,《采用共享和分布式内存范式的可压缩流体动力学并行紧TVD方法》,计算流体,45,1,172-176,(2011)·Zbl 1430.76010号
[23] 格罗普,W.D。;Kaushik博士。;Keyes,D.E。;Smith,B.F.,高性能并行隐式CFD,并行计算,27,4,337-362,(2001)·Zbl 0971.68191号
[24] 尚,Y。;何毅。;Luo,Z.,基于双网格离散的稳态Navier-Stokes方程三种局部和并行有限元算法的比较,计算流体,40,1,249-257,(2011)·Zbl 1245.76056号
[25] 戈罗贝茨,A。;Trias,F。;Oliva,A.,用于不可压缩流混合超级计算的并行MPI+openmp+opencl算法,计算流体,88,764-772,(2013)·Zbl 1391.76090号
[26] 徐,C。;邓,X。;张,L。;方,J。;王,G。;姜瑜,协同CPU和GPU在天河1A超级计算机上进行复杂网格的大规模高阶CFD模拟,计算物理杂志,278,0,275-297,(2014)·Zbl 1349.76655号
[27] 王玉霞。;张,L.-L。;刘伟。;Che,Y.-G。;徐,C.-F。;Wang,Z.-H.,在天河1A超级计算机上高效并行实现大规模三维结构化网格CFD应用,计算流体,80,244-250,(2013)
[28] 刘,X。;Lu,L.,数据不规则问题的全相关块递归方程多维流水线并行解研究,中国计算机,29,10,17501756,(2006)
[29] 北曼吉基安。;Abdelrahman,T.S.,在大型共享内存多处理器上开发波前并行,IEEE跨并行分布系统,12,3,259-271,(2001)
[30] 龚,C。;刘杰。;Chi,L。;黄,H。;方,J。;龚,Z.,GPU使用离散坐标法加速三维确定性粒子输运模拟,《计算物理杂志》,230,15,6010-6022,(2011)·Zbl 1221.82085号
[31] A.海西。;O.吕贝克。;Wasserman,H.,《使用多维波前应用程序的万亿次浮点并行体系结构的性能和可扩展性分析》,《国际高性能计算应用》,14,4,330-346,(2000)
[32] Povitsky,A.,线性带状系统的流水线算法的并行化,J Parallel Distrib Comput,59,1,68-97,(1999)
[33] Eisfeld,B.,Onera m6 wing,(Haase,W.;Aupoix,B.;Bunge,U.;Schwamborn,D.,FLOMANIA:欧洲流动物理建模倡议,数值流体力学与多学科设计(NNFM)注释(2006),施普林格-柏林-海德堡),219-224
[34] Yang,C.-q。;吴琼。;Tang,T。;Wang,F。;Xue,J.-l.,《基于PB级异构并行系统的科学计算编程》,中南大学学报,20,5,1189-1203,(2013)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。