张嘉乐;陈洪泉;徐胜冠;高焕琴 一种求解可压缩湍流的新型GPU并行无网格方法。 (英语) Zbl 1459.76118号 计算。数学。申请。 80,第12期,2738-2763(2020年). 小结:本文提出了一种新的GPU并行无网格方法,用Spalart-Allmaras湍流模型求解雷诺平均Navier-Stokes方程。采用最小二乘曲线拟合离散方程的空间导数,采用Roe型迎风格式计算通量项。采用计算统一设备体系结构(CUDA)Fortran编程模型将无网格方法从CPU移植到GPU,以提高效率。对于提取的GPU并行任务,设计了一个特定的二维线程层次结构来构造相应的计算内核。然后,使用改进的策略(多层点重新排序)和提出的策略(共享内存访问调优)来管理GPU内存访问。为了验证所开发的方法,进行了一系列典型的二维和三维试验案例,包括机翼、机翼或CRM翼身组合体上的跨音速流动。计算结果与实验数据和文献报道的其他数值解吻合良好。基准测试成功地实现了令人印象深刻的速度提升,相对于单线程CPU实现,速度提升了40倍以上,79倍以下。 引用于1文件 MSC公司: 76M99型 流体力学基本方法 76层50 湍流中的压缩效应 2005年5月 并行数值计算 关键词:无网格多层点重排;共享内存访问调整;雷诺平均Navier-Stokes方程 软件:斯帕拉尔-奥尔马拉斯;FUN3D公司;CUDA公司 PDF格式BibTeX公司 XML格式引用 \textit{J.-L.Zhang}等人,计算。数学。申请。80,第12号,2738--2763(2020;Zbl 1459.76118) 全文: 内政部 参考文献: [1] Nickolls,J。;巴克,I。;加兰,M。;Skadron,K.,《使用CUDA的可扩展并行编程》,ACM Queue,6,40-53(2008) [2] 托尔克,J。;Krafczyk,M.,TeraFLOP在台式电脑上的计算,带有用于3D CFD的GPU,Int.J.Comput。流体动力学。,第22页,443-456页(2008年)·1184.76800兹罗提 [3] 托马斯·S。;Amiraux,M。;Baeder,J.D.,《在图形处理单元上对悬停转子下方的两相流场建模》,美国航空航天协会J.,53,2300-2320(2015) [4] NVIDIA,CUDA C++编程指南,版本10(2020),(2020年1月8日访问) [5] Kaeli,D。;Mistry,P。;沙阿,D。;Zhang,D.-P.,《使用OpenCL 2.0的异构计算》(2015),爱思唯尔科学有限公司。 [6] Farber,R.,《OpenACC并行编程》(2017),爱思唯尔科学有限公司。 [7] T.Brandvik,G.Pullan,使用商品图形硬件加速3D Euler解算器,AIAA论文2008-2607。 [8] Elsen,E。;LeGresley,P。;Darve,E.,使用GPU对高超声速飞行器上方的流量进行大型计算,J.Compute。物理。,227, 10148-10161 (2008) ·Zbl 1218.76035号 [9] Ma D.M.Causon,Z.H。;钱,L。;顾海波。;明厄姆,C.G。;Ferrer,P.M.,一种基于GPU的可压缩多相水力代码,用于模拟剧烈水动力冲击问题,计算与流体,120,1-23(2015)·Zbl 1390.76486号 [10] 艾萨,M。;Verstraete,T。;Vuik,C.,关于结构网格上显式和隐式CFD模拟的GPU感知比较,计算。数学。申请。,74, 201-217 (2017) ·Zbl 1394.65141号 [11] A.S.Antoniou,K.I.Karantasis,E.D.Polychronopoulos,J.A.Ekaterinaris,多核架构大规模仿真有限差分WENO方案的加速,AIAA论文2010-2525。 [12] R.Löhner,A.Corrigan,K.-R.Wichmann,W.Wall,关于CPU和GPU上有限差分求解器的可实现速度,AIAA论文2013-2852。 [13] N.S.-C.高。;Sheu,T.W.-H.,在多个GPU卡上求解三维不可压缩Navier-Stokes解的有限元流动求解器的开发,计算与流体,167285-291(2018)·Zbl 1390.76327号 [14] 科克纳,A。;沃伯顿,T。;布里奇,J。;Hesthaven,J.S.,图形处理器上的Nodal不连续伽辽金方法,J.Comput。物理。,228, 7863-7882 (2009) ·Zbl 1175.65111号 [15] Y.D.Xia,J.L.Lou,L.X.Luo,H.Luo,J.Edwards,关于三维混合网格上可压缩流动重构间断Galerkin方法的多GPU计算,AIAA论文2014-3081。 [16] Fuhry,M。;A.Giuliani,T。;L.Krivodonova,L.,非线性双曲守恒律图形处理单元上的间断Galerkin方法,国际。J.数字。《液体方法》,76,982-1003(2014) [17] J.Batina,《复杂飞行器应用的无网格Euler/Navier-Stokes解算算法》,美国航空航天局论文93-0333。 [18] Oñate,大肠杆菌。;Idelsohn,S。;齐恩凯维奇,O.C。;Taylor,R.L.,计算力学中的有限点方法。对流输送和流体流动应用,国际。J.数字。方法工程,39,3839-3866(1996)·Zbl 0884.76068号 [19] Löhner,R。;萨克,C。;Oñate,E。;Idelsohn,S.,可压缩流动的有限点法,国际。J.数字。方法工程,53,1765-1779(2002)·Zbl 1004.76068号 [20] Sridar,D。;Balakrishnan,N.,无网格求解器的迎风有限差分格式,J.Compute。物理。,189, 1, 1-29 (2003) ·Zbl 1023.76034号 [21] 马,Z.H。;陈洪秋。;Zhou,C.H.,无网格方法中点移动自适应性的研究,计算。方法应用。机械。工程,197,21-24,1926-1937(2008)·Zbl 1194.76210号 [22] Wang,H。;陈洪秋。;Periaux,J.,《用动态点云进行无网格方法研究以解决空气动力学中的非定常CFD问题》,国际。J.数字。液体方法,64,1,98-118(2010)·Zbl 1375.76140号 [23] Chiu,E.K.-Y。;王秋秋。;胡,R。;Jameson,A.,守恒定律的保守无网格格式和广义框架,SIAM J.Sci。计算。,34,6,A2896-A2916(2012年)·兹比尔1269.65077 [24] 陈洪秋。;Shu,C.,求解二维可压缩Euler方程的高效隐式无网格方法,国际。现代物理学杂志。C、 16、439-454(2005)·Zbl 1103.76351号 [25] A.卡茨。;Jameson,A.,《多云:使用无网格算子的多重网格收敛》,J.Compute。物理。,228、5237-5250(2009年)·兹比尔1280.76040 [26] Kirshman,D.J。;Liu,F.,用多重网格在嵌入式笛卡尔网格上解Euler方程的无网格边界条件方法,J.Compute。物理。,201, 1, 119-147 (2004) ·Zbl 1195.76318号 [27] Kirshman,D.J。;Liu,F.,无网格边界条件下非移动笛卡尔网格上Euler方法的颤振预测,计算与流体,35,6,571-586(2006)·Zbl 1160.76379号 [28] 马,Z.H。;陈洪秋。;吴晓杰,欧拉方程的无网格-有限体积混合算法,中国。J.Aeronaut。,19, 4, 286-294 (2006) [29] 马,Z.H。;Wang,H。;Pu,S.H.,用无网格方法和填充曲线计算可压缩流动问题的GPU,J.Compute。物理。,263, 113-135 (2014) ·Zbl 1349.76505号 [30] 马,Z.H。;Wang,H。;Pu,S.H.,《非定常可压缩流动通过移动边界的图形处理单元上的并行无网格动态云方法》,计算。方法应用。机械。工程,285,146-165(2015)·Zbl 1423.76347号 [31] 张建林。;马,Z.H。;陈洪秋。;Cao,C.,可压缩流动的GPU加速隐式无网格方法,J.Compute。物理。,360,39-56(2018)·Zbl 1391.76591号 [32] 曹,C。;陈,H.Q。;张,J.L。;Xu,S.-G.,基于GPU的无网格方法用于可压缩流动模拟的多层点重新排序研究,J.Compute。科学。,33, 45-60 (2019) [33] P.R.Spalart、S.R.Allmaras,空气动力流动的单方程湍流模型,AIAA论文92-0439。 [34] Roe,P.L.,近似黎曼解算器,参数向量和差分格式,J.Compute。物理。,43, 357-372 (1981) ·Zbl 0474.65066号 [35] A.Jameson,W.Schmidt,E.Turkel,使用龙格-库塔时间步进格式用有限体积法对Euler方程进行数值求解,AIAA论文81-1259。 [36] Ruetsch,G。;Fatica,M.,《CUDA Fortran科学家和工程师:高效CUDA Forran编程的最佳实践》(2014),爱思唯尔科学有限公司。 [37] L.I.I.、W.Sutherland、。,《气体粘度和分子力》,爱丁堡Phil.Mag.Edinburgh,36507-531(1893) [38] 张建林。;陈,H.Q。;Cao,C.,《二维可压缩流动的图形处理单元-加速无网格方法》,《工程应用》。计算。流体力学。,11, 526-543 (2017) [39] Venkatakrishnan,V.,可压缩Navier-Stokes方程的预处理共轭梯度法,AIAA J.,29,1092-1100(1991) [40] Blazek,J.,《计算流体动力学:原理与应用》(2005),爱思唯尔科学有限公司:爱思唯尔科学有限责任公司,阿姆斯特丹·Zbl 0995.76001号 [41] 拉卡斯塔,A。;莫拉莱斯·亨南德斯,M。;Murillo,J。;García-Navarro,P.,非结构化网格上二维自由曲面仿真模型的优化GPU实现,高级工程软件。,78, 1-15 (2014) [42] 吉布斯,N.E。;普尔,W.G。;Stockmeyer,P.K.,《减少稀疏矩阵带宽和轮廓的算法》,SIAM J.Numer。分析。,13, 2, 236-250 (1976) ·Zbl 0329.65024号 [43] NASA,NPARC联盟验证档案:RAE 2822跨音速翼型:研究#1(2008),(2020年1月8日查阅) [44] 库克,P.H。;McDonald,M.A。;Firmin,M.C.P.,《翼型RAE2822压力分布、边界层和尾流测量》,计算机程序评估实验数据库AGARD报告AR 138(1979) [45] NASA,NPARC联盟验证档案:ONERA M6机翼:研究#1(2020年),(2020年1月8日查阅) [46] V.Schmitt,F.Charpin,ONERA-M6机翼跨音速马赫数下的压力分布,计算机程序评估实验数据库,流体动力学小组工作组04(1979)AGARD AR 138的报告。 [47] 拉赫曼,M.M。;阿加瓦尔,R.K。;Lampinen,M.J。;Siikonen,T.,Spalart-Allmaras湍流模型的无壁厚版本,AIAA J.,53,3016-3027(2015) [48] S.Keye,V.Togiti,O.Brodersen,AIAA第六届计算流体动力学阻力预测研讨会的DLR结果,AIAA论文2017-4232。 [49] A.J.Sclafani、J.C.Vassberg、C.Winkler、A.J.Dorgan、M.Mani、M.E.Olsen、J.G.Coder,使用结构化和非结构化网格对翼身配置中CRM的DPW-5分析,AIAA论文2013-0048。 [50] 徐,J。;蔡建生。;刘庆华。;Qu,K.,在重叠网格上通过增强隐式掏孔方法进行的流动模拟,J.Aircr。,51, 1401-1410 (2014) [51] Lee Rausch,E.M。;哈蒙德博士。;尼尔森,E.J。;Pirzadeh,S.Z。;Rumsey,C.L.,fun3D解算器在第四届AIAA阻力预测研讨会上的应用,J.Aircr。,51, 1149-1160 (2014) [52] R.Löhner,A.Corrigan,K.-R.Wichmann,W.Wall,格子Boltzmann和有限差分求解器的比较,AIAA论文2014-1439。 此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。