徐传福;邓晓刚;张丽伦;方建斌;王光雪;姜毅;曹伟;车永刚;王永贤;王正华;刘伟;程兴华 协同CPU和GPU在天河1A超级计算机上进行复杂网格的大规模高阶CFD模拟。 (英语) Zbl 1349.76655号 J.计算。物理学。 278, 275-297 (2014). 摘要:在当前多核加速HPC系统上编程和优化复杂的、真实世界的CFD代码是非常具有挑战性的,尤其是在协作CPU和加速器以充分挖掘异构系统潜力时。本文利用MPI+OpenMP+CUDA的三层混合异构编程模型,在GPU加速的天河1A超级计算机上移植和优化了我们的高阶多块结构CFD软件HOSTA。HOSTA采用了两种自主开发的高阶紧致定差分格式WCNS和HDCS,可以模拟具有复杂几何形状的流动。我们提出了一种用于GPU上高效多块计算的双层并行化方案,并对高阶CFD方案进行了特定的内核优化。在比较一个特斯拉M2050 GPU和两个Xeon X5670 CPU时,仅使用GPU的方法实现了约1.3的加速。为了实现更大的加速,我们合作用于HOSTA的CPU和GPU,而不是使用天真的仅GPU方法。我们提出了一种新的方案来平衡存储不足GPU和存储丰富CPU。考虑到CPU和GPU负载平衡,我们将HOSTA的每个TianHe-1A节点的最大模拟问题大小提高了2.3{\(\次\)},同时与仅GPU的方法相比,协作方法可以将性能提高约45%。此外,为了在天河1A上扩展HOSTA,我们提出了一种聚集/散布优化,以最小化三维网格块的虚数据和奇异数据的PCI-e数据传输时间,并使用一些先进的CUDA和MPI功能尽可能重叠协同计算和通信。可扩展性测试表明,HOSTA可以在1024个天河1A节点上实现60%以上的并行效率。利用我们的方法,我们成功地模拟了包含800M单元的EET高升力翼型构型和包含150M单元的中国大型民用飞机构型。据我们所知,这些是最大规模的CPU-GPU协同模拟,可以解决复杂配置和高阶方案的实际CFD问题。 引用于18文件 MSC公司: 76米25 其他数值方法(流体力学)(MSC2010) 65日元10 特定类别建筑的数值算法 关键词:GPU并行化;计算流体力学;CPU-GPU协作;高阶有限差分格式;多块结构网格 软件:HOSTA公司;GPGPU(通用图形处理器);磁粉探伤;CUDA公司;开放运算语言 PDF格式BibTeX公司 XML格式引用 \textit{C.Xu}等人,J.Compute。物理学。278275-297(2014年;Zbl 1349.76655) 全文: 内政部 参考文献: [1] NVIDIA Corp.,CUDA C编程指南v4.2(2012) [2] Cuda Fortran(2013),在线提供 [3] Khronos OpenCL工作组(2013年) [4] Mont-Blanc项目主页(2013),在线提供 [5] Top500引用(2013),在线提供 [6] N.亚当斯。;Shariff,K.,《激波-湍流相互作用问题的高分辨率混合紧-ENO格式》,J.Compute。物理。,127 (1996) ·Zbl 0859.76041号 [7] Albayrak,E.,通过内核映射改进异构多核系统上的应用程序行为,并行计算。(2013) [8] Antoniou,A.S。;Karantasis,K.I。;Polychronopoulos,E.D.,多核架构大规模仿真有限差分WENO方案的加速(2010),AIAA论文2010-0525 [10] Appleyard,J。;Drikakis,D.,高并行MPI和GPU系统的高阶CFD和界面跟踪方法,计算。流体,46,101-105(2011)·Zbl 1431.76005号 [11] Bodony,D.J.,计算流体力学海绵区分析,计算机杂志。物理。,212, 681-702 (2006) ·Zbl 1161.76539号 [12] 鲍里斯,J。;格林斯坦,F。;奥兰,E。;Kolbe,R.,《大涡模拟的新见解》,Fluid Dyn。决议,10(1992年) [14] 卡斯通圭,P。;威廉姆斯,D.M。;文森特,体育。;洛佩兹,M。;Jameson,A.,关于混合非结构化网格高阶、多GPU支持的可压缩粘性流求解器的开发(2011年),AIAA论文2011-3229 [15] Cockburn,B。;Shu,C.W.,冲击计算的非线性稳定紧致格式,SIAM J.Numer。分析。,31, 607-630 (1994) ·Zbl 0805.65085号 [16] 科里根,A。;Lohner,R.,《将FEFLO移植到多GPU集群》(2011年),AIAA论文2011-0948 [17] 德利昂,R。;雅各布森,D。;Senocak,I.,GPU集群上湍流不可压缩流动的大涡模拟,计算。科学。工程,15,26-33(2013) [19] 邓,X。;毛,M。;Tu,G.,将五阶加权紧致非线性格式扩展到具有基于特征的界面条件的复杂网格,AIAA J.,48,2840-2851(2010) [20] 邓,X。;毛,M。;Tu,G.,高阶和高精度CFD方法及其在复杂网格问题中的应用,Commun。计算。物理。,11, 1081-1102 (2012) ·Zbl 1373.76162号 [21] 邓,X。;毛,M。;Tu,G。;刘,H。;Zhang,H.,几何守恒定律及其在固定网格高阶有限差分格式中的应用,J.Compute。物理。,230, 1100-1115 (2011) ·Zbl 1210.65153号 [22] 邓,X。;Min,Y.(最小值)。;毛,M。;刘,H。;Tu,G。;Zhang,H.,《几何守恒定律的进一步研究及其在固定网格高阶有限差分格式中的应用》,J.Compute。物理。,239, 90-111 (2013) ·兹比尔1284.65101 [23] 邓,X。;张华,发展高阶加权紧致非线性格式,J.Compute。物理。,165, 22-44 (2000) ·Zbl 0988.76060号 [24] Ekaterinaris,J.,空气动力学的高阶精确、低数值扩散方法,Prog。Aerosp.航空公司。科学。,41, 192-300 (2005) [25] Fujii,K。;Nonomura,T。;Tsutsumi,S.,《精确模拟和分析强声波现象——来自我们研究火箭问题经验的回顾》,国际J·Numer出版社。液体方法,64,1412-1432(2010)·Zbl 1427.76020号 [26] GPGPU,图形硬件通用计算(2013),在线提供 [28] 哈滕,A。;Tal-Ezer,H.,关于双曲守恒律的四阶精确隐式有限差分格式,II。五点方案,J.Compute。物理。,41, 329-356 (1981) ·Zbl 0468.65052号 [29] Intel,Many integrated core(MIC)architecture(2013),在线提供 [30] 雅各布森,D.A。;Senocak,I.,使用二级和三级并行在多GPU集群上进行不可压缩流计算的可伸缩性(2011年),AIAA论文2011-947 [31] 雅各布森,D.A。;Thibault,J.C。;Senocak,I.,多GPU集群上大规模并行不可压缩流计算的MPI-CUDA实现(2010),AIAA论文2010-0522 [32] 詹金斯,L。;科拉米,M。;Choudhari,M.,前缘缝翼附近非定常流动结构的表征:第一部分PIV测量(2004),AIAA论文2004-2801 [33] 江,G。;Shu,C.,加权ENO方案的高效实现,J.Compute。物理。,126, 202-228 (1996) ·Zbl 0877.65065号 [34] Khajeh-Saeed,A。;Perot,J.B.,《使用多种图形处理器的计算流体动力学模拟》,《计算》。科学。工程(2012) [36] Lele,S.,具有光谱分辨率的紧凑有限差分格式,J.Compute。物理。,103, 16-42 (1992) ·Zbl 0759.65006号 [37] Nonomura,T.,曲线网格上高阶WENO和WCNS的自由流和涡流保持特性,计算。流体,39,197-214(2010)·Zbl 1242.76180号 [38] 菲利普斯·E·H。;Zhang,Y。;Davis,R.L。;Owens,J.D.,《图形处理单元集群的快速空气动力学性能预测》(2009),AIAA论文2009-565 [39] Pirozzoli,S.,用于冲击-湍流相互作用的保守混合紧凑WENO方案,J.Comput。物理。,179, 81-117 (2002) ·兹比尔1045.76029 [40] Poinsot,T。;Lele,S.K.,可压缩粘性流直接模拟的边界条件,J.Comput。物理。,101, 104-129 (1992) ·Zbl 0766.76084号 [41] 任,Y。;刘,M。;Zhang,H.,用于求解双曲守恒的特征向混合紧-WENO格式,J.Compute。物理。,192365-386(2005年)·Zbl 1037.65090号 [42] Rizzetta,D。;维斯巴尔,M。;Morgan,P.,主动流量控制大流量模拟的高阶紧致有限差分格式,Prog。Aerosp.航空公司。科学。,44, 397-426 (2008) [43] 特鲁利奥,J。;Trigger,K.,任意含时坐标系中一维流体力学方程的数值解(1961年),加利福尼亚大学劳伦斯辐射实验室,技术报告UCLR-6522 [44] 图昆,B。;Edis,F.O.,高阶紧致有限差分格式的GPU应用,计算。流体,55,29-35(2012)·Zbl 1291.76232号 [45] 维斯巴尔,M。;Gaitonde,D.,复杂非定常亚音速流动的高阶精度方法,AIAA J.,371231-1239(1999) [47] Wang,Z.,非结构网格上Euler和Navier-Stokes方程的高阶方法,Prog。Aerosp.航空公司。科学。,43, 1-41 (2007) [49] 杨,X。;廖,X。;Lu,K.,《天河-1A超级计算机:硬件和软件》,J.Compute。科学。技术。,26, 344-351 (2011) [50] Ytterstrom,A.,《用于并行计算力学的结构化多块网格划分工具》,《国际高性能计算》。申请。,11, 336-343 (1997) [51] Zaspel,P。;Griebel,M.,求解多GPU集群上的不可压缩两相流,计算。流体(2012)·Zbl 1284.76012号 此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。