A.戈罗贝茨。;苏科夫,S。;波格达诺夫,P。 在大多数类型的混合超级计算机上模拟可压缩湍流的多级并行化。 (英语) Zbl 1410.76229号 计算。流体 173, 171-177 (2018). 摘要:本文描述了一种多级MPI+OpenMP+OpenCL并行化方法,该方法可在多种混合超级计算机体系结构中提供完全的可移植性。提出了一种用于湍流非均匀计算的并行CFD算法。它使用以单元为中心的有限体积法在非结构化混合网格上进行多项式重建,模拟可压缩的Navier-Stokes方程。混合节点计算设备之间的工作负载分配采用两级划分。通信和计算的重叠掩盖了数据传输费用。可扩展性在各种HPC系统上进行了测试,包括具有8个GPU的胖节点和使用多达320个GPU(GPU)的超级计算机。比较了多核CPU、Intel Xeon Phi、AMD和NVIDIA的各种GPU的性能。详细研究了使用CPU和GPU的异构执行。 引用于10文件 MSC公司: 76个M12 有限体积法在流体力学问题中的应用 6500万08 含偏微分方程初值和初边值问题的有限体积法 65日元10 特定类别建筑的数值算法 76层50 湍流中的压缩效应 关键词:异构计算;通用分组;非结构化网格;湍流;并行CFD 软件:MPI公司;开放运算语言;PyFR公司 PDF格式BibTeX公司 XML格式引用 \textit{A.Gorobets}等人,《计算》。液体173171--177(2018;Zbl 1410.76229) 全文: 内政部 参考文献: [1] Vincent P、Witherden F、Vermeire B、Park JS、Iyer A.与巨蟒一起迈向绿色航空。SC’16:高性能计算、网络、存储和分析国际会议记录。doi(操作界面):https://doi.org/10.109/SC.2016.1; Vincent P、Witherden F、Vermeire B、Park JS、Iyer A.与巨蟒一起迈向绿色航空。SC’16:高性能计算、网络、存储和分析国际会议纪要。doi(操作界面):https://doi.org/10.109/SC.2016.1 [2] McIntosh-Smith,S。;Curran,D.,使用opencl对性能便携式晶格Boltzmann代码的评估,IWOCL’14 opencl 2013&2014国际研讨会论文集,(2014) [3] Gorobets,A。;Trias,F.X。;Oliva,A.,用于不可压缩流混合超级计算的并行MPI+openmp+opencl算法,计算流体,88,764-772,(2013)·Zbl 1391.76090号 [4] 罗西,R。;Mossaiby,F。;Idelsohn,S.R.,图形硬件上基于opencl的便携式非结构化边缘有限元Navier-Stokes解算器,计算流体,81,134-144,(2013)·Zbl 1285.76007号 [5] F.D.威瑟顿。;C.弗梅尔,B。;Vincent,P.E.,使用pyfr在混合非结构化网格上进行异构计算,计算流体,120,173-186,(2015)·Zbl 1390.76014号 [6] 惠斯曼,I。;斯蒂勒,J。;Frohlich,J.,利用硬件异质性的流体力学算法的两级并行化,计算流体,117114-124,(2015)·Zbl 1390.76008号 [7] Oyarzun,G。;博雷尔,R。;Gorobets,A。;Mantovani,F。;Oliva,A.,基于ARM的月平面体系结构的高效CFD代码实现,未来一代计算机系统——国际电子科学杂志,79,第3部分,786-796,(2018) [8] 徐,C。;邓,X。;张,L。;方,J。;王,G。;姜瑜。;曹,W.i。;Che,Y。;Wang,Y。;王,Z。;刘伟。;Cheng,X.,天河一号超级计算机上复杂网格大规模高阶CFD模拟的GPU,计算物理杂志,278275-297,(2014)·Zbl 1349.76655号 [9] 卡特希尔,E。;McKee,J.,《减少稀疏对称矩阵的带宽》,Proc ACM 24th Nat Conf,157-172,(1969) [10] Toro,E.F.,Riemann解算器和流体动力学数值方法,(2009),柏林-海德堡施普林格出版社·Zbl 1227.76006号 [11] Wada Y.,Liou M.-S.一种对不连续性具有高分辨率和鲁棒性的通量分裂方案。AIAA论文94-0083。;Wada Y.,Liou M.-S.,高分辨率通量分裂方案,对不连续性具有鲁棒性。AIAA论文94-0083。 [12] Soukov,S.A。;Gorobets,A.V。;Bogdanov,P.B.,用于大规模并行加速器计算的非结构化网格CFD算法的基本操作的调整和优化,计算数学数学物理,53,1183-1194,(2013)·Zbl 1313.76084号 [13] 菲利普斯,E。;Fatica,M.,高性能共轭梯度基准的CUDA实现,计算机科学丛书(LNCS,第8966卷)中的讲义,68-84,(2015) 此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。