文件Zbl 1410.76229-zbMATH Open

在大多数类型的混合超级计算机上模拟可压缩湍流的多级并行化。（英语） Zbl 1410.76229号

计算。流体 173, 171-177 (2018).

摘要：本文描述了一种多级MPI+OpenMP+OpenCL并行化方法，该方法可在多种混合超级计算机体系结构中提供完全的可移植性。提出了一种用于湍流非均匀计算的并行CFD算法。它使用以单元为中心的有限体积法在非结构化混合网格上进行多项式重建，模拟可压缩的Navier-Stokes方程。混合节点计算设备之间的工作负载分配采用两级划分。通信和计算的重叠掩盖了数据传输费用。可扩展性在各种HPC系统上进行了测试，包括具有8个GPU的胖节点和使用多达320个GPU（GPU）的超级计算机。比较了多核CPU、Intel Xeon Phi、AMD和NVIDIA的各种GPU的性能。详细研究了使用CPU和GPU的异构执行。

引用于10文件

MSC公司：

76个M12	有限体积法在流体力学问题中的应用
6500万08	含偏微分方程初值和初边值问题的有限体积法
65日元10	特定类别建筑的数值算法
76层50	湍流中的压缩效应

关键词：

异构计算；通用分组；非结构化网格；湍流；并行CFD

软件：

MPI公司；开放运算语言；PyFR公司

PDF格式 BibTeX公司 XML格式引用

全文：内政部

参考文献：

[1]	Vincent P、Witherden F、Vermeire B、Park JS、Iyer A.与巨蟒一起迈向绿色航空。SC’16：高性能计算、网络、存储和分析国际会议记录。doi（操作界面）：https://doi.org/10.109/SC.2016.1; Vincent P、Witherden F、Vermeire B、Park JS、Iyer A.与巨蟒一起迈向绿色航空。SC’16：高性能计算、网络、存储和分析国际会议纪要。doi（操作界面）：https://doi.org/10.109/SC.2016.1
[2]	McIntosh-Smith，S。；Curran，D.，使用opencl对性能便携式晶格Boltzmann代码的评估，IWOCL’14 opencl 2013&2014国际研讨会论文集，（2014）
[3]	Gorobets，A。；Trias，F.X。；Oliva，A.，用于不可压缩流混合超级计算的并行MPI+openmp+opencl算法，计算流体，88，764-772，（2013）·Zbl 1391.76090号
[4]	罗西，R。；Mossaiby，F。；Idelsohn，S.R.，图形硬件上基于opencl的便携式非结构化边缘有限元Navier-Stokes解算器，计算流体，81，134-144，（2013）·Zbl 1285.76007号
[5]	F.D.威瑟顿。；C.弗梅尔，B。；Vincent，P.E.，使用pyfr在混合非结构化网格上进行异构计算，计算流体，120，173-186，（2015）·Zbl 1390.76014号
[6]	惠斯曼，I。；斯蒂勒，J。；Frohlich，J.，利用硬件异质性的流体力学算法的两级并行化，计算流体，117114-124，（2015）·Zbl 1390.76008号
[7]	Oyarzun，G。；博雷尔，R。；Gorobets，A。；Mantovani，F。；Oliva，A.，基于ARM的月平面体系结构的高效CFD代码实现，未来一代计算机系统——国际电子科学杂志，79，第3部分，786-796，（2018）
[8]	徐，C。；邓，X。；张，L。；方，J。；王，G。；姜瑜。；曹，W.i。；Che，Y。；Wang，Y。；王，Z。；刘伟。；Cheng，X.，天河一号超级计算机上复杂网格大规模高阶CFD模拟的GPU，计算物理杂志，278275-297，（2014）·Zbl 1349.76655号
[9]	卡特希尔，E。；McKee，J.，《减少稀疏对称矩阵的带宽》，Proc ACM 24th Nat Conf，157-172，（1969）
[10]	Toro，E.F.，Riemann解算器和流体动力学数值方法，（2009），柏林-海德堡施普林格出版社·Zbl 1227.76006号
[11]	Wada Y.，Liou M.-S.一种对不连续性具有高分辨率和鲁棒性的通量分裂方案。AIAA论文94-0083。；Wada Y.，Liou M.-S.，高分辨率通量分裂方案，对不连续性具有鲁棒性。AIAA论文94-0083。
[12]	Soukov，S.A。；Gorobets，A.V。；Bogdanov，P.B.，用于大规模并行加速器计算的非结构化网格CFD算法的基本操作的调整和优化，计算数学数学物理，53，1183-1194，（2013）·Zbl 1313.76084号
[13]	菲利普斯，E。；Fatica，M.，高性能共轭梯度基准的CUDA实现，计算机科学丛书（LNCS，第8966卷）中的讲义，68-84，（2015）

此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配，可能包含数据转换错误。在某些情况下，zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献，而不要求完整或完全匹配。

任何	在任何地方
一个	内部文档标识符
澳大利亚	作者、编辑
人工智能	内部作者标识符
钛	标题
洛杉矶	语言
所以	来源
实验室	回顾，摘要
第页	出版年份
车辆	评审员
复写的副本	MSC代码
美国犹他州	关键字
日期	文档类型(j个：期刊文章；b条：book；一：图书文章）

一&b条	逻辑和
一\|b条	逻辑或
!实验室	逻辑不
美国广播公司*	右通配符
"ab c公司"	短语
(ab c公司)	圆括号

示例

领域

操作员

在大多数类型的混合超级计算机上模拟可压缩湍流的多级并行化。（英语） Zbl 1410.76229号

MSC公司：

关键词：

软件：

参考文献：

示例

领域

操作员

在大多数类型的混合超级计算机上模拟可压缩湍流的多级并行化。 （英语） Zbl 1410.76229号

MSC公司：

关键词：

软件：

参考文献：

在大多数类型的混合超级计算机上模拟可压缩湍流的多级并行化。（英语） Zbl 1410.76229号