A hierarchical parallel implementation for heterogeneous computing. Application to algebra-based CFD simulations on hybrid supercomputers

Álvarez Farré, Xavier; Gorobets, Andrei; Trias Miquel, Francesc Xavier

doi:10.1016/j.compfluid.2020.104768

维萨利察/奥布雷

咖啡纸.pdf（1251Mb）

Veure estadístiques d’ús d’UPCommons公司

洛杉矶参考/重新选择建筑

Cita公司：

Mostra el registre d’item完成

阿尔瓦雷斯·法雷，泽维尔

安德烈·戈罗贝茨

特里亚斯·米克尔、弗朗西斯科·泽维尔

Tipus de文档第条

数据公开2021-01

编辑器爱思维尔

附加条件Accés obert公司

Llevat que’hi indiqui el-contari，els公司continguts d'aquesta obra estan主题为创意共享空间:Reneximent-NoComercial-SenseObraDerivada 4.0国际

项目ALGORITMOS NUMERICOS AVANZADOS PARA LA MEJORA DE LA EFICIENCIA EN-LOS部门EOLICO Y SOLAR-TERMICO:DESARROLLO%2FADAPTACION A NUEVAS ARQUITECTURAS COMPUTACIONALES（AEI-ENE2017-88697-R）

摘要

越来越多的计算体系结构推动了对仿真算法新的可移植实现的探索。此外，高性能计算系统的混合带来了额外的限制，因为需要异构计算来有效地使用处理器和大规模并行加速器。这反过来又涉及不同的并行范式和计算框架，并要求计算单元之间进行复杂的数据交换。通常，模拟代码依赖于复杂的数据结构和计算子程序，即所谓的内核，这使得可移植性非常麻烦。因此，实现可移植性的一种自然方法是显著降低数据结构和计算内核的复杂性。在我们基于代数的方法中，非结构化网格上不可压缩湍流的尺度重解模拟依赖于三个基本核：稀疏矩阵-矢量积、矢量线性组合和点积。值得注意的是，这种方法并不局限于一种特定的数值方法或一组控制方程。在我们的代码中，一个自动平衡的多级分区在不同体系结构的计算设备之间分配工作负载。计算和多级通信的重叠有效地隐藏了大规模超级计算机模拟中的数据交换开销。除了在加速器上进行计算外，还特别关注多核处理器在具有显著非均匀内存访问因子的多处理器节点上的效率。本文详细研究了使用多达9600个处理器核和多达256个图形处理器单元的各种超级计算机上不同执行模式的并行效率和性能。本工作中描述的异构实现模型是一种通用方法，非常适合于数值模拟代码中的各种子程序。

Citació阿尔瓦雷斯，X。；Gorobets，A。；Trias，F.X.异构计算的分层并行实现。应用于混合超级计算机上基于代数的CFD模拟。《计算机和流体》，2021年，第214卷，第104768/1-104768/13页

乌里http://hdl.handle.net/2117/335542

内政部2016年10月10日/j.compfluid.2020.104768

国际标准编号0045-7930

Versióde l’editor编辑https://www.sciencedirect.com/science/article/pii/S0045793020303388

Col·leccions上校

Veure estadístiques d’ús d’UPCommons公司

Mostra el registre d’item完成

装配工	Descripció	米达	格式	维萨利察
咖啡纸.pdf		12.51亿	PDF格式	维萨利察/奥布雷

UPCommons公司。UPC门户网站

异构计算的分层并行实现。在混合超级计算机上基于代数的CFD模拟中的应用

维萨利察/奥布雷

探索