仿真/建模/设计

使用NVTAGS实现通信密集型HPC应用程序高达75%的性能改进

2021年6月23日

由洛根·赫切和伊曼·法拉吉

喜欢

讨论（0）

许多GPU加速的HPC应用程序在非均匀GPU到GPU通信中花费了大量时间。此外，在许多HPC系统中，不同的GPU对共享具有不同带宽和延迟的通信链路。因此，GPU分配会大大影响解决方案的时间。此外，在多节点/多套接字系统上，当GPU与CPU和NIC的通信超出其系统关联范围时，通信性能可能会降低。因为资源选择依赖于系统，所以选择资源以使通信成本最小化是一项挑战。

NVIDIA拓扑感知GPU选择（NVTAGS）抽象出高效资源选择的复杂性。NVTAGS通过分析HPC应用程序并使用针对应用程序和系统定制的自定义GPU分配来启动它们，从而自动化智能GPU分配，以最大限度地降低通信成本。NVTAGS确保，无论系统的通信拓扑如何，MPI进程都可以在其自身关联范围内与CPU、NIC或HCA通信。

NVTAGS在1到16个节点上将Chroma、MILC和LAMMPS的性能从2%提高到75%。

NVTAGS的主要功能：

自动拓扑检测以及CPU和NIC/HCA绑定，独立于系统和HPC应用程序
支持带有NVIDIA Pascal、Volta和Ampere体系结构GPU的单节点和多节点、PCIe和NVIDIA NVLink
自动缓存高效GPU选择以供未来模拟使用
与Slurm和Singularity的直接集成

立即下载NVTAGS 1.0.0。

其他资源：

NVTAGS产品页面
 博客：使用NVIDIA NVTAGS克服HPC应用程序的通信拥塞

相关资源

GTC会议：Grace Hopper和Hopper系统上的Magnum IO GPUDirect、NCCL、NVSHMEM和GDA-KI
GTC会议：利用NVIDIA Grace Hopper平台加速科学工作流
NGC容器：色度
软件开发工具包：NVSHMEM公司
软件开发工具包：梅林NVTabular
软件开发工具包：GPU直接存储

喜欢

标签

仿真/建模/设计|学术/教育|NVTAGS公司|新闻|作为特色的|分子动力学|磁粉探伤|多-GPU|超级计算

关于作者

关于Logan Herche
Logan Herche是NVIDIA的高级系统软件工程师。他与HPC应用程序开发人员合作开发工具并帮助加速HPC应用。他设计并实施深度学习解决方案，以解决从图像质量评估到数据验证的各种问题。洛根拥有太平洋大学工程科学硕士学位，以优异成绩毕业于该校。

查看Logan Herche的所有帖子

伊曼·法拉吉简介
Iman是NVIDIA的高级系统软件工程师。他与HPC应用程序开发人员合作开发工具并帮助加速HPC应用。他还致力于应用机器学习技术来改进NVIDIA的各种流程。伊曼拥有女王大学计算机工程博士学位。

查看Iman Faraji的所有帖子