仿真/建模/设计

使用NVTAGS实现通信密集型HPC应用程序高达75%的性能改进

许多GPU加速的HPC应用程序在非均匀GPU到GPU通信中花费了大量时间。此外,在许多HPC系统中,不同的GPU对共享具有不同带宽和延迟的通信链路。因此,GPU分配会大大影响解决方案的时间。此外,在多节点/多套接字系统上,当GPU与CPU和NIC的通信超出其系统关联范围时,通信性能可能会降低。因为资源选择依赖于系统,所以选择资源以使通信成本最小化是一项挑战。

NVIDIA拓扑感知GPU选择(NVTAGS)抽象出高效资源选择的复杂性。NVTAGS通过分析HPC应用程序并使用针对应用程序和系统定制的自定义GPU分配来启动它们,从而自动化智能GPU分配,以最大限度地降低通信成本。NVTAGS确保,无论系统的通信拓扑如何,MPI进程都可以在其自身关联范围内与CPU、NIC或HCA通信。 

NVTAGS在1到16个节点上将Chroma、MILC和LAMMPS的性能从2%提高到75%。

NVTAGS的主要功能:

  • 自动拓扑检测以及CPU和NIC/HCA绑定,独立于系统和HPC应用程序
  • 支持带有NVIDIA Pascal、Volta和Ampere体系结构GPU的单节点和多节点、PCIe和NVIDIA NVLink
  • 自动缓存高效GPU选择以供未来模拟使用
  • 与Slurm和Singularity的直接集成

立即下载NVTAGS 1.0.0。 

其他资源:

NVTAGS产品页面
博客:使用NVIDIA NVTAGS克服HPC应用程序的通信拥塞

相关资源

讨论(0)

标签