为了解开下一代发现的谜团,科学家们依靠模拟来更好地理解药物发现中的复杂分子、新能源的物理学和大气数据来更好地预测极端天气模式。领先的模拟和应用程序利用NVIDIA Magnum IO实现更快的洞察时间。Magnum IO公开了硬件级加速引擎和智能卸载,如RDMA、NVIDIA GPUDirect和NVIDIA SHARP,同时增强了NVIDIA InfiniBand和NVIDIA NVLink网络GPU的高带宽和超低延迟。
在多租户环境中,用户应用程序可能不知道来自相邻应用程序流量的不加区分的干扰。Magnum IO基于最新的NVIDIA Quantum-2 InfiniBand平台,具有新的和改进的功能,可减轻对用户性能的负面影响。这提供了最佳结果,以及任何规模的最高效HPC和ML部署。
Magnum IO库和HPC应用程序
VASP公司当MPI被NCCL取代时,性能显著提高。UCX加速了科学计算应用程序,如VASP、Chroma、MIA-AI、Fun3d、CP2K和Spec-HPC2021,以实现更快的墙锁运行时间。
NVIDIA HPC-X提高了CPU可用性、应用程序可扩展性和系统效率,从而提高了由各种HPC ISV分发的应用程序性能。NCCL、UCX和HPC-X都是HPC-SDK的一部分。
快速傅里叶变换(FFT)广泛应用于各种领域,从分子动力学、信号处理和计算流体动力学(CFD)到无线多媒体和ML应用。通过使用NVIDIA共享内存库(NVSHMEM)™,cuFFTMp独立于MPI实现,并以接近光速的速度运行,这一点至关重要,因为不同MPI的性能可能会有很大差异。
定性数据分析(QUDA)晶格量子色动力学库可以使用NVSHMEM进行通信,以减少CPU和GPU同步的开销,并改善计算和通信重叠。这减少了延迟并提高了强大的伸缩性。
多节点多-GPU:大规模使用NVIDIA cuFFTMp FFT
最大的交互式体积可视化——150TB NASA火星着陆器模拟