This site requires Javascript in order to view all its content. Please enable Javascript in order to access all the functionality of this web site. Here are the instructions how to enable JavaScript in your web browser.

NVIDIA Magnum IO公司

数据中心IO加速平台

加速数据中心IO
AI Everywhere的性能

公司正在完善其数据，并成为智能制造商。数据中心正在成为由加速计算支持的人工智能工厂，加速计算已将计算速度提高了100万到x。然而，加速计算需要加速IO。NVIDIA Magnum IO™是并行智能数据中心IO的架构。它最大化了存储、网络和多节点，多GPU通信用于世界上最重要的应用，使用大型语言模型、推荐系统、成像、仿真和科学研究。

NVIDIA Magnum IO优化堆栈

NVIDIA Magnum IO利用存储IO、网络IO、网络内计算和IO管理来简化和加快多GPU、多节点系统的数据移动、访问和管理。Magnum IO支持NVIDIA CUDA-X™库，并充分利用一系列NVIDIA GPU和NVIDIB网络硬件拓扑，以实现最佳吞吐量和低延迟。

〔开发者博客〕Magnum IO-现代数据中心加速IO

存储IO

在多GPU、多节点系统中，CPU速度慢、单线程性能是从本地或远程存储设备访问数据的关键路径。通过存储IO加速，GPU绕过CPU和系统内存，并通过8x 200 Gb/s NIC访问远程存储，实现高达1.6 TB/s的原始存储带宽。

包括的技术：

NVIDIA Magnum IO GPU直接^®存储›

NVIDIA NVMe快照^™›

网络IO

英伟达NVLink®,NVIDIA Quantum InfiniBand公司,以太网网络和基于RDMA的网络IO加速减少了IO开销，绕过了CPU并能够以线速率直接向GPU传输数据。

包括的技术：

网络内计算

网络内计算提供网络内的处理，消除了遍历端点和沿途任何跳跃带来的延迟。数据处理单元（DPU）引入了软件定义的网络硬件加速计算，包括预配置的数据处理引擎和可编程引擎。

包括的技术：

NVIDIA公司^®蓝田DPU^®›

MPI标签匹配›

NVIDIA公司^®可扩展的层次聚合与约简协议（SHARP）^™›

IO管理

为了跨计算、网络和存储提供IO优化，用户需要深入的遥测和高级故障排除技术。Magnum IO管理平台使研究和工业数据中心运营商能够有效地供应、监控、管理和预防性维护现代数据中心结构。

包括的技术：

NVIDIA NetQ公司^™›

NVIDIA公司^®UFM公司^®›

跨数据中心应用程序加速IO

NVIDIA Magnum IO与NVIDIA高性能计算（HPC）和AI库接口，以加速从AI到科学可视化的广泛使用案例的IO。

资料分析
高性能计算
深度学习（训练/推理）
渲染和可视化

资料分析

如今，数据科学和机器学习（ML）是世界上最大的计算领域。预测性ML模型准确性的适度改进可以转化为数十亿美元的收益。

Magnum IO库和数据分析工具

为了提高准确性，RAPIDS™Accelerator库内置了基于UCX的加速Apache Spark洗牌，可以配置为利用GPU到GPU的通信和RDMA功能。结合NVIDIA网络、NVIDIA-Magnum IO软件、GPU-accelerated Spark 3.0和RAPIDS，NVIDIA数据中心平台具有独特的优势，可以以前所未有的性能和效率加速巨大的工作负载。

GPUDirect Storage（GDS）已与ORC、Parquet、CSV和Avro阅读器的RAPIDS集成。RAPIDS CuIO通过在大规模工作流中使用GDS的Parquet文件实现了高达4.5倍的性能改进。

Adobe在Databricks上使用Spark 3.0实现了模型培训速度的7倍，节省了90%的成本

高性能计算

为了解开下一代发现的谜团，科学家们依靠模拟来更好地理解药物发现中的复杂分子、新能源的物理学和大气数据来更好地预测极端天气模式。领先的模拟和应用程序利用NVIDIA Magnum IO实现更快的洞察时间。Magnum IO公开了硬件级加速引擎和智能卸载，如RDMA、NVIDIA GPUDirect和NVIDIA SHARP，同时增强了NVIDIA InfiniBand和NVIDIA NVLink网络GPU的高带宽和超低延迟。

在多租户环境中，用户应用程序可能不知道来自相邻应用程序流量的不加区分的干扰。Magnum IO基于最新的NVIDIA Quantum-2 InfiniBand平台，具有新的和改进的功能，可减轻对用户性能的负面影响。这提供了最佳结果，以及任何规模的最高效HPC和ML部署。

Magnum IO库和HPC应用程序

VASP公司当MPI被NCCL取代时，性能显著提高。UCX加速了科学计算应用程序，如VASP、Chroma、MIA-AI、Fun3d、CP2K和Spec-HPC2021，以实现更快的墙锁运行时间。

NVIDIA HPC-X提高了CPU可用性、应用程序可扩展性和系统效率，从而提高了由各种HPC ISV分发的应用程序性能。NCCL、UCX和HPC-X都是HPC-SDK的一部分。

快速傅里叶变换（FFT）广泛应用于各种领域，从分子动力学、信号处理和计算流体动力学（CFD）到无线多媒体和ML应用。通过使用NVIDIA共享内存库（NVSHMEM）™，cuFFTMp独立于MPI实现，并以接近光速的速度运行，这一点至关重要，因为不同MPI的性能可能会有很大差异。

定性数据分析（QUDA）晶格量子色动力学库可以使用NVSHMEM进行通信，以减少CPU和GPU同步的开销，并改善计算和通信重叠。这减少了延迟并提高了强大的伸缩性。

多节点多-GPU：大规模使用NVIDIA cuFFTMp FFT

最大的交互式体积可视化——150TB NASA火星着陆器模拟

深度学习

新兴的exascale HPC和万亿参数AI模型用于像超人对话AI这样的任务，需要数月的训练，即使是在超级计算机上。将此压缩到业务速度以在几天内完成培训需要在服务器集群中的每个GPU之间进行高速、无缝的通信，以便可以扩展性能。NVIDIA NVLink、NVIDIA NVSwitch、NVIDIA Magnum IO库的组合以及跨服务器的强大扩展，在混合专家（MoE）模型上实现了高达9倍的AI培训速度。这使得研究人员能够以商业的速度训练大规模模型。

Magnum IO库和深度学习集成

NCCL和其他Magnum IO库透明地利用了最新的NVIDIA H100 GPU，NVLink、NVSwitch和InfiniBand网络为深度学习工作负载提供了显著的加速，特别是推荐系统和大型语言模型培训。

NCCL的优点包括更快地建模训练准确性，同时在分布式环境中实现服务器之间接近100%的互连带宽。

Magnum IO GPU直接存储（GDS）已通过以下方式在数据加载库（DALI）中启用Numpy阅读器操作员与基线Numpy相比，GDS使用DALI进行深度学习推理的性能提高了7.2倍。

让研究人员能够继续突破人工智能的极限，需要强大的性能和巨大的可扩展性。NVIDIA Quantum-2 InfiniBand网络、， NVLink、NVSwitch和Magnum IO软件堆栈为数百到数千个同时运行的GPU提供了现成的可扩展性。

与MPI相比，使用NVSHMEM的LBANN的性能提高了1.9倍

渲染和可视化

GPU被用于加速从空中图形到实时立体图像重建等一系列应用中复杂而耗时的任务。

NVIDIA GPUDirect for Video技术允许第三方硬件高效地与NVIDIA GPU通信，并将历史延迟问题降至最低。使用NVIDIA GPUDirect for Video，IO设备与GPU和CPU完全同步，以最大限度地减少在设备驱动程序之间复制数据的浪费周期。

GPUDirect Storage（GDS）与cuCIM集成，cuCIM是一个可扩展的工具包，旨在为专注于生物医学成像的N维图像提供GPU加速IO、计算机视觉和图像处理原语。

在以下两个示例中，NVIDIA IndeX®公司与GDS一起使用，以加速所涉及的超大数据集的可视化。

使用NVIDIA Clara™Holoscan实时可视化活细胞的显微镜图像

最大的交互式体积可视化——150TB NASA火星着陆器模拟

资源

> NVIDIA Magnum IO GitHub公司
> NVIDIA GPU直接存储：存储和GPU内存之间的直接路径
> 加快现代数据中心的IO：网络IO
> 使用NCCL加速NVSHMEM 2.0团队集合
> 使用NVIDIA Magnum IO开发人员环境优化GPU应用程序中的数据移动
> 使用Magnum IO加速云原生超级计算
> 访问MOFED

注册NVIDIA Magnum IO新闻和更新。

NVIDIA Magnum IO公司

加速数据中心IOAI Everywhere的性能

NVIDIA Magnum IO优化堆栈

存储IO

网络IO

网络内计算

IO管理

跨数据中心应用程序加速IO

资料分析

Magnum IO库和数据分析工具

高性能计算

深度学习

渲染和可视化

资源

获取Magnum IO的最新信息

NVIDIA GPU直接存储（GDS）

NVIDIA NVMe软件定义的网络加速处理（SNAP）

数据平面开发工具包（DPDK）

NVIDIA GPU直接RDMA（GDR）

NVIDIA HPC-X公司

NVIDIA集体通信图书馆（NCCL）

NVIDIA共享内存库（NVSHMEM）

UCX公司

加速交换机和数据包处理®（尽快2)

NVIDIA公司®蓝田DPU®数据处理单元（DPU）

MPI标记匹配

英伟达夏普

NVIDIA NetQ公司

NVIDIA统一结构管理器（UFM）

加速数据中心IO
AI Everywhere的性能

加速交换机和数据包处理^®（尽快²)

NVIDIA公司^®蓝田DPU^®数据处理单元（DPU）