仿真/建模/设计

SC20演示:新的Nsight系统和Nsight计算演示

NVIDIA Nsight Compute:Roofline和NVIDIAAmpere GPU架构分析

此演示显示了NVIDIA Nsight Compute中最新的CUDA内核分析功能,包括流行的Roofline分析方法和NVIDIA-Ampere GPU架构的新功能。具体来说,我们将演示分析硬件支持的异步数据复制功能,它可以提高能够利用它的工作负载的性能。

NVIDIA Nsight Compute:功能聚焦–应用程序回放

本演示介绍了NVIDIA#NsightCompute中的新应用程序重播功能。此功能为新的工作负载和工作流打开了大门,以利用Nsight Compute中强大的#CUDA内核评测功能。您将了解Nsight Compute如何重播内核以获得准确的性能数据,以及如何使用应用程序重播来提高性能和解锁CUDA内核分析的新选项。

NVIDIA Nsight Systems:分析NCCL与NVIDIA-Nsight系统的使用

NVIDIA Nsight Systems现在支持在CUDA应用程序中跟踪NCCL(NVIDIA-Collective Communications Library)的使用。这使用户能够识别CPU时间线上的NCCL活动,并将其与相关的GPU CUDA内核和内存副本关联。有了这些信息,用户可以通过识别CPU和GPU的冷点和热点来验证和改进NCCL的使用。Nsight Systems是用于获取CUDA应用程序整体视图的go-to分析工具。

NVIDIA Nsight Systems:使用NVIDIA-Nsight系统优化CUDA内存分配

NVIDIA Nsight Systems现在跟踪CUDA内存分配,以确保最佳内存使用。有效的内存管理是确保高效应用程序性能的关键。有了这些信息,用户可以确保他们的应用程序正在回收可用内存,以避免内存不足或暂停。Nsight Systems是获得CUDA应用程序整体视图的首要分析工具。 

NVIDIA Nsight系统> 

NVIDIA Nsight开发工具>

查看所有SC20演示> 

讨论(0)

标签