RAPIDS™系统,属于NVIDIA CUDA-X公司是一个GPU加速数据科学和AI库的开源套件,其API与最流行的开源数据工具相匹配。它跨数据管道以数量级的规模加速性能。
更快的管道可以实现更多的实验,从而改善结果。
零代码转换加速器和熟悉的Python API可以快速加速现有工作负载。
通过100多个软件集成,RAPIDS促进了协作。
RAPIDS在所有主要云上、本地计算机上或本地计算机上运行。
RAPIDS库可以加快广泛采用的操作和算法的速度,有助于减少随着问题的发展而进行深入了解的时间。
*Groupy高级操作基准(5GB)DuckDB数据基准硬件:Intel Xeon Platinum 8480CL CPU和NVIDIA Grace Hopper GPU软件:pandas v1.5和cudf.pandas v23.10
*基准PDS-H查询硬件:Intel Xeon W9-3495X CPU和NVIDIA H100 80GB(1x GPU)软件:Polars v1.4.1
*PageRank基准测试,合成数据集具有约16384个顶点和约524288个边硬件:Intel Xeon铂金8480CL CPU和NVIDIA H100 80GB(1x GPU)软件:NetworkX v3.2和cuGraph v23.10
*UMAP基准——100000个样本和256个特征的无监督硬件:Intel Xeon铂金8480CL CPU和NVIDIA H100 80GB(1x GPU)软件:scikit-learn v1.3和cuML v23.10
请参阅上的基准急流.ai
RAPIDS具有独特的、模块化的、可互操作的库选择,可以顺利地插入到管道和应用程序中,从而简化了开发过程。
加速的数据管道
RAPIDS库
用例
行业解决方案
RAPIDS使数据科学管道在任何规模上都能顺利运行。
使用现有工具无缝地加速表格数据集、图形数据库或Spark框架的数据分析。
使用紧跟scikit-learn的API提高模型训练速度。
支持使用DGL和PyG进行高效的图神经网络训练。
使用cuML和NVIDIA Triton™部署高性能机器学习推理。
受最流行的开源数据工具的启发,RAPIDS库可以适应您的工作流程。
加速数据帧以高效处理数亿条记录。
用最少的代码更改来加速现有的Apache Spark应用程序。
使用紧跟scikit-learn API的API在CPU和GPU上执行机器学习算法。
使用遵循NetworkX的python API快速导航图形分析库。
应用cuVS算法加速向量搜索,包括CAGRA的世界级性能。
使用Dask上的RAPIDS将数据科学管道扩展到多个节点。
通过对1亿多行表格数据集进行多维过滤,创建交互式数据可视化。
加速n维图像(尤其是生物医学图像)的输入/输出(IO)、计算机视觉和图像处理。
利用专门构建的NVIDIA框架和指南,为常见和高影响用例构建加速应用程序。
使用RAPIDS Accelerator for Spark革新数据管理和预处理。
加速从特征工程到预测的时间序列建模。
与NVIDIA Merlin™一起大规模构建高性能推荐系统。
在优化的AI管道中过滤、处理和分类实时数据,以快速检测网络威胁。
cuOpt保持世界纪录的加速求解器优化了最后一英里交付、技术人员派遣或工厂内物流的路线。
RAPIDS cuGraph使企业能够训练万亿边缘图神经网络。
RAPIDS擅长加速业务关键型应用程序,缩短跨行业的规划和开发时间。
加速的数据科学推动了零售预测、数据分析等方面的改进。
在时间至关重要的行业中,实时数据增强了欺诈检测和预测。
RAPIDS拥有100多个开源和商业软件集成,为协作高性能数据科学生态系统奠定了基础。
开放源库
平台
我们致力于简化、统一和加速开源社区的数据科学。
RAPIDS与最流行的数据科学和机器学习平台合作,使加速数据科学的访问民主化。
借助NVIDIA AI Enterprise加速数据科学,NVIDIA AI Enterprise是一个端到端、安全的云原生人工智能软件平台,经过优化,可将企业带到人工智能的前沿。NVIDIA AI Enterprise为NVIDIA AI开源软件提供验证和集成,包括RAPID、访问人工智能解决方案工作流以加快生产时间,到处部署AI的认证,以及企业级支持、安全性、可管理性和API稳定性,以减轻开源软件的潜在风险。
我们的客户使用RAPIDS的全功能堆栈来扩展其企业用例。
PayPal使用Apache Spark的RAPIDS加速器将云成本降低了70%。
广告平台Taboola使用Apache Spark的RAPIDS加速器处理数TB的小时数据。
CapitalOne加快了财务和信贷分析流程,将模型培训提高了100倍。
优步开发的Horovod支持带有GPU调度的Spark 3.x。
沃尔玛用产品替换算法解决了可扩展性问题。
LinkedIn开发了DARWIN,以便在RAPIDS cuDF上进行更快的数据分析。
AT&T在GPU集群的数据到AI管道中应用了针对Apache Spark的RAPIDS加速器。
NASA使用RAPIDS检测和量化空气污染异常,并建立偏差修正模型。
TCS Optumera通过针对Apache Spark的RAPIDS加速器加速了其需求预测流程。
IRS团队在Cloudera数据平台上发现了针对Apache Spark的RAPIDS加速器的欺诈行为。
查看更多RAPIDS资源,包括开发人员工具包、NVIDIA LaunchPad实验室和部署选项指南。