提交新事件

谢谢您!已收到您的提交!
哎呀!提交表单时出错。

提交新闻功能

谢谢您!已收到您的提交!
哎呀!提交表单时出错。

注册新闻稿

谢谢您!已收到您的提交!
哎呀!提交表单时出错。

缩放您喜欢的Python工具

缩放PyData库

Dask可以很容易地扩展您熟悉和喜爱的Python库,如NumPy、pandas和scikit。

了解有关Dask DataFrames的更多信息

缩放任何Python代码

将任何Python代码与Dask Futures并行,让您可以缩放任何函数和for循环,并在任何情况下为您提供控制和功能。

了解有关Dask Futures的更多信息

随时随地部署

从笔记本电脑开始,但无论您使用什么基础设施,都可以扩展到集群。Dask部署在Kubernetes、云或HPC上,而Dask库可以方便地根据需要使用尽可能多或少的计算。

了解有关Dask部署的更多信息

由Dask提供支持

Dask在整个PyData生态系统中都有使用,目前包括在许多库中,如Xarray、Prefect、RAPIDS和XGBoost。

了解有关库的更多信息

使用Dask的组织

第一资本
格鲁布布
微软
美国国家航空航天局
壳牌公司
沃尔玛
查看使用Dask的所有组织

Dask用户表示

“在Capital One,Dask的早期实施在开发工作的几个月内将模型培训时间减少了91%。”
Ryan McEntee,首府
“Dask还使使用多个Python进程在本地部署分布式工作变得容易,其方式与分配全部生产负载的方式几乎相同”
Hugues Demers,格鲁布
“为了进一步提高用户在云上轻松扩展的能力,我们通过设置预先配置的Horovod和Dask集群来扩展这一能力。”
韦法尔Meenakshi Sharma

为什么选择Dask?

Python已经成为数据分析和通用编程领域的主导语言。这一增长得益于NumPy、pandas和scikit-learn等计算库。然而,这些包的设计并不是为了扩展到单个机器以外。开发Dask是为了在数据集超出内存时将这些包和周围的生态系统本地扩展到多核机器和分布式集群。

数据专业人士有很多理由选择Dask。

有一个熟悉的Python API

与Python代码本地集成,以确保一致性并最大限度地减少摩擦

扩展到群集

可扩展到内部、云中或HPC集群上的数千节点集群,无需重写代码

向下扩展到单个计算机

允许用户操作笔记本电脑上的100GB+数据集或工作站上的1TB+数据集

支持复杂应用程序

支持用于统计或机器学习、时间序列或本地操作或定制并行应用程序的高级算法

提供实时可见性

使用户能够通过交互式仪表板快速识别和解决错误和性能问题

支持GPU加速

与其他GPU加速数据分析和机器学习框架集成

使用Dask的优势

它很容易使用

不需要配置或设置

它很安全

支持使用TLS/SSL证书进行加密和身份验证

它很有弹性

优雅地处理工作节点故障

它很有弹性

利用动态添加的新节点

它很有效

以低开销和低延迟运行以实现高性能

可定制

可以使用自定义业务逻辑构建您自己的并行计算系统

已经证明了

已被全球数千名数据专业人员使用

生态系统

许多软件项目与Dask集成或使用Dask为其基础设施的组件供电。Dask支持熊猫、NumPy、scikit-learn、PyTorch、XGBoost、Xarray、Prefect和RAPIDS等。

查看Dask支持的项目

事件

达克

未来活动详情即将发布

Dask博客

分布式系统的设计原则

保持联系

注册我们的邮件列表,并将Dask更新直接发送到您的收件箱。
谢谢您!已收到您的提交!
哎呀!提交表单时出错。

Dask入门