×

MLlib:Apache Spark中的机器学习。 (英语) Zbl 1360.68697号

概要:Apache Spark是一个流行的用于大规模数据处理的开源平台,非常适合迭代机器学习任务。在本文中,我们介绍了Spark的开源分布式机器学习库MLlib。MLlib为广泛的学习设置提供了有效的功能,并包括几个基本的统计、优化和线性代数原语。MLlib与Spark一起提供,支持多种语言,并提供高级API,利用Spark的丰富生态系统简化端到端机器学习管道的开发。MLlib经历了快速增长,因为它拥有超过140个贡献者的活跃开源社区,并包含大量文档来支持进一步的增长,并让用户快速跟上速度。

MSC公司:

68T05型 人工智能中的学习和自适应系统
PDF格式BibTeX公司 XML格式引用
全文: arXiv公司 链接