前期工作:伯克利数据分析系统

主要研究者:
迈克尔·马奥尼

在这个项目中,ICSI的研究人员正在将基于矩阵的机器学习问题的随机算法的最新研究扩展并应用于加州大学伯克利分校AMPLab最近开发的计算基础设施。大规模机器学习的挑战之一是MapReduce/Hadoop对于基于矩阵的机器学习中常见的迭代算法性能不佳。此类迭代算法的示例包括最小二乘近似、最小绝对偏差近似、低秩矩阵近似等常见算法。Spark是AmpLab开发的一个软件框架,用于处理这些和其他问题,AMPLab已经在努力在该框架内实现更复杂的矩阵和图形算法。ICSI科学家将与AMPLab和IBM的研究人员合作,在该框架中实现随机矩阵算法,并将其应用于实际的机器学习用例。