摘要:极限学习机算法虽然训练速度较快,但包含了大量矩阵运算,因此其在面对大数据量时,处理效率依然缓慢。在充分研究火花分布式数据集并行计算机制的基础上,设计了核心环节矩阵乘法的并行计算方案,并对基于火花的极限学习机并行化算法进行了设计与实现。为方便性能比较,同时实现了基于Hadoop MapReduce的极限学习机并行化算法。实验结果表明,基于火花的极限学习机并行化算法相比于Hadoop MapReduce版本的运行时间明显缩短,而且若处理数据量越大,火花在效率方面的优势就越明显。
刘鹏,王学奎,黄宜华,孟磊,丁恩杰.基于火花的极限学习机算法并行化研究[J] ●●●●。计算机科学, 2017, 44(12): 33-37. https://doi.org/10.11896/j.issn.1002-137X.2017.12.006
刘鹏、王学奎、黄一华、孟雷和丁恩杰。基于Spark的ELM算法并行化研究[J] ●●●●。计算机科学,2017,44(12):33-37。https://doi.org/10.11896/j.issn.102-137X.2017.12.006