MRESVM

基于MapReduce的分布式支持向量机集成可伸缩图像分类与标注。在广泛的应用中,组合分类器可以大大减少分类错误。其中,基于bagging的支持向量机(SVM)集成在分类方面表现出了比单一支持向量机更好的分类性能。然而,支持向量机集成的训练过程是计算密集型的,特别是在重复训练数据集较多的情况下。本文提出了一种基于MapReduce的分布式支持向量机集成可伸缩图像标注算法MRESVM,该算法基于bootstrapping对训练数据集进行重新采样,并在多台计算机上并行训练一个支持向量机。为了提高分类精度,引入了一种均衡的自举抽样策略。在实验和仿真环境下对MRESVM进行了评估,结果表明MRESVM算法在获得较高分类精度的同时,显著缩短了训练时间。