×

核心向量机:在超大数据集上进行快速SVM训练。 (英语) Zbl 1222.68320号

总结:标准SVM训练具有(O(m^{3})时间和(O(m ^{2})空间复杂性,其中,(m)是训练集大小。因此,在计算上,它在非常大的数据集上是不可行的。通过观察到实际的SVM实现仅通过迭代策略逼近最优解,我们利用这种“近似性”来放大核方法。我们首先证明,在计算几何中,许多核方法都可以等价地表示为最小包围球(MEB)问题。然后,通过采用一种有效的近似MEB算法,我们利用核集的思想获得了可证明的近似最优解。我们提出的核心向量机(CVM)算法可以用于非线性核,具有线性的时间复杂度和独立于(m)的空间复杂度。在大型玩具和真实世界数据集上的实验表明,CVM与现有的SVM实现一样准确,但比现有的放大方法更快,可以处理更大的数据集。例如,在3.2GHz Pentium-4 PC上,使用高斯核的CVM在KDDCUP-99入侵检测数据上只需1.4秒,就可以产生卓越的结果,该数据具有大约500万种训练模式。

MSC公司:

68T05型 人工智能中的学习和自适应系统
68单位05 计算机图形;计算几何(数字和算法方面)
68周25 近似算法
PDF格式BibTeX公司 XML格式引用
全文: 链接