Ivor W.曾。;詹姆斯·T·郭。;张伯明 核心向量机:在超大数据集上进行快速SVM训练。 (英语) Zbl 1222.68320号 J.马赫。学习。物件。 6, 363-392 (2005). 总结:标准SVM训练具有(O(m^{3})时间和(O(m ^{2})空间复杂性,其中,(m)是训练集大小。因此,在计算上,它在非常大的数据集上是不可行的。通过观察到实际的SVM实现仅通过迭代策略逼近最优解,我们利用这种“近似性”来放大核方法。我们首先证明,在计算几何中,许多核方法都可以等价地表示为最小包围球(MEB)问题。然后,通过采用一种有效的近似MEB算法,我们利用核集的思想获得了可证明的近似最优解。我们提出的核心向量机(CVM)算法可以用于非线性核,具有线性的时间复杂度和独立于(m)的空间复杂度。在大型玩具和真实世界数据集上的实验表明,CVM与现有的SVM实现一样准确,但比现有的放大方法更快,可以处理更大的数据集。例如,在3.2GHz Pentium-4 PC上,使用高斯核的CVM在KDDCUP-99入侵检测数据上只需1.4秒,就可以产生卓越的结果,该数据具有大约500万种训练模式。 引用于1审查引用于59文件 MSC公司: 68T05型 人工智能中的学习和自适应系统 68单位05 计算机图形;计算几何(数字和算法方面) 68周25 近似算法 关键词:内核方法;近似算法;最小包围球;堆芯组件;可扩展性 PDF格式BibTeX公司 XML格式引用 \textit{I.W.Tsang}等人,J.Mach。学习。第6363-392号决议(2005年;Zbl 1222.68320) 全文: 链接