×

大规模多核学习。 (英语) Zbl 1222.90072号

摘要:虽然经典的基于内核的学习算法是基于单个内核的,但在实践中通常需要使用多个内核。G.R.G.兰克里特等【“基因组数据融合的统计框架”,Bioninform.20,2626-2635(2004)】考虑了用于分类的核矩阵的二次曲线组合,导致了凸二次约束二次规划。我们表明,它可以被重写为半无限线性程序,通过循环使用标准SVM实现可以有效地求解该程序。此外,我们将公式和方法推广到更大的一类问题,包括回归和一类分类。实验结果表明,该算法可以对数十万个样本或数百个核进行组合,有助于模型的自动选择,提高了学习结果的可解释性。
在第二部分中,我们讨论了SVM的一般加速机制,特别是当与字符串核的稀疏特征映射一起使用时,允许我们在计算生物学中的1000万个真实拼接数据集上训练字符串核SVM。我们在机器学习工具箱中集成了多内核学习SHOGUN公司其源代码可在http://www.fml.tuebingen.mpg.de/raetsch/projects/shogun

MSC公司:

90立方厘米 半无限规划
68T05型 人工智能中的学习和自适应系统
90C05(二氧化碳) 线性规划
90C06型 数学规划中的大尺度问题

软件:

SHOGUN公司
PDF格式BibTeX公司 XML格式引用
全文: 链接