索伦·松嫩堡;冈纳州Rätsch;克里斯汀·施费尔;伯恩哈德·舍尔科夫 大规模多核学习。 (英语) Zbl 1222.90072号 J.马赫。学习。物件。 7, 1531-1565 (2006)。 摘要:虽然经典的基于内核的学习算法是基于单个内核的,但在实践中通常需要使用多个内核。G.R.G.兰克里特等【“基因组数据融合的统计框架”,Bioninform.20,2626-2635(2004)】考虑了用于分类的核矩阵的二次曲线组合,导致了凸二次约束二次规划。我们表明,它可以被重写为半无限线性程序,通过循环使用标准SVM实现可以有效地求解该程序。此外,我们将公式和方法推广到更大的一类问题,包括回归和一类分类。实验结果表明,该算法可以对数十万个样本或数百个核进行组合,有助于模型的自动选择,提高了学习结果的可解释性。在第二部分中,我们讨论了SVM的一般加速机制,特别是当与字符串核的稀疏特征映射一起使用时,允许我们在计算生物学中的1000万个真实拼接数据集上训练字符串核SVM。我们在机器学习工具箱中集成了多内核学习SHOGUN公司其源代码可在http://www.fml.tuebingen.mpg.de/raetsch/projects/shogun。 引用于61文件 MSC公司: 90立方厘米 半无限规划 68T05型 人工智能中的学习和自适应系统 90C05(二氧化碳) 线性规划 90C06型 数学规划中的大尺度问题 关键词:多核学习;字符串内核;大规模优化;支持向量机;支持向量回归;列生成;半无限线性规划;SHOGUN公司 软件:SHOGUN公司 PDF格式BibTeX公司 XML格式引用 \textit{S.Sonnenburg}等人,J.Mach。学习。第71531-1565号决议(2006年;兹bl 1222.90072) 全文: 链接