×

隔离内核:高效大规模在线内核学习中的X因素。 (英语) Zbl 1485.68227号

摘要:大规模在线内核学习旨在从潜在的无限数据点序列中逐步构建一个高效且可扩展的基于内核的预测模型。当前最先进的大规模在线内核学习侧重于提高效率。通过近似获得效率的两个关键方法是(1)限制支持向量的数量,(2)使用近似特征映射。它们通常使用带有难以处理的维数特征映射的内核。虽然这些方法可以有效地处理大规模数据集,但由于近似,这种结果是通过降低预测准确性来实现的。我们提供了一种替代方法,将所使用的内核置于该方法的核心。它专注于创建稀疏有限维特征映射一个名为Isolation kernel的内核。使用这种新方法,实现大规模在线内核学习的上述目标变得极为简单——只需使用Isolation kernel,而不是具有难以处理的维数特征映射的内核。我们表明,使用隔离内核,可以在不牺牲精度的情况下有效地实现大规模在线内核学习。

MSC公司:

68T05型 人工智能中的学习和自适应系统
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Breiman L(2000)预测系综的一些无穷大理论。加州大学伯克利分校统计系技术代表577
[2] Breiman,L.,《随机森林》,《马赫学习》,第45、1、5-32页(2001年)·Zbl 1007.68152号 ·doi:10.1023/A:1010933404324
[3] 卡瓦兰蒂,G。;塞萨·比安奇,N。;Gentile,C.,《使用简单预算感知器追踪最佳超平面》,《马赫学习》,69,2,143-167(2007)·Zbl 1470.68090号 ·doi:10.1007/s10994-007-5003-0
[4] Chang,CC;Lin,CJ,LIBSVM:支持向量机库,ACM Transactions Intell Syst Technol,2,3,1-27(2011)·数字对象标识代码:10.1145/1961189.1961199
[5] Chang,YW;谢长杰;Chang,千瓦;林加德,M。;Lin,CJ,通过线性支持向量机训练和测试低阶多项式数据映射,J Mach Learn Res,11,1471-1490(2010)·Zbl 1242.68210号
[6] 风扇,RE;Chang,千瓦;谢长廷;王,XR;Lin,CJ,Liblinear:大型线性分类库,J Mach Learn Res,91871-1874(2008)·Zbl 1225.68175号
[7] Felix XY、Suresh AT、Choromanski KM、Holtmann-Rice DN、Kumar S(2016)《正交随机特征》。发表于:《神经信息处理系统的进展》,第1975-1983页
[8] Geurts,P。;Ernst,D。;Wehenkel,L.,《极度随机树》,《马赫学习》,第63、1、3-42页(2006年)·Zbl 1110.68124号 ·doi:10.1007/s10994-006-6226-1
[9] Huang P、Avron H、Sainath TN、Sindhwani V、Ramabhadran B(2014),内核方法在时间上匹配深度神经网络。摘自:2014年IEEE声学、语音和信号处理国际会议记录,第205-209页
[10] Jose C、Goyal P、Aggrwal P、Varma M(2013)用于有效非线性svm预测的局部深核学习。摘自:第30届国际机器学习会议记录,第III-486-III-494页
[11] 卡菲,M。;Eshghi,K.,《Croification:利用稀疏线性支持向量机的效率进行准确的核分类》,IEEE Transactions Pattern Ana Mach Intell,41,1,34-48(2019)·doi:10.1109/TPAMI.2017.2785313
[12] Kivinen J、Smola AJ、Williamson RC(2001)《内核在线学习》。摘自:《第14届神经信息处理系统国际会议论文集:天然和合成》,第785-792页·Zbl 1369.68281号
[13] 刘FT,婷KM,周志华(2008)《隔离林》。摘自:IEEE国际数据挖掘会议记录,第413-422页
[14] 卢,J。;海,SCH;Wang,J。;赵,P。;Liu,ZY,大规模在线内核学习,J Mach Learn Res,17,1,1613-1655(2016)·Zbl 1360.68690号
[15] 马吉,S。;Berg,AC;Malik,J.,《加性内核svm的有效分类》,IEEE Transactions Pattern Ana Mach Intell,35,1,66-77(2013)·doi:10.1109/TPAMI.2012.62
[16] 马斯科C,马斯科C(2017)奈斯特罗姆方法的递归采样。主题:神经信息处理系统进展,第3833-3845页·Zbl 1410.68399号
[17] Qin X,Ting KM,Zhu Y,Lee VCS(2019)近邻诱导隔离相似性及其对基于密度聚类的影响。摘自:第三十三届AAAI人工智能会议论文集,第4755-4762页
[18] Rahimi A,Recht B(2007)大型内核机器的随机特性。摘自:神经信息处理系统进展,第1177-1184页
[19] 阿科托马蒙杰,A。;巴赫,法国;卡努,S。;Grandvalet,Y.,SimpleMKL,J Mach Learn Res,11月9日,2491-2521(2008)·Zbl 1225.68208号
[20] 肖尔科夫,B。;Smola,AJ,《使用内核学习:支持向量机、正则化、优化和超越》(2001),剑桥:麻省理工学院出版社,剑桥
[21] Shen Y,Chen T,Giannakis G(2018)适应非平稳和对抗环境的在线集成多核学习。摘自:《第二十届国际人工智能与统计会议论文集》,第2037-2046页
[22] Ting KM,Zhu Y,Zhou ZH(2018)隔离核及其对SVM的影响。摘自:第24届ACM SIGKDD知识发现和数据挖掘国际会议记录,ACM,第2329-2337页
[23] Ting KM,Xu BC,Washio T,Zhou ZH(2020)《隔离分布核:基于核的异常检测的新工具》。摘自:第26届ACM SIGKDD知识发现和数据挖掘国际会议记录,第198-206页
[24] Vedaldi,A。;Zisserman,A.,《通过显式特征映射实现高效加法核》,IEEE事务模式分析机智能,34,3,480-492(2012)·doi:10.10109/TPAMI.2011.153
[25] Vedaldi A,Zisserman A(2012b)用于有效分类和检测的稀疏核近似。在:2012年IEEE计算机视觉和模式识别会议论文集,第2320-2327页
[26] Viet Le Q、Sarlos T、Smola AJ(2013)《快餐:对数线性时间内的近似内核扩展》。摘自:第30届国际机器学习会议记录,第III-244-III-252页
[27] Wang Z,Vucetic S(2010)在线被动攻击算法预算。摘自:《第十三届国际人工智能与统计会议记录》,第908-915页
[28] 王,Z。;克拉默,K。;Vucetic,S.,《打破核化诅咒:大规模支持向量机训练的预算随机梯度下降》,J Mach Learn Res,13,1,3103-3131(2012)·Zbl 1433.68383号
[29] Williams CKI,Seeger M(2001)使用nyströM方法加速内核机器。内容:神经信息处理系统进展13。麻省理工学院出版社,剑桥,第682-688页
[30] 吴杰。;丁·L。;Liao,S.,核方法的预测nyström方法,神经计算,234116-125(2017)·doi:10.1016/j.neucom.2016.12.047
[31] Xu BC,Ting KM,Zhou ZH(2019)隔离集核及其在多示例学习中的应用。摘自:第25届ACM SIGKDD知识发现和数据挖掘国际会议记录,第941-949页
[32] 徐伯承,婷KM,江勇(2021)隔离图核。摘自:第三十五届AAAI人工智能会议记录,第10487-10495页
[33] Yang J,Sindhwani V,Fan Q,Avron H,Mahoney M(2014)直方图上半群核的随机拉普拉斯特征映射。摘自:2014年IEEE计算机视觉和模式识别会议记录,第971-978页
[34] Yang T,Li YF,Mahdavi M,Jin R,Zhou ZH(2012)NyströM方法与随机傅里叶特征:理论和实证比较。主题:神经信息处理系统进展,第476-484页
[35] Zadeh P、Hosseini R、Sra S(2016)《几何平均度量学习》。摘自:机器学习国际会议记录,第2464-2471页
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。