×

无损在线贝叶斯分类器。 (英语) Zbl 1448.62100号

总结:我们生活在一个由数据逐步驱动的世界。除了传统离线学习方法所要求的大数据不能完全存储在主存中的问题外,只能随着时间收集的学习数据的问题也非常普遍。因此,需要能够处理顺序到达的数据并提供与离线方法相同精度的在线方法。本文介绍了一种新的无损在线贝叶斯分类器,它以一对一的方式使用到达的数据,并在使用后立即丢弃每个数据。该方法的无损性保证了无论训练顺序如何,它都能达到与离线算法相同的预测性能。实验结果表明,它的性能优于文献中许多著名的最新在线学习方法。

MSC公司:

62H30型 分类和区分;聚类分析(统计方面)
68T05型 人工智能中的学习和自适应系统
68周27 在线算法;流式算法
PDF格式BibTeX公司 XML格式引用
全文: 内政部 链接

参考文献:

[1] Bergmann,G。;Hommel,G.,《冗余假设系统通用多重测试程序的改进》(Bauer,P.;Hommel;G.;Sonnemann,E.,《多重假设测试》(1988),Springer:Springer Berlin),100-115
[2] Bifet,A。;霍姆斯,G。;普法林格,B。;Kranen,P。;Kremer,H。;Jansen,T。;Seidl,T.,MOA:大规模在线分析,流分类和聚类框架,(机器学习研究研讨会和会议论文集,第11卷:模式分析应用研讨会(2010))
[3] Bishop,C.M.,模式识别和机器学习(2006),Springer·Zbl 1107.68072号
[4] 布雷曼,L。;弗里德曼,J。;奥尔森,R。;Stone,C.J.,《分类和回归树》(1984),沃兹沃斯和布鲁克斯:沃兹沃思和布鲁克斯蒙特里,加利福尼亚州·Zbl 0541.62042号
[5] 卡鲁阿纳,R。;Niculescu-Mizil,A.,《监督学习算法的实证比较》(ICML(2006)),161-168
[6] 塞萨·比安奇,N。;Conconi,A。;Gentile,C.,二阶感知器算法,SIAM J.Compute。,34, 640-668 (2005) ·Zbl 1075.68036号
[7] 克拉默,K。;Dekel,O。;沙列夫·施瓦茨,S。;Singer,Y.,《在线被动攻击算法》(NIPS(2003))·Zbl 1222.68177号
[8] 克拉默,K。;Dekel,O。;Keshet,J。;沙列夫·施瓦茨,S。;Singer,Y.,《在线被动攻击算法》,J.Mach。学习。研究,7551-585(2006)·Zbl 1222.68177号
[9] 克拉默,K。;Kulesza,A。;Dredze,M.,权重向量的自适应正则化,(NIPS(2009)),414-422
[10] 克拉默,K。;Kulesza,A。;Dredze,M.,权重向量的自适应正则化,马赫数。学习。,91, 155-187 (2013) ·Zbl 1273.68296号
[11] 克拉默,K。;Singer,Y.,多类问题的超保守在线算法,J.Mach。学习。决议,3951-991(2003)·Zbl 1112.68497号
[12] Demsar,J.,多数据集分类器的统计比较,J.Mach。学习。研究,7,1-30(2006)·Zbl 1222.68184号
[13] 多明戈斯,P。;Hulten,G.,《采矿高速数据流》(KDD(2000)),71-80
[14] Dredze,M。;克拉默,K。;Pereira,F.,置信加权线性分类,(ICML(2008)),264-271
[15] 弗恩,X.Z。;Brodley,C.E.,《高维数据聚类的随机投影:聚类集成方法》(ICML(2003)),186-193年
[16] 南卡罗来纳州加西亚。;费尔南德斯,A。;Luengo,J。;Herrera,F.,《计算智能和数据挖掘实验设计中多重比较的高级非参数检验:权力的实验分析》,《信息科学》。,180, 10, 2044-2064 (2010)
[17] 南卡罗来纳州加西亚。;Herrera,F.,《所有成对比较的多数据集上分类器统计比较的扩展》,J.Mach。学习。第9号决议,第2677-2694页(2008年)·Zbl 1225.68178号
[18] F.A.冈萨雷斯。;Romero,E.,《生物医学图像分析和机器学习技术:应用和技术》(2009年),《信息科学参考:信息科学参考》,宾夕法尼亚州好时
[19] 海,S.C.H。;Wang,J。;Zhao,P.,伦敦银行同业拆借利率:在线学习算法库,J.马赫。学习。决议,第15号,第495-499页(2014年)·Zbl 1317.68164号
[20] Hommel,G.,基于改良Bonferroni试验的分期拒绝多重试验程序,Biometrika,75,383-386(1988)·Zbl 0639.62025号
[21] Jaiyen,S。;Lursinsap,C。;Phimoltares,S.,仅使用新输入数据进行分类的快速神经学习,IEEE Trans。神经网络。,21, 3, 381-392 (2010)
[22] Junsawang,P。;Phimoltares,S.公司。;Lursinsap,C.,一种通过使用单向类内学习概念的流式和随机排序多类数据块的快速学习方法,专家系统。申请。,63, 249-266 (2016)
[23] 李伟(Li,W.)。;Moore,A.W.,《有效流量分类的机器学习方法》(MASCOTS(2007))
[24] 李,B。;赵,P。;海,S.C.H。;Gopalkrishnan,V.,投资组合选择的被动积极均值回复策略,马赫。学习。,87, 2, 221-258 (2012) ·兹比尔1238.91128
[25] Lichman,M.,UCI机器学习库(2013),加利福尼亚大学信息与计算机科学学院:加利福尼亚大学信息和计算机科学学院,加利福尼亚州欧文
[26] T.T.Nguyen、T.T.T.Nugyen、X.C.Pham、A.W.C.Liew和J.C.Bezdek,基于集成的流数据在线学习算法,arXiv预印本arXiv:1704.07938;T.T.Nguyen、T.T.T.Nugyen、X.C.Pham、A.W.C.Liew和J.C.Bezdek,流数据的基于集成的在线学习算法,arXiv预印本arXiv:1704.07938
[27] Nguyen,T.T.T。;Liew,A.W.C。;Nguyen,T.T。;Wang,S.,在线不平衡学习的新型贝叶斯框架,(DICTA(2017))
[28] Nguyen,T.T。;Nguyen,T.T.T。;Pham,X.C。;Liew,A.W.-C.,一种基于变分推理的新型组合分类器方法,模式识别。,49, 198-212 (2016)
[29] 阮,T.T.T。;Nguyen,T.T。;Pham,X.C。;Liew,A.W.-C。;胡,Y。;Liang,T。;Li,C.-T.,一种新型在线贝叶斯分类器,(DICTA(2016))
[30] Oza,N。;Russell,S.,《在线打包和增强》(《人工智能与统计学报》(2001)),第105-112页
[31] Pham,X.C。;Dang,M.T。;Dinh,S.V。;Hoang,S。;Nguyen,T.T.(阮,T.T.)。;Liew,A.W.-C.,基于随机投影和Hoeffing树分类器的在线机器学习方法,(DICTA(2017))
[32] 昆兰,J.R.,C4.5:机器学习课程(1993),摩根考夫曼:摩根考夫曼旧金山
[33] 里德,J。;鲁特曼,P。;普法林格,B。;Holmes,G.,MEKA:对WEKA,J.Mach的多标签/多目标扩展。学习。第17、21、1-5号决议(2016年)·Zbl 1360.68708号
[34] Rosenblatt,F.,《感知器:大脑中信息存储和组织的概率模型》,《心理学》。修订版,65、6、386-408(1958年)
[35] 萨法里,A。;Leistner,C。;桑特纳,J。;戈代克,M。;Bischof,H.,在线随机森林,(计算机视觉研讨会(ICCV)(2009)),1393-1400
[36] 坦南,M。;斯塔尔,F。;俄克拉荷马州拉纳。;Gomes,J.B.,《具有概念漂移的数据流可扩展实时分类》,《未来世代》。计算。系统。,75, 187-199 (2017)
[37] Thakong,M。;Phimoltares,S.公司。;Jaiyen,S。;Lursinsap,C.,《通过动态多级网络快速学习和测试流数据中不平衡的多类变化》,IEEE Access,5,10633-10648(2017)
[38] 乌特戈夫,体育。;北卡罗来纳州伯克曼。;Clouse,J.A.,基于有效树重组的决策树归纳,马赫。学习。,29, 5-44 (1997) ·Zbl 0886.68105号
[39] Wang,J。;赵,P。;Hoi,S.C.H.,精确软置信度加权学习,(ICML(2012)),107-114
[40] Yang,L。;金·R。;Ye,J.,椭圆体法在线学习(ICML(2009)),1153-1160
[41] Zinkevich,J.,在线凸规划和广义无穷小梯度上升,(ICML(2003)),928-936
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。