×

结合基于块的方法和在线方法,从概念漂移数据流中学习集成。 (英文) Zbl 1328.68158号

摘要:大多数流分类器设计为增量处理数据,在资源软件环境中运行,并对概念漂移做出反应,即流底层数据分布的不可预见的变化。集成分类器已经成为该领域的一个既定研究方向,主要是因为它们的模块化提供了一种适应变化的自然方式。然而,在每个示例之后都有类标签的环境中,块中处理实例的集合对突然变化的反应不够快。另一方面,以增量方式处理流的信号群并没有利用基于块的信号群中已知的周期性适应机制,这些机制对渐进和增量变化提供准确的反应。在本文中,我们分析了是否以及如何将块和增量处理的特性结合起来,以产生新型集成分类器。我们考虑并实验评估了将块集成转换为增量学习器的三种通用策略:在线组件评估、引入增量学习器和使用漂移检测器。基于这一分析结果,我们提出了一种新的增量集成分类器,称为在线准确度更新集成,该分类器基于构件分类器在恒定时间和内存中的误差来加权构件分类器。该算法与四种最先进的在线集成进行了实验比较,并在模拟不同漂移场景的真实和合成数据集上提供了最佳的平均分类精度。

MSC公司:

68T05型 人工智能中的学习和自适应系统
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Bifet,A。;霍姆斯,G。;柯克比,R。;Pfahringer,B.,MOA:大规模在线分析,J.Mach。学习。第11601-1604号决议(2010年)
[5] 布热津斯基,D。;Stefanowski,J.,《具有概念漂移的数据流的准确度更新集成》,(第六届HAIS Int.Conf.Hyb.Art.Intell.Syst.,Part II.Proc.6th HAIS Int.Conf.Art.Intell.Syst,Part II,LNCS,vol.6679(2011),Springer)
[6] 布热津斯基,D。;Stefanowski,J.,《应对不同类型的概念漂移:精度更新的集成算法》,IEEE Trans。神经网络学习系统。,25, 1, 81-94 (2014)
[7] 科恩,E。;Strauss,M.J.,《保持时间衰减流的聚集》,J.Algorithms,59,1,19-36(2006)·Zbl 1100.68562号
[8] Deckert,M.,《利用概念漂移挖掘数据流的批量加权集成》,(Proc 20th ISMIS Int.Symp..Proc 20st ISMIS Int.Symp.,LNCS,vol.6804(2011),Springer)
[9] Demsar,J.,《多数据集分类器的统计比较》,J.Mach。学习研究,7,1-30(2006)·Zbl 1222.68184号
[10] 多明戈斯,P。;Hulten,G.,《挖掘高速数据流》(Proc.6th ACM SIGKDD Int.Conf.Knowl.Disc.data Min.(2000),ACM出版社:美国ACM出版社)
[11] R.Elwell。;Polikar,R.,非平稳环境中概念漂移的增量学习,IEEE Trans。神经网络。,1517-1531年10月22日(2011年)
[14] Gama,J.,《数据流中的知识发现》(2010),查普曼和霍尔·Zbl 1230.68017号
[16] 贾马,J。;塞巴斯蒂昂,R。;罗德里格斯,P.P.,《流学习算法评估》,马赫。《学习》,90,3,317-346(2013)·Zbl 1260.68329号
[17] Greco,S。;斯洛文斯基,R。;Szczech,I.,规则有趣性度量的属性和度量标准化的替代方法,Inform。科学。,216, 1-16 (2012) ·Zbl 1251.68178号
[18] Han,J.,《数据挖掘:概念和技术》(2005),摩根考夫曼出版公司:摩根考夫曼出版公司,加利福尼亚州旧金山,美国
[20] 贾普科维奇,N。;Shah,M.,《评估学习算法:分类视角》(2011),剑桥大学出版社:剑桥大学出版社,纽约州纽约市,美国·Zbl 1230.68020号
[21] Kolter,J.Z。;Maloof,M.A.,《动态加权多数:漂移概念的集合方法》,J.Mach。学习。第8号决议,2755-2790(2007)·Zbl 1222.68237号
[22] Kuncheva,L.I.,《变化环境下的分类器集成》,(第五届MCS多类系统国际研讨会,第五届多类系统MCS国际研讨会,LNCS,第3077卷(2004),Springer)
[23] Kuncheva,L.I.,《组合模式分类器:方法和算法》(2004),Wiley-Interscience·Zbl 1066.68114号
[25] 利特斯通,N。;Warmuth,M.K.,加权多数算法,信息计算。,108, 2, 212-261 (1994) ·Zbl 0804.68121号
[26] (Maimon,O.;Rokach,L.,《数据挖掘和知识发现手册》(2010),施普林格出版社)·Zbl 1213.68237号
[27] 马苏德,M.M。;高杰。;Khan,L。;Han,J。;Thurasingham,B.M.,《对进化数据流进行分类的实用方法:使用有限数量的标记数据进行训练》,(第八届ICDM IEEE Int.Conf.data Min.(2008),IEEE Computer Society)
[28] Minku,L.L。;怀特,A.P。;Yao,X.,《概念漂移下多样性对在线集成学习的影响》,IEEE Trans。知识。数据工程,22,5,730-742(2010)
[29] Minku,L.L。;Yao,X.,DDD:处理概念漂移的新集成方法,IEEE Trans。知识。数据工程,242619-633(2012)
[30] 西田,K。;Yamauchi,K。;Omori,T.,ACE:用于概念驱动环境的自适应分类器组装系统,(Proc.6th Int.Workshop Multiple Classifier Systems.Proc.6st Int.Workshop Multiple-Classier Systems,LNCS,vol.3541(2005),Springer)
[31] 北卡罗来纳州奥扎。;Russell,S.J.,《装袋和增压的在线版本和批量版本的实验比较》,(第7届ACM SIGKDD Int.Conf.Knowl.Disc.Data Min.(2001),ACM出版社:美国纽约州纽约市ACM出版社)
[33] 西北部街道。;Kim,Y.,用于大规模分类的流集合算法(SEA),(第7届ACM SIGKDD国际Conf.Knowl.Disc.Data Min(2001),ACM出版社:美国纽约州纽约市ACM出版社)
[35] Wang,H。;风扇,W。;余,P。;Han,J.,《使用集成分类器挖掘概念驱动数据流》,(第九届ACM SIGKDD Int.Conf.Knowl.Disc.data Min.(2003),ACM出版社:美国ACM出版社)
[36] 姚,Y。;冯·L。;Chen,F.,概念漂移可视化,J.Inform。计算。科学。,10, 10, 3021-3029 (2013)
[37] 吉田,S。;Hatano,K。;Takimoto,E。;武田,M.,使用加权窗口的自适应在线预测,IEICE Trans。,94-D,1917-1923年10月(2011年)
[39] 伊利奥贝特。;Bifet,A。;普法林格,B。;Holmes,G.,《利用不断演变的流式数据进行主动学习》(Proc.10th ECML/PKDD European Conf.Mach.learning Knowl.Disc.Databases,Part III,LNCS,vol.6913(2011),Springer)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。