×

概念漂移的特征。 (英语) Zbl 1411.68127号

摘要:大多数机器学习模型都是静态的,但世界是动态的,学习模型的在线部署越来越多,这就迫切需要开发高效的机制来解决非平稳分布环境中的学习问题,或俗称的学习问题概念漂移然而,表征可能发生的不同类型漂移的关键问题以前没有经过严格的定义和分析。特别是,虽然已经提出了一些定性漂移分类,但很少有正式定义,而且还不存在准确客观地理解学习者表现所需的定量描述。我们提出了第一个漂移定量分析的综合框架。这支持开发第一套全面的概念漂移类型的正式定义。正式定义澄清了歧义并确定了以前定义中的差距,从而产生了新的概念漂移类型的全面分类,为研究检测和解决概念漂移的机制奠定了坚实的基础。

MSC公司:

68T05型 人工智能中的学习和自适应系统

软件:

农业部
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Aggarwal CC(2009)《数据流:概述和科学应用》。柏林施普林格,第377-397页。doi:10.1007/978-3-642-02788-8_14
[2] Aggarwal CC,Han J,Wang J,Yu PS(2003)《进化数据流聚类框架》。收录:第29届超大数据库国际会议论文集,VLDB Endowment,29:81-92
[3] Angluin D(1988)《问答与概念学习》。马赫数学习2(4):319-342·Zbl 1470.68050号
[4] Babcock B,Datar M,Motwani R(2002),从流数据的移动窗口采样。摘自:第十三届ACM-SIAM离散算法年会论文集,工业和应用数学学会,第633-634页·兹比尔1093.68571
[5] Baena-Garc a M,del Campo-ávila J,Fidalgo R,Bifet a,Gavalda R,Morales-Bueno R(2006)早期漂移检测方法。参加:第四届数据流知识发现国际研讨会,6:77-86
[6] Bartlett PL,Ben David S,Kulkarni SR(2000)通过利用变化的结构来学习变化的概念。马赫数学习41(2):153-174·Zbl 0965.68028号 ·doi:10.1023/A:1007604202679
[7] Bifet A、Gama J、Pechenizkiy M、Zliobaite I(2011)《处理概念漂移:重要性、挑战和解决方案》。PAKDD-2011教程,中国深圳·Zbl 1305.68141号
[8] Bifet A,GavaldáR(2009),从不断变化的数据流中自适应学习。In:智能数据分析进展VIII,Springer,249-260
[9] Bifet A、Holmes G、Kirkby R、Pfahringer B(2010a)MOA:大规模在线分析。马赫学习研究杂志11:1601-1604
[10] Bifet A、Holmes G、Pfahringer B(2010年B)《利用袋装技术实现不断发展的数据流》。In:数据库中的机器学习和知识发现,Springer,pp 135-150
[11] Bose RJC、van der Aalst WMP、Zliobaite I、Pechenizkiy M(2011)《处理过程挖掘中的概念漂移》。摘自:Haralambos M,Colette R(编辑)《高级信息系统工程》,计算机科学讲稿,柏林斯普林格,第391-405页。doi:10.1007/978-3642-21640-4_30
[12] Brzezinski D(2014a)对不同类型概念漂移的反应:精度更新的集成算法。神经网络学习系统IEEE Trans 25(1):81-94。doi:10.1109/TNNLS.2013.2251352·doi:10.1109/TNNLS.2013.2251352
[13] Brzeziñski D(2010)使用概念漂移挖掘数据流。波兹南科技大学硕士论文
[14] Brzezinski D,Stefanowski J(2014b)对不同类型概念漂移的反应:精度更新的集成算法。神经网络学习系统IEEE Trans 25(1):81-94·doi:10.1109/TNNLS.2013.2251352
[15] Brzezinski D,Stefanowski J(2014c)进化数据流中分类器评估和漂移检测的前AUC。摘自:第三届采矿复合模式新领域国际研讨会论文集,南希
[16] Cieslak DA,Chawla NV(2009)《监控分类器性能的框架:故障发生的时间和原因》?知识通知系统18(1):83-108 ISSN 0219-1377·doi:10.1007/s10115-008-0139-1
[17] Dongre PB,Malik LG(2014)实时数据流分类和适应各种概念漂移场景的综述。In:高级计算会议(IACC),2014 IEEE国际,第533-537页,doi:10.1109/IAdCC.2014.6779381
[18] Dries Anton,Rückert Ulrich(2009),自适应概念漂移检测。统计分析数据最小值2(5-6):311-327·doi:10.1002/sam.10054
[19] Gaber Mohamed Medhat、Zaslavsky Arkady、Krishnaswamy Shonali(2005)《采矿数据流:综述》。ACM Sigmod Rec 34(2):18-26·Zbl 1087.68557号 ·doi:10.1145/1083784.1083789
[20] Gama J、Zliobaite I、Bifet A、Pechenizkiy M、Bouchachia A(2014)《概念漂移适应调查》。ACM计算机调查46(4):44:1-44:37。doi:10.1145/2523813 ISSN 0360-0300·Zbl 1305.68141号 ·doi:10.1145/2523813
[21] Gama J,Rodrigues P(2009)《采矿数据流概述》,计算智能研究第206卷。柏林施普林格。doi:10.1007/978-3642-01091-02·Zbl 1185.68288号 ·doi:10.1007/978-3642-01091-02
[22] Gama J、Medas P、Castillo G、Rodrigues P(2004)《漂移检测学习》。在Ana LC,Bazzan,Sofiane L(ed),人工智能SBIA的进展·Zbl 1105.68376号
[23] 贾马,J。;梅达斯,P。;G、 卡斯蒂略;罗德里格斯,P.,《漂移检测学习》,286-295(2004),纽约·Zbl 1105.68376号 ·doi:10.1007/978-3-540-28645-5_29
[24] Gomes JB,Menasalvas E,Sousa PAC(2011)使用上下文软件集成从数据流中学习重复出现的概念。摘自:2011年美国计算机学会应用计算研讨会论文集,SAC’11,美国计算机学会,纽约,第994-999页。数字对象标识代码:10.1145/1982185.1982403
[25] Hoens TR,Chawla NV,Polikar R(2011)非平稳环境中的启发式可更新加权随机子空间。Diane JC、Jian P、Wei W、Osmar RZ、Xindong W(ed),IEEE数据挖掘国际会议,ICDM-11,IEEE,第241-250页
[26] Hoens TR、Polikar R、Chawla NV(2012)《从概念漂移和不平衡的流数据中学习:概述》。程序艺术智能1(1):89-101。doi:10.1007/s13748-011-0008-0·doi:10.1007/s13748-011-0008-0
[27] Huang DTJ,Koh YS,Gillian D,Pears R(2013),跟踪变化数据流中的漂移类型。发表于:Hiroshi M、Wu Z、Cao L、Zaiane O、Min Y、Wei W(编辑)《高级数据挖掘和应用》。计算机科学课堂讲稿。柏林施普林格,第72-83页。doi:10.1007/978-3-642-53914-57
[28] Hulten G,Spencer L,Domingos P(2001)挖掘时变数据流。摘自:第七届ACM SIGKDD知识发现和数据挖掘国际会议论文集,KDD-01,ACM,第97-106页
[29] Jiang N,Gruenwald L(2006)数据流关联规则挖掘的研究问题。ACM SIGMOD记录35(1):14-19·doi:10.1145/1121995.1121998
[30] Kelly MG、Hand DJ、Adams NM(1999)《人口变化对分类器性能的影响》。摘自:第五届ACM SIGKDD知识发现和数据挖掘国际会议论文集,KDD-99,纽约,ACM,第367-371页。doi:10.145/312129.3312285
[31] Kosina Petr、Gama Joáo、Sebastiáo-Raquel(2010)《漂移严重性度量》。欧洲人工智能会议,ECAI 2010:1119-1120
[32] Krempl G、Zliobaite I、Brzezinski D、Hullermeier E、Last M、Lemaire V、Noack T、Shaker A、Sievi S、Spiliopoulou M、Stefanowski J(2014)数据流挖掘研究的公开挑战。收录:ACM SIGKDD探索通讯,第16-1卷,第1-10页
[33] Kuh A、Petsche T、Rivest RL(1991)学习时变概念。主题:神经信息处理系统的进展,第183-189页
[34] Kullback S,Leibler RA(1951)《信息与充分性》。数学年鉴22(1):79-86·Zbl 0042.38403号
[35] Kuncheva LI(2004)《变化环境的分类器集成》。In:多分类器系统。施普林格,第1-15页
[36] Masud MM,Gao J,Khan L,Han J,Thuraisingham B(2011)时间约束下概念漂移数据流中的分类和新的类检测。IEEE Trans Knowl Data Eng 23(6):859-874·doi:10.1109/TKDE.2010.61
[37] Michalski RS(1983)归纳学习的理论和方法。施普林格,纽约
[38] Minku FL,Yao X(2009)使用多样性处理在线学习中的概念漂移。In:国际神经网络联合会议,IJCNN-09,IEEE,pp 2125-2132
[39] Minku LL,White AP,Xin Y(2010)概念漂移下多样性对在线集成学习的影响。IEEE Trans Knowl Data Eng 22(5):730-742。doi:10.1109/TKDE.2009.156 ISSN 1041-4347·doi:10.1109/TKDE.2009.156
[40] Moreno-Torres Jose G、Raeder Troy、Alaiz-Rodrguez Rocio、Chawla Nitesh V、Herrera Francisco(2012)《关于分类中数据集转移的统一观点》。图案识别45(1):521-530 ISSN 0031-3203·doi:10.1016/j.patcog.2011.06.019
[41] Narasimhamurthy A,Kuncheva L(2007)生成数据以模拟不断变化的环境的框架。摘自:第25届IASTED国际多会议论文集:人工智能与应用,ACTA出版社,549:p 389
[42] Nguyen H-L,Woon Y-K,Ng W-K,Wan L(2012)数据流中特征漂移的异质集成。领域:知识发现和数据挖掘的进展。施普林格,第1-12页
[43] Nguyen H-L,Woon Y-K,Ng W-K(2014)数据流聚类和分类调查。知识信息系统第1-35页
[44] Nishida Kyosuke,Yamauchi K(2007)使用统计测试检测概念漂移。收录:《发现科学》,斯普林格出版社,第264-269页
[45] Oza NC,Russell S(2001)《在线装袋和助推》。收录:《2001年人工智能与统计》,Morgan Kaufmann pp 105-112
[46] Pfahringer B、Holmes G、Kirkby R(2007年)《Hoeffing树的新选择》。收录:Mehmet O,John T(编辑)AI 2007:人工智能进展,第4830版。,计算机科学讲稿纽约春天,第90-99页。doi:10.1007/978-3-540-76928-6_11
[47] Quionero-Candela J、Sugiyama M、Schwaighofer A、Lawrence ND(2009)《机器学习中的数据集转换》。麻省理工学院出版社,剑桥
[48] Shaker A,Hullermeier E(2015)非平稳数据流自适应学习的恢复分析。收录:神经计算,ScienceDirect,第250-264页
[49] Subramaniam S、Palpanas T、Papadopoulos D、Kalogeraki V、Gunopulos D(2006)使用非参数模型在线检测传感器数据中的异常值。摘自:第32届超大数据库国际会议论文集,VLDB Endowment,第187-198页
[50] Tsymbal A(2004)《概念漂移问题:定义和相关工作》,技术报告TCD-CS-2004-15,都柏林大学,三一学院,都柏林计算机科学系
[51] Wetzel L(2009)类型和代币。收录于:Zalta EN(编辑)斯坦福大学哲学百科全书。http://plato.stanford.edu/archives/spr2014/entries/types-tokens/
[52] Wang H,Fan W,Yu PS,Han J(2003)使用集成分类器挖掘概念驱动数据流。摘自:第九届ACM SIGKDD知识发现和数据挖掘国际会议论文集,KDD-03,纽约,ACM,第226-235页。doi:10.1145/956750.956778
[53] Wang H,Fan W,Yu PS,Han J(2003b)使用集成分类器挖掘概念驱动数据流。摘自:第九届ACM SIGKDD知识发现和数据挖掘国际会议论文集,KDD-03,ACM,第226-235页
[54] Wang S、Minku LL、Ghezzi D、Caltabiano D、Tino P、Yao X(2013)《在线课堂不平衡学习的概念漂移检测》。In:2013年国际神经网络联合会议,IJCNN-13,IEEE,第1-10页
[55] Widmer G,Kubat M(1996),在概念漂移和隐藏背景下的学习。马赫学习23(1):69-101。doi:10.1007/BF00116900 ISSN 0885-6125·doi:10.1007/BF00116900
[56] Zhang P,Zhu X,Shi Y(2008)分类和挖掘概念漂移数据流。摘自:第14届ACM SIGKDD知识发现和数据挖掘国际会议记录,KDD-08,ACM,第812-820页。数字对象标识代码:10.1145/1401890.1401987
[57] Zliobaite I(2010)《概念漂移下的学习:概述》。技术报告
[58] Zliobaite,I.,《测试自适应学习模型的受控排列》,第39期,565-578(2014),伦敦
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。