×

基于数据流多目标回归的多标签分类。 (英语) Zbl 1455.68178号

摘要:在机器学习应用中,多标签分类(MLC)任务的使用越来越频繁。虽然MLC方法适用于经典的批设置,但只有少数方法可用于流设置。本文提出了一种在流媒体环境下通过多目标回归进行MLC的新方法。此外,我们开发了一个使用这种方法的流式多目标回归量iSOUP-Tree。我们通过实验比较了iSOUP-Tree方法的两种变体(建立回归树和模型树),以及iSOUP-trees与最先进的树和数据流MLC集成方法的集成。我们根据各种预测性能指标(适用于MLC任务)评估这些方法。iSOUP-Trees的集合在其中一些度量上表现得更好,尤其是基于标签排名的度量,在其余度量上也没有明显差于竞争对手。我们将数据流上MLC任务的阈值问题确定为需要解决的关键问题,以便在预测性能方面获得更好的结果。

MSC公司:

68T05型 人工智能中的学习和自适应系统
68周27 在线算法;流式算法
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Appice,A.和Díeroski,S.(2007年)。多目标模型树的逐步归纳。机器学习:ECML 2007,LNCS(第4701卷,第502-509页)。斯普林格。
[2] Bifet,A.和Gavaldá,R.(2009年)。从不断变化的数据流中进行自适应学习。智能数据分析进展VIII(第249-260页)。斯普林格·Zbl 1454.68134号
[3] Bifet,A.、Holmes,G.、Kirkby,R.和Pfahringer,B.(2010年)。Moa:大量在线分析。机器学习研究杂志,11601-1604。
[4] Bifet,A.、Holmes,G.、Pfahringer,B.、Kirkby,R.和Gavaldá,R.(2009年)。进化数据流的新集成方法。第15届ACM SIGKDD知识发现和数据挖掘国际会议论文集(第139-148页)。ACM公司。
[5] Cheng,W.和Hüllermier,E.(2009)。结合基于实例的学习和逻辑回归进行多标签分类。机器学习,76(2-3),211-225·Zbl 1470.68091号 ·doi:10.1007/s10994-009-5127-5
[6] Demšar,J.(2006)。多个数据集上分类器的统计比较。机器学习研究杂志,7,1-30·Zbl 1222.68184号
[7] Domingos,P.和Hulten,G.(2000年)。挖掘高速数据流。第六届ACM SIGKDD知识发现和数据挖掘国际会议论文集(第71-80页)。ACM公司。
[8] Duarte,J.和Gama,J.(2014)。来自高速数据流的自适应模型规则的集合。在关于大数据、流和异构源挖掘的第三次国际研讨会上(第198-213页)。
[9] Duarte,J.和Gama,J.(2015)。使用自适应模型规则从高速数据流进行多目标回归。2015年IEEE数据科学和高级分析国际会议(DSAA)。36578 2015(第1-10页)·Zbl 1454.68134号
[10] Frank,E.,Wang,Y.,Inglis,S.,Holmes,G.,&Witten,I.H.(1998)。使用模型树进行分类。机器学习,32(1),63-76·Zbl 0901.68167号
[11] 弗里德曼M.(1940)。对\[m\]m排名问题重要性的替代测试进行比较。《数理统计年鉴》,11(1),86-92·Zbl 0063.01455号 ·doi:10.1214/aoms/1177731944
[12] Fürnkranz,J.、Hüllermeier,E.、Mencía,E.L.和Brinker,K.(2008)。通过校准标签排名进行多标签分类。机器学习,73(2),133-153·Zbl 1470.68108号 ·doi:10.1007/s10994-008-5064-8
[13] Gama,J.(2010)。从数据流中发现知识。博卡拉顿:CRC出版社·Zbl 1230.68017号 ·doi:10.1201/EBK1439826119
[14] Gibaja,E.和Ventura,S.(2015)。多标签学习教程。ACM计算调查(CSUR),47(3),52·doi:10.145/2716262
[15] Gonçalves,E.C.、Plastino,A.和Freitas,A.A.(2013年)。一种用于优化多标签分类器链中标签顺序的遗传算法。2013年IEEE第25届人工智能工具国际会议(ICTAI)(第469-476页)。电气与电子工程师协会。
[16] Hulten,G.和Domingos,P.(2003)。VFML—用于挖掘高速时变数据流的工具包。http://www.cs.washington.edu/dm/vfml/。
[17] Ikonomovska,E.、Gama,J.和Díeroski,S.(2010年)。从不断演变的数据流中学习模型树。数据挖掘和知识发现,23(1),128-168·Zbl 1235.68158号 ·doi:10.1007/s10618-010-0201-y
[18] Ikonomovska,E.、Gama,J.和Díeroski,S.(2011年a)。数据流的增量多目标模型树。2011年美国计算机学会应用计算研讨会论文集(第988-993页)。ACM公司·Zbl 1235.68158号
[19] Ikonomovska,E.、Gama,J.和Díeroski,S.(2011年b)。从不断演变的数据流中学习模型树。数据挖掘和知识发现,23(1),128-168·Zbl 1235.68158号 ·doi:10.1007/s10618-010-0201-y
[20] Ikonomovska,E.、Gama,J.和Díeroski,S.(2015)。在线基于树的集成和选项树,用于进化数据流的回归。神经计算,150458-470·doi:10.1016/j.neucom.2014.04.076
[21] Largeron,C.、Moulin,C.和Géry,M.(2012)。MCut:多标签分类的阈值策略(第172-183页)。柏林:斯普林格。
[22] Madjarov,G.、Kocev,D.、Gjorgjevikj,D.和Díeroski,S.(2012)。多标签学习方法的广泛实验比较。模式识别,45(9),3084-3104·doi:10.1016/j.patcog.2012.03.004
[23] Nemenyi,P.(1963年)。无分布多重比较。新泽西州博士论文·Zbl 1235.68158号
[24] Osojnik,A.、Panov,P.和Díeroski,S.(2015)。通过数据流上的多目标回归进行多标签分类。《发现科学》(第170-185页)。斯普林格·Zbl 1455.68178号
[25] Oza,N.C.(2005年)。在线装袋和助推。在2005年IEEE系统、人与控制论国际会议上(第3卷,第2340-2345页)。电气与电子工程师协会。
[26] 瞿伟、张毅、朱骏和邱琦(2009)。使用动态分类器集成挖掘多标签概念驱动数据流。《机器学习进展》(第308-321页)。斯普林格。
[27] Read,J.(2008年)。一种多标签分类的剪枝问题转换方法。2008年新西兰计算机科学研究学生会议记录(NZCSRS 2008)(第143-150页)。
[28] Read,J.、Bifet,A.、Holmes,G.和Pfahringer,B.(2012年)。可扩展且高效的多标签分类,用于不断发展的数据流。机器学习,88(1-2),243-272·doi:10.1007/s10994-012-5279-6
[29] Read,J.、Pfahringer,B.和Holmes,G.(2008)。使用剪枝集集合的多标签分类。在2008年第八届IEEE数据挖掘国际会议上。ICDM’08(第995-1000页)。电气与电子工程师协会。
[30] Read,J.、Pfahringer,B.、Holmes,G.和Frank,E.(2009年)。多标签分类的分类器链。柏林:斯普林格。 ·doi:10.1007/978-3642-04174-7_17
[31] Read,J.、Pfahringer,B.、Holmes,G.和Frank,E.(2011年)。多标签分类的分类器链。机器学习,85(3),333-359·doi:10.1007/s10994-011-5256-5
[32] Rutkowski,L.、Pietruczuk,L.,Duda,P.和Jaworski,M.(2013)。基于McDiarmid界的数据流挖掘决策树。IEEE知识与数据工程汇刊,25(6),1272-1279·doi:10.1109/TKDE.2012.66
[33] Shaker,A.和Hüllermier,E.(2012年)。IBLStreams:基于实例的数据流分类和回归系统。进化系统,3(4),235-249·doi:10.1007/s12530-012-9059-0
[34] Shi,Z.、Wen,Y.、Feng,C.和Zhao,H.(2014a)。基于标签分组和熵的多标签数据流漂移检测。2014年IEEE数据挖掘研讨会(ICDMW)(第724-731页)。电气与电子工程师协会。
[35] Shi,Z.,Xue,Y.,Wen,Y.和Cai,G.(2014b)。用于进化数据流的多标签分类的高效类增量学习。2014年,神经网络国际联合会议(IJCNN)(第2093-2099页)。电气与电子工程师协会·Zbl 1235.68158号
[36] Spyromitros-Xioufis,E.(2011年)。处理多标签流分类中的概念漂移和类不平衡。塞萨洛尼基亚里士多德大学博士论文。
[37] Struyf,J.和Díeroski,S.(2006年)。基于约束的多目标回归树归纳。在归纳数据库中的知识发现,LNCS(第3933卷,第222-233页)。斯普林格。
[38] Triguero,I.和Vens,C.(2016)。分层多标签分类技术的标签策略。模式识别,56170-183·doi:10.1016/j.patcog.2016.02.017
[39] Tsoumakas,G.和Katakis,I.(2007年)。多标签分类:概述。国际JDWM,3(3),1-13。
[40] Tsoumakas,G.和Vlahavas,I.(2007年)。随机k标签集:多标签分类的集成方法。机器学习:ECML 2007(第406-417页)。斯普林格。
[41] Vens,C.、Struyf,J.、Schietgat,L.、Díeroski,S.和Blockeel,H.(2008)。分层多标签分类的决策树。机器学习,73(2),185-214·兹比尔1470.62098 ·doi:10.1007/s10994-008-5077-3
[42] Xioufis,E.S.、Tsoumakas,G.、Groves,W.和Vlahavas,I.P.(2016)。通过输入空间扩展的多目标回归:将目标视为输入。机器学习,104(1),55-98·Zbl 1454.68134号 ·doi:10.1007/s10994-016-5546-z
[43] Zhang,M.L.,&Zhou,Z.H.(2005)。一种基于k近邻的多标签分类算法。2005年IEEE颗粒计算(第2卷,第718-721页)。电气与电子工程师协会。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。