×

成本敏感的在线多标签分类的动态主投影。 (英语) Zbl 1493.62378号

摘要:我们研究了多标签分类(MLC)的三个重要现实问题:在线更新、标签空间降维(LSDR)和成本敏感性。当前的MLC算法并没有同时解决这三个问题。在本文中,我们提出了一种新的算法,成本敏感动态主投影(CS-DPP),解决了所有这三个问题。CS-DPP的基础是一个在线LSDR框架,该框架源自领先的LSDR算法。特别是,CS-DPP配备了一个由矩阵随机梯度驱动的高效在线降维器,并在与精心设计的在线回归学习器相结合时建立了其理论基础。此外,CS-DPP将成本信息嵌入到标签权重中,以实现成本敏感性和理论保证。实验结果表明,在不同的评价标准下,CS-DPP算法比现有的MLC算法具有更好的实际性能,并证明了同时解决这三个问题的重要性。

MSC公司:

62H30型 分类和区分;聚类分析(统计方面)
62H25个 因子分析和主成分;对应分析
68T05年 人工智能中的学习和自适应系统
68周27 在线算法;流式算法
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Arora,R.、Cotter,A.和Srebro,N.(2013年)。带帽味精PCA的随机优化。NIPS 2013(第1815-1823页)。
[2] Balasubramanian,K.和Lebanon,G.(2012年)。多输出预测的地标选择方法。在ICML 2012中。
[3] Bartlett,P.(2008)。在线凸优化:岭回归,自适应。https://people.eecs.berkeley.edu/bartlett/courses/281b-sp08/24.pdf。2017年11月4日访问。
[4] Bello,J.P.、Chew,E.和Turnbull,D.(2008)。音乐情感的多标签分类。ICMIR 2008(第325-330页)。
[5] Bhatia,K.、Jain,H.、Kar,P.、Varma,M.和Jain,P.(2015)。极端多标签分类的稀疏局部嵌入。NIPS 2015(第730-738页)。
[6] Bi,W.,&Kwok,J.T.(2013)。具有多个标签的高效多标签分类。ICML 2013(第405-413页)。
[7] Chen,Y.,&Lin,H.(2012)。针对多标签分类的特征感知标签空间降维。NIPS 2012(第1538-1546页)。
[8] Chua,T.、Tang,J.、Hong,R.、Li,H.、Luo,Z.和Zheng,Y.(2009)。NUS-WIDE:来自新加坡国立大学的真实网络图像数据库。在CIVR 2009中。
[9] 克拉默,K。;Dekel,O。;Keshet,J。;沙列夫·施瓦茨,S。;Singer,Y.,《在线被动攻击算法》,《机器学习研究杂志》,7551-585(2006)·Zbl 1222.68177号
[10] Dembczynski,K.、Cheng,W.和Hüllermier,E.(2010年)。通过概率分类器链进行贝叶斯最优多标签分类。ICML 2010(第279-286页)。
[11] Dembczynski,K.、Waegeman,W.、Cheng,W.和Hüllermier,E.(2011年)。F测度最大化的精确算法。在NIPS 2011中(第1404-1412页)。
[12] Elisseeff,A.和Weston,J.(2001)。多标记分类的核心方法。在NIPS 2001中。
[13] Hsu,D.、Kakade,S.、Langford,J.和Zhang,T.(2009)。通过压缩感知进行多标签预测。NIPS 2009(第772-780页)。
[14] Kapoor,A.、Viswanathan,R.和Jain,P.(2012年)。使用贝叶斯压缩感知的多标签分类。NIPS 2012(第2654-2662页)。
[15] Li,C.和Lin,H.(2014)。用于成本敏感型多标签分类的压缩过滤树。ICML 2014(第423-431页)。
[16] Li,C.、Lin,H.和Lu,C.(2016)。内存受限流式PCA的两类算法的竞争。在AISTATS 2016中。
[17] Lin,Z.、Ding,G.、Hu,M.和Wang,J.(2014)。通过特征感知的隐式标签空间编码进行多标签分类。ICML 2014(第325-333页)。
[18] 刘伟。;Tsang,Iw;Müller,Kr,《多类多标签的易-难学习范式》,《机器学习研究杂志》,18,1-38(2017)·Zbl 1441.62170号
[19] Lo,H。;Wang,J。;Wang,H。;Lin,S.,音频标签注释和检索的成本敏感多标签学习,IEEE多媒体交易,13,3,518-529(2011)·doi:10.1109/TMM.2011.2129498
[20] 毛,Q。;曾,Iwh;Gao,S.,客观引导图像注释,IEEE图像处理汇刊,221585-1597(2013)·Zbl 1373.94277号 ·doi:10.1109/TIP.2012.2233490
[21] 聂,J。;科特洛夫斯基,W。;Warmuth,Mk,Online PCA with optimal requires,《机器学习研究杂志》,第17期,194-200页(2016年)·Zbl 1405.68453号
[22] Osojnik,A。;帕诺夫,P。;Deroski,S.,通过数据流上的多目标回归进行多标签分类,机器学习,106745-770(2017)·Zbl 1455.68178号 ·doi:10.1007/s10994-016-5613-5
[23] Read,J.、Bifet,A.、Holmes,G.和Pfahringer,B.(2011年)。流式处理多标签分类。2011年模式分析应用研讨会论文集(第19-25页)。
[24] 里德·J。;普法林格,B。;霍姆斯,G。;Frank,E.,多标签分类的分类器链,机器学习,85,3,333-359(2011)·doi:10.1007/s10994-011-5256-5
[25] Sun,L。;季S。;Ye,J.,《多标签分类的典型相关分析:最小二乘公式、扩展和分析》,IEEE模式分析和机器智能汇刊,33,1,194-200(2011)·doi:10.1109/TPAMI.2010.160
[26] Tai,F。;Lin,H.,带主标签空间变换的多标签分类,神经计算,24,9,2508-2542(2012)·Zbl 1269.68084号 ·doi:10.1162/NECO_a_00320
[27] Tang,L.、Rajan,S.和Narayanan,V.K.(2009年)。通过metalabeler进行大规模多标签分类。WWW 2009(第211-220页)。
[28] Tsoumakas,G。;Katakis,I。;叶夫拉哈瓦斯;O.Maimon。;Rokach,L.,《挖掘多标签数据》,《数据挖掘和知识发现手册》,667-685(2010),马萨诸塞州波士顿:斯普林格
[29] Tsoumakas,G.和Vlahavas,I.P.(2007)。随机k标签集:多标签分类的集成方法。ECML 2007(第406-417页)。
[30] Tsoumakas,G。;Xioufis,Es;维尔切克,J。;Vlahavas,Ip,MULAN:用于多标签学习的java库,《机器学习研究杂志》,第12期,第2411-2414页(2011年)·Zbl 1280.68207号
[31] Wu,Y。;Lin,H.,用于成本敏感多标签分类的渐进式\(k\)-标签集,机器学习,106,5671-694(2017)·Zbl 1454.62203号 ·数字对象标识代码:10.1007/s10994-016-5600-x
[32] Xioufis,E.S.、Spiliopoulou,M.、Tsoumakas,G.和Vlahavas,I.P.(2011年)。处理多标签流分类中的概念漂移和类不平衡。在2011年国际建筑学会(IJCAI)中(第1583-1588页)。
[33] Yu,H.、Jain,P.、Kar,P.和Dhillon,I.S.(2014)。缺少标签的大规模多标签学习。ICML 2014(第593-601页)。
[34] Zhang,X.、Graepel,T.和Herbrich,R.(2010年)。多标签和多变量性能度量的贝叶斯在线学习。在AISTATS 2010中。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。