×

标签缺失且完全无法观察的多标签学习。 (英语) Zbl 1473.68148号

摘要:多标签学习处理同时与多个类标签关联的数据示例。尽管现有的多标签学习方法取得了成功,但研究人员仍然忽视了一个问题,即,不仅观测到的标签的一些值丢失了,而且训练数据中的一些标签也完全看不到。我们将此问题称为标签缺失和完全不可观测的多标签学习,并认为有必要发现这些完全未被观察到的标签,以便挖掘有用的知识,并深入了解数据背后的内容。在本文中,我们提出了一种新的方法MCUL来解决带有缺失和完全未观察标签的多标签学习问题。我们尝试使用基于聚类的正则化术语来发现多标签数据集的未观察标签,并基于MCUL学习到的标签特定特征来描述它们的语义,并通过利用标签相关性来克服标签缺失的问题。所提出的方法MCUL可以同时预测观测到的和新发现的标签,用于未知数据示例。通过十个基准数据集的实验验证表明,该方法在观测标签上的性能优于其他最新方法,在新发现的标签上也获得了可接受的性能。

MSC公司:

68T05型 人工智能中的学习和自适应系统
62D10号 缺少数据
62小时30分 分类和区分;聚类分析(统计方面)
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 贝克,A。;Teboulle,M.,线性反问题的快速迭代收缩阈值算法,SIAM成像科学杂志,2,1,183-202(2009)·Zbl 1175.94009号 ·doi:10.1137/080716542
[2] Bhatia K、Jain H、Kar P、Varma M、Jain P(2016)《极端多标签分类的稀疏局部嵌入》。In:神经信息处理系统(NIPS),第730-738页
[3] 布特尔,MR;罗,JB;沈,XP;Brown,CM,学习多标签场景分类,模式识别,37,91757-1771(2004)·doi:10.1016/j.patcog.2004.03.009
[4] Chu,英国皇家医学院;黄,KH;Lin,HT,成本敏感型在线多标签分类的动态主预测,Mach Learn,108,1,1193-1230(2019)·Zbl 1493.62378号 ·doi:10.1007/s10994-018-5773-6
[5] Da Q,Yu Y,Zhou ZH(2014)利用未标记数据进行增广课堂学习。In:AAAI人工智能会议(AAAI),第2373-2379页
[6] Decubber S,Mortier T,Dembczyñski K,Waegeman W(2019)多标签分类中的深度f测度最大化:一项比较研究。摘自:欧洲机器学习与数据库知识发现原理与实践会议(ECML PKDD),第290-305页
[7] Dembczyñski K,Cheng W,Hüllermier E(2010)基于概率分类器链的贝叶斯最优多标签分类。In:机器学习国际会议(ICML),第1609-1614页
[8] Demšar,J.,多数据集上分类器的统计比较,J Mach Learn Res,7,1-30(2006)·Zbl 1222.68184号
[9] 丁C,何X,Simon HD(2005)关于非负矩阵分解与谱聚类的等价性。In:SIAM国际数据挖掘会议,第606-610页
[10] Elisseeff A,Jason W(2001)多标记分类的核心方法。In:神经信息处理系统(NIPS),第681-687页
[11] Fürnkranz,J。;Hüllermier,E。;Loza Mencía,E。;Brinker,K.,《通过校准标签排名进行多标签分类》,《马赫学习》,73,2,133-153(2008)·Zbl 1470.68108号 ·doi:10.1007/s10994-008-5064-8
[12] Gibaja,E。;Ventura,S.,《多标签学习教程》,ACM Compute Surv,47,3,52:1-52:38(2015)·doi:10.1145/2716262
[13] Herrera,F。;Charte,F。;AJ里维拉;del Jesus,MJ,《多标签分类:问题分析、度量和技术》(2016),柏林:施普林格出版社,柏林·doi:10.1007/978-3-319-4111-8
[14] 黄,J。;李·G。;黄,Q。;Wu,X.,学习标签特定特征和多标签分类的类相关标签,IEEE Trans Knowl Data Eng,28,12,3309-3323(2016)·doi:10.1109/TKDE.2016.2608339
[15] 黄,J。;李·G。;黄,Q。;Wu,X.,多标签学习的联合特征选择和分类,IEEE Trans-Cybern,48,3,876-889(2018)·doi:10.1109/TCYB.2017.2663838
[16] 黄,J。;秦,F。;郑,X。;郑,Z。;袁,Z。;张伟。;Huang,Q.,通过学习标签特定特征改进缺少标签的多标签分类,《信息科学》,492124-146(2019)·Zbl 1451.68225号 ·doi:10.1016/j.ins.2019.04.021
[17] 刘伟(2019)Copula多标签学习。In:神经信息处理系统(NIPS),第6334-6343页
[18] Liu W,Shen X(2019)利用甲骨文属性稀疏极端多标签学习。In:机器学习国际会议(ICML),第4032-4041页
[19] Masera L,Blanzieri E(2019)Awx:层次-多标签分类的综合方法。摘自:欧洲机器学习与数据库知识发现原理与实践会议(ECML PKDD),第322-336页
[20] Mu X,Zhu F,Du J,Lim EP,Zhou ZH(2017)《流媒体分类与新兴的逐类矩阵绘制》。In:AAAI人工智能会议(AAAI),第2373-2379页
[21] Nguyen V,Hüllermeier E(2019)可靠的多标签分类:部分弃权的预测。CoRR arXiv公司:1904.09235
[22] Park LAF,Read J(2019)用于多标签优化和评估的混合指标。摘自:欧洲机器学习与数据库知识发现原理与实践会议(ECML PKDD),第719-734页
[23] Pham A、Raich R、Fern X、Arriaga JP(2015)《新课堂实例下的多实例多标签学习》。In:机器学习国际会议(ICML),第2427-2435页
[24] Qu W,Zhang Y,Zhu J,Qiu Q(2009)使用动态分类器集成挖掘多标签概念驱动数据流。In:亚洲机器学习会议(ACML),第308-321页
[25] 阅读J,Pfahringer B,Holmes G(2008)使用修剪集集合的多标签分类。In:IEEE数据挖掘国际会议(ICDM),第995-1000页
[26] 阅读J,Pfahringer B,Holmes G,Frank E(2009)多标签分类的分类器链。摘自:欧洲机器学习与数据库知识发现原理与实践会议(ECML PKDD),第254-269页
[27] 阅读J、Bifet A、Holmes G、Pfahringer B(2011)《流媒体多标签分类》。摘自:第二届模式分析应用研讨会论文集,第17卷,第19-25页
[28] Shi Z,Xue Y,Wen Y,Cai G(2014)进化数据流多标签分类的高效类增量学习。In:国际神经网络联合会议(IJCNN),第2093-2099页
[29] 孙毅,张毅,周Z(2010)弱标签多标签学习。In:AAAI人工智能会议(AAAI),第593-598页
[30] Tan Q,Yu G,Domeniconi C,Wang J,Zhang Z(2018)不完全多视角弱标签学习。In:国际人工智能联合会议(IJCAI),第2703-2709页
[31] Tsoumakas G,Katakis I,Vlahavas I(2010)挖掘多标签数据。收录:数据挖掘和知识发现手册,第667-685页
[32] Tsoumakas,G。;Katakis,I。;Vlahavas,L.,多标签分类的随机k标签集,IEEE Trans Knowl Data Eng,23,7,1079-1089(2011)·doi:10.1109/TKDE.2010.164
[33] Wei T,Tu W,Li Y(2019)尾标签数据学习:标签特定特征方法。In:国际人工智能联合会议(IJCAI),第3842-3848页
[34] Wu X,Chen Q,Hu Y,Wang D,Chang X,Wang X,Zhang ML(2019)《基于特定视图信息提取的多视图多标签学习》。In:国际人工智能联合会议(IJCAI),第3884-3890页
[35] Wydmuch M、Jasinska K、Kuznetsov M、Busa-Fekete R、Dembczynski K(2018)分层softmax到极端多标签分类的一种无梯度推广。In:神经信息处理系统(NIPS),第6355-6366页
[36] Xu M,Jin R,Zhou Z(2013)带边信息的加速矩阵补全:在多标签学习中的应用。In:神经信息处理系统(NIPS),第2301-2309页
[37] Yu H、Jain P、Kar P、Dhillon IS(2014)《缺少标签的大规模多标签学习》。In:机器学习国际会议(ICML),第593-601页
[38] 张杰。;Wu,X.,使用混合模型进行众包的多标签真值推断,IEEE Trans Knowl Data Eng(2019)·doi:10.1109/TKDE.2019.2951668
[39] 张,ML;Wu,L.,Lift:具有标签特定功能的多标签学习,IEEE Trans-Pattern Ana Mach Intell,37,1,107-120(2015)·doi:10.1109/TPAMI.2014.2339815
[40] 张,ML;Zhou,ZH,多标签神经网络及其在功能基因组学和文本分类中的应用,IEEE跨知识数据工程,18,10,1338-1351(2006)·doi:10.1109/TKDE.2006.162
[41] 张,ML;Zhou,ZH,Ml-knn:多标签学习的懒惰学习方法,模式识别,40,72038-2048(2007)·Zbl 1111.68629号 ·doi:10.1016/j.patcog.2006.12.019
[42] 张,ML;周,ZH,《多标签学习算法综述》,IEEE Trans Knowl Data Eng,26,8,1819-1837(2014)·doi:10.1109/TKDE.2013.39
[43] Zhang Y,Henao R,Gan Z,Li Y,Carin L(2018)基于卷积残差模型的医学纯文本多标签学习。摘自:第三届医疗保健机器学习会议记录,第280-294页
[44] 张义杰,赵鹏,周志华(2020)未知未知条件下的探索性机器学习。CoRR arXiv公司:2002.01605
[45] 朱毅,婷KM,周志华(2017)在多实例多标签学习中发现多个新标签。In:AAAI人工智能会议(AAAI),第2977-2983页
[46] Zhu,Y。;郭,JT;Zhou,ZH,具有全球和本地标签相关性的多标签学习,IEEE Trans Knowl Data Eng,30,6,1081-1094(2018)·doi:10.1109/TKDE.2017.2785795
[47] Zhu,Y。;Ting,KM;Zhou,ZH,新兴标签的多标签学习,IEEE Trans Knowl Data Eng,30,10,1901-1914(2018)·doi:10.1109/TKDE.2018年2810872
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。