×

解决候选标签中的标签歧义不平衡:度量和消歧算法。 (英文) Zbl 07830735号

总结:部分标记学习(PLL)是一个弱监督学习框架,其中每个训练实例都与多个候选标签相关联。然而,在标签不平衡的情况下,标签歧义并没有得到很好的解决。本文提出了一种新的标签不平衡软件算法PL-LIMAP来有效地解决这个问题。首先,提出了一种部分流形约束的低秩表示方法来学习实例亲和矩阵,该方法可以通过充分挖掘数据的流形结构来识别具有相同标签的实例。此外,为了充分利用候选标签中隐藏的信息,引入Jaccard距离度量候选标签之间的相似度,得到标签亲和矩阵。这两个亲和矩阵的组合可以通过互补信息达到消歧的目的。同时,为了确定歧义标签的不平衡性,提出了专门的措施来评估PLL中的不平衡程度。根据不同标签的不平衡程度,提出了一种替代权重方案来缓解歧义标签的不均衡。因此,即使事先无法获得实例的标签信息,也可以找到实例的实际标签。实验表明,PL-LIMAP具有压倒性的性能。

MSC公司:

68T05型 人工智能中的学习和自适应系统

软件:

UCI-毫升
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] L.Feng,B.An,基于语义差异最大化的部分标记学习,载于:IJCAI,中国澳门,2019年,第2294-2300页。
[2] 库尔·T。;Sapp,B.公司。;Taskar,B.,从部分标签中学习,J.Mach。学习。第12号决议,1501-1536(2011年)·Zbl 1280.68162号
[3] Lyu,G。;Feng,S。;Li,Y.,噪声标签容忍度:部分多标签学习的新视角,信息科学。,543, 454-466 (2021) ·Zbl 1475.68283号
[4] 张,M.-L。;Yu,F。;Tang,C.-Z.,无歧义部分标记学习,IEEE Trans。知识。数据工程,29,10,2155-2167(2017)
[5] 罗,J。;Orabona,F.,从候选标记集学习,高级神经信息处理。系统。,23, 1504-1512 (2010)
[6] 李·T。;吴,X。;镍,硼。;卢克。;Yan,S.,《弱监督多上下文线索场景解析》,《信息科学》。,323, 59-72 (2015)
[7] Chen,C.-H。;帕特尔,V.M。;Chellappa,R.,从模糊标记的人脸图像中学习,IEEE Trans。模式分析。机器。智力。,40, 7, 1653-1667 (2017)
[8] 刘,L。;Dietterich,T.,超集标记学习的条件多项式混合模型,高级神经信息处理。系统。,25, 548-556 (2012)
[9] Berg,T.L。;A.C.Berg。;J.爱德华兹。;Forsyth,D.A.,《照片中的人物》(神经信息处理系统进展(2005),加拿大不列颠哥伦比亚省),137-144
[10] Hüllermier,E。;Beringer,J.,《从模糊标注的示例中学习》,《情报》。数据分析。,10, 5, 419-439 (2006)
[11] 张,M.-L。;Yu,F.,《解决部分标签学习问题:基于实例的方法》(IJCAI,布宜诺斯艾利斯(2015),阿根廷),4048-4054
[12] 张,M.-L。;周,B.-B。;Liu,X.-Y.,通过特征感知消歧进行部分标签学习,(第22届ACM SIGKDD知识发现和数据挖掘国际会议论文集(2016),美国旧金山),1335-1344
[13] N.Nguyen,R.Caruana,《部分标签分类》,载于《第14届ACM SIGKDD知识发现和数据挖掘国际会议论文集》,美国内华达州拉斯维加斯,2008年,第551-559页。
[14] 张,H。;林,Z。;张,C。;Gao,J.,子空间聚类的鲁棒潜在低秩表示,神经计算,145,18,369-373(2014)
[15] 魏江,刘静,恒奇,戴琼海,基于非凸低秩表示的稳健子空间分割,信息科学。340-341(C)(2016)144-158·Zbl 1395.68233号
[16] Lyu,G。;Feng,S。;李毅。;Jin,Y。;戴,G。;Lang,C.,Hera:通过将异质损失与稀疏低阶正则化相结合的部分标记学习,ACM Trans。智力。系统。技术。,11, 3 (2020)
[17] 陈,Y。;帕特尔,V.M。;切拉帕,R。;Phillips,P.J.,《使用词典的学习》,IEEE Trans。Inf.法医安全。,9, 12, 2076-2088 (2014)
[18] 肖,S。;徐,D。;Wu,J.,通过学习弱标记图像中的区分亲和矩阵来自动命名人脸,IEEE Trans。神经网络学习。系统。,26, 10, 2440-2452 (2015)
[19] 彭,Y。;卢,B.-L。;Wang,S.,通过稀疏流形自适应增强半监督学习的低阶表示,神经网络,65,1-17(2015)·Zbl 1394.68307号
[20] Hao,Y。;Han,C。;邵,G。;Guo,T.,数据表示的广义图正则化非负矩阵分解,(2012年信息技术与软件工程国际会议论文集,Springer(2013)),1-12
[21] Roweis,S.T。;Saul,L.K.,通过局部线性嵌入降低非线性维数,《科学》,290,5500,2323-2326(2000)
[22] 钟骥,于云龙,彭燕伟,郭继昌,张忠飞,用于零快照学习的流形正则化交叉模式嵌入,信息科学。(2017). ·Zbl 1429.68219号
[23] G.Chen,T.Liu,Y.Tang,Y.Jian,D.Tao,基于实例的超集标记学习的正则化方法,IEEE Trans。赛博。(99) (2018) 1-12.
[24] 王,S。;Yao,X.,《多类不平衡问题:分析和潜在解决方案》,IEEE Trans。系统。人类网络。B部分(控制论),42,4,1119-1130(2012)
[25] He,H。;Ma,Y.,学习不平衡。基础、算法和应用、不平衡学习、发现。算法应用。(2013) ·Zbl 1272.68022号
[26] Charte,F。;里维拉,A.J。;德尔·耶稣,M.J。;Herrera,F.,《解决多标签分类中的不平衡:度量和随机重采样算法》,神经计算,163,3-16(2015)
[27] 龚,C。;刘,T。;Tang,Y。;杨,J。;杨,J。;Tao,D.,基于实例的超集标记学习的正则化方法,IEEE Trans。赛博。,48, 3, 967-978 (2017)
[28] Yu,F。;Zhang,M.-L.,最大裕度部分标签学习,马赫。学习。(2017) ·Zbl 1453.68161号
[29] 范,J。;Yu,Y。;王忠,用竞争学习图神经网络进行局部标号学习,工程应用。工件。智力。,111,第104779条pp.(2022)
[30] J.Lv,M.Xu,L.Feng,G.Niu,M.Sugiyama,《部分标记学习中真标记的渐进识别》(2020年)。
[31] 范,J。;Yu,Y。;王,Z。;Gu,J.,基于图表示消歧校正网络的部分标号学习,IEEE Trans。电路系统。视频技术。(2021)
[32] 张,M.L。;Li,Y.K。;Liu,X.Y.,《走向基于班级差异的多标签学习》,(第二十四届国际人工智能联合会议(2014))
[33] 林,M。;Ke,T。;Xin,Y.,训练神经网络用于多类不平衡分类的动态采样方法,IEEE Trans。神经网络学习。系统。,24, 4, 647-660 (2013)
[34] 西涌。;Kim,J。;Lee,H。;Kim,E.,《通用维多输出支持向量回归及其多核学习》,IEEE Trans。赛博。,45, 11, 2572-2584 (2017)
[35] J.Wang,M.-L.Zhang,《缓解部分标记学习的类不平衡问题》,载于《第24届ACM SIGKDD国际知识发现和数据挖掘会议论文集》,KDD’18,美国纽约州纽约计算机械协会,2018年,第2427-2436页。
[36] 杨,J。;马,J。;Win,K.T。;高杰。;Yang,Z.,基于低秩和稀疏表示的癌症生存能力预测学习,《科学与信息》。,582, 573-592 (2022)
[37] 刘国良,林志林,余勇,等,基于低秩表示的稳健子空间分割。,载于:国际癌症研究中心,第1卷,Citeseer,2010年,第8页。
[38] Z.Lin,R.Liu,Z.Su,低秩表示自适应惩罚的线性化交替方向方法,arXiv预印本arXiv:1109.0367(2011)。
[39] 西涌。;Kim,J。;Lee,H。;Kim,E.,《通用维多输出支持向量回归及其多核学习》,IEEE Trans。赛博。,45, 11, 2572-2584 (2014)
[40] A.Asuncion,D.Newman,Uci机器学习库(2007)。
[41] G.Panis,A.Lanitis,《使用fg-net老化数据库进行面部年龄估计的研究活动概述》,收录于:ECCV Workshops,瑞士苏黎世,2014年。
[42] Panis,G。;Lanitis,A.,《使用fg-net老化数据库进行面部年龄估计的研究活动概述》,欧洲计算机视觉会议(2014年)
[43] 库尔·T。;萨普,B。;约旦,C。;Taskar,B.,从模糊标记的图像中学习,(2009年IEEE计算机视觉和模式识别会议,IEEE(2009)),919-926
[44] 刘,L。;Dieterich,T.,超集标签学习问题的可学习性,(国际机器学习会议(2014),中国兰州),1629-1637
[45] 布里格斯,F。;弗恩,X.Z。;Raich,R.,用于miml实例注释的Rank-loss支持实例机器,(第18届ACM SIGKDD知识发现和数据挖掘国际会议论文集(2012)),534-542
[46] 纪尧明,M。;Verbeek,J。;Schmid,C.,从自动标记的脸袋中进行多实例度量学习,(欧洲计算机视觉会议(2010),Springer),634-647
[47] 王,D.-B。;李,L。;Zhang,M.-L.,用于部分标记学习的自适应图引导消歧,(第25届ACM SIGKDD知识发现与数据挖掘国际会议论文集,安克雷奇,阿拉斯加,美国(2019)),83-91
[48] Demšar,J.,多数据集上分类器的统计比较,J.Mach。学习。研究,7,1-30(2006)·Zbl 1222.68184号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。