×

基于噪声学习的图像分类判别字典学习算法。 (英语) Zbl 1452.68167号

摘要:在图像分类的监督学习中,字典学习是一种保持标签特性的有效方法。然而,在训练阶段,图像样本中的不同噪声可能会导致残差不稳定,这尤其体现在字典获取不准确和标签信息利用率低。为了充分利用有监督信息来学习判别字典,我们提出了一种有效的字典学习算法来设计结构化字典,其中每个原子都与相应的标签相关。该算法采用基于噪声学习的交替方向乘法器(ADMM)实现,其中噪声由干扰信号和重构残差组成。在训练阶段,我们首先采用交叉标签抑制方法来扩大不同标签表示之间的差异。同时,还利用谱聚类中拉普拉斯矩阵的数学算子N-cut来缩短相同标签表示之间的差异。在测试阶段,为了充分利用学习到的字典,在去噪步骤中分别采用了全局编码和局部编码两种有效的分类器。在不同的数据集上进行了实验,包括人脸识别、场景分类、对象分类和动态纹理分类。仿真结果从分类性能和计算效率两方面验证了我们提出的方法。

MSC公司:

68T05型 人工智能中的学习和自适应系统
94A08型 信息与通信理论中的图像处理(压缩、重建等)
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 亚哈龙,M。;Elad,M。;Bruckstein,A.,K-SVD:一种为稀疏表示设计过完备字典的算法,IEEE Trans。信号处理。,54, 4311-4322 (2006) ·Zbl 1375.94040号
[2] 鲁宾斯坦,R。;齐布列夫斯基,M。;Elad,M.,《双重稀疏性:学习稀疏信号近似的稀疏字典》,IEEE Trans。信号处理。,58, 1553-1564 (2010) ·Zbl 1392.94427号
[3] Sprechmann,P。;Sapiro,G.,《无监督聚类的字典学习和稀疏编码》(ICASSP,IEEE Int.Conf.Acust.Speech Signal Process.-Proc.(2010)),2042-2045
[4] Wright,J。;Yang,A.Y。;Ganesh,A。;Sastry,S.S。;Ma,Y.,基于稀疏表示的鲁棒人脸识别,IEEE Trans。模式分析。机器。智力。,31, 210-227 (2009)
[5] Mairal,J。;巴赫,F.R。;彭斯,J。;萨皮罗,G。;Zisserman,A.,《用于局部图像分析的判别学习词典》,(Proc.IEEE Conf.Comput.Vis.Pattern Recognit.Proc.IEEE Conv.Comput.Vis.Pattern Recoignit.,Anchorage,AK,USA(2008)),1-8
[6] 李毅。;戴,F。;Cheng,X。;徐,L。;Gui,G.,带非凸正则化的压缩传感图像重建的多重预指定字典稀疏表示,J.Franklin Inst.,3562353-2371(2019)·Zbl 1455.94031号
[7] 李毅。;Lin,Y。;Cheng,X。;肖,Z。;Gui,G.,在(S\alpha S)噪声存在下稳健稀疏恢复的非凸惩罚正则化,IEEE Access,625474-25485(2018)
[8] Olshausen,B.A。;Field,D.J.,《基集过完备的稀疏编码:V1?采用的策略》?,Vision Res.,37,3311-3325(1997)
[9] 王,D。;Kong,S.,《面向分类的词典学习模型:明确学习跨类别的特殊性和共性》,《模式识别》。,47, 885-898 (2014) ·Zbl 1326.68235号
[10] Harandi先生。;哈特利,R。;沈,C。;Lovell,B。;Sanderson,C.,《格拉斯曼流形上编码和字典学习的外部方法》,国际计算机杂志。视觉。,114, 113-136 (2015) ·Zbl 1398.94034号
[11] 江,Z。;林,Z。;Davis,L.S.,标签一致性K-SVD:学习识别的区分字典,IEEE Trans。模式分析。机器。智力。,35, 2651-2664 (2013)
[12] Pham,D.S。;Venkatesh,S.,模式识别的联合学习和词典构建,(第26届IEEE Conf.Compute.Vis.pattern recognition,CVPR(2008))
[13] Engan,K。;阿瑟,S.O。;Husoy,J.H.,使用最佳方向方法(MOD)的基于帧的信号压缩,(IEEE国际Symp.Circuits Syst.(1999)),1-4
[14] Lee,H。;Battle,A。;雷娜,R。;Ng,A.Y.,《高效稀疏编码算法》,Proc。Conf.Neural Inf.过程。系统。,19, 801-808 (2006)
[15] 孔,S。;Punyasena,S。;Fowlkes,C.,《化石花粉识别的空间感知词典学习和编码》,(IEEE Compute.Soc.Conf.Compute.Vis.Pattern Recognit.Work.(2016)),1305-1314
[16] Wen,J。;Zhou,Z。;李,D。;Tang,X.,广义正交匹配追踪的一个新的充分条件,IEEE Commun。莱特。,21, 805-808 (2017)
[17] 托拉尔巴,A。;墨菲,K.P。;Freeman,W.T.,共享多类和多视图对象检测的视觉特征,IEEE Trans。模式分析。机器。智力。,29, 854-869 (2007)
[18] 张,Q。;Li,B.,人脸识别中字典学习的判别K-SVD,(Proc.IEEE Compute.Soc.Conf.Compute.Vis.Pattern Recognit.Proc.IEEE.Compute.Soc.Conf.Comput.Vis.Pattern Resognit.,San Francisco,CA,USA(2010)),2691-2698
[19] Lian,X.C。;李,Z。;Lu,B.L。;Zhang,L.,用于多类图像分类的Max-margin字典学习,(Proc.Eur.Conf.Compute.Vis.(2010)),157-170
[20] Mairal,J。;巴赫,F。;彭斯,J。;萨皮罗,G。;Zisserman,A.,《监督词典学习》(Adv.Neural Inf.Process.Syst.Process.Syst.(2009)),1033-1040
[21] 拉米雷斯,I。;Sprechmann,P。;Sapiro,G.,《通过字典学习利用结构化非相干和共享特征进行分类和聚类》,(Proc.IEEE Compute.Soc.Conf.Compute.Vis.Pattern Recognit..Proc.IEEE.Compute.Soc.Conf.Compute.Vis.Patter Recognit.,San Francisco,CA,USA(2010),3501-3508
[22] 王,X。;Gu,Y.,《交叉标签抑制:具有群正则化的区分性快速词典学习》,IEEE Trans。图像处理。,26, 3859-3873 (2017) ·Zbl 1409.94632号
[23] 特克,M。;Pentland,A.,识别特征脸,J.Cogn。神经科学。,3, 209-232 (1991)
[24] Lowe,D.G.,《不同尺度关键点的独特图像特征》,《国际计算机杂志》。视觉。,91-110 (2004)
[25] 周,N。;沈毅。;彭杰。;Fan,J.,《学习对象识别的互相关视觉词典》(Proc.IEEE Compute.Soc.Conf.Compute.Vis.Pattern Recognit.(2012)),3490-3497
[26] 高,S。;Tsang,I.W.H.(曾荫权,I.W.H.)。;Ma,Y.,《针对细粒度图像分类的学习类别特定词典和共享词典》,IEEE Trans。图像处理,23,623-634(2014)·Zbl 1374.94114号
[27] U.Von Luxburg,《光谱聚类教程》,2006年。https://www.cs.cmu.edu/~aarti/Class/10701/readings/Luxburg06_TR.pdf。
[28] 文,费;裴,L。;Yang,Y。;于伟(Yu,W.)。;Liu,P.,使用广义非凸正则化对稀疏信号和图像进行高效且稳健的恢复,IEEE Trans。计算。成像。,3, 566-579 (2017)
[29] Chen,H.F.,支持向量网络,(马赫学习出版社,1995年),273-297·Zbl 0831.68098号
[30] 费飞,L。;弗格斯,R。;Perona,P.,从少数训练示例中学习生成性视觉模型:在101个对象类别上测试的增量贝叶斯方法,(Conf.Compute.Vis.Pattern Recognit.Work.(CVPR 2004)(2004)),178
[31] 加尼姆,B。;Ahuja,N.,《动态纹理识别的最大边缘距离学习》,(Lect.Notes Comput.Sci.(包括Subser.Lect.Nodes Artif.Intell.Lect.Notes生物信息学)。6312 LNCS(2010)),223-236
[32] 郭莹,Z。;Matti,P.,《使用局部二进制模式进行动态纹理识别,并将其应用于面部表情》,IEEE Trans。模式分析。机器。智力。,29, 915-928 (2007)
[33] 拉泽布尼克,S。;施密德,C。;Ponce,J.,Beyond bags of features:识别自然场景类别的空间金字塔匹配(CVPR(2007)),2169-2178
[34] Krizhevsky,A。;Sutskever,I。;Hinton,G.E.,用深度卷积神经网络进行ImageNet分类,Commun。ACM,60,84-90(2017)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。