文件Zbl 1452.68167-zbMATH Open

基于噪声学习的图像分类判别字典学习算法。（英语） Zbl 1452.68167号

J.富兰克林研究所。 357，第4期，2492-2513（2020）.

摘要：在图像分类的监督学习中，字典学习是一种保持标签特性的有效方法。然而，在训练阶段，图像样本中的不同噪声可能会导致残差不稳定，这尤其体现在字典获取不准确和标签信息利用率低。为了充分利用有监督信息来学习判别字典，我们提出了一种有效的字典学习算法来设计结构化字典，其中每个原子都与相应的标签相关。该算法采用基于噪声学习的交替方向乘法器（ADMM）实现，其中噪声由干扰信号和重构残差组成。在训练阶段，我们首先采用交叉标签抑制方法来扩大不同标签表示之间的差异。同时，还利用谱聚类中拉普拉斯矩阵的数学算子N-cut来缩短相同标签表示之间的差异。在测试阶段，为了充分利用学习到的字典，在去噪步骤中分别采用了全局编码和局部编码两种有效的分类器。在不同的数据集上进行了实验，包括人脸识别、场景分类、对象分类和动态纹理分类。仿真结果从分类性能和计算效率两方面验证了我们提出的方法。

MSC公司：

68T05型	人工智能中的学习和自适应系统
94A08型	信息与通信理论中的图像处理（压缩、重建等）

软件：

ImageNet公司;AlexNet公司;SIFT公司

PDF格式 BibTeX公司 XML格式引用

全文：内政部

参考文献：

[1]	亚哈龙，M。；Elad，M。；Bruckstein，A.，K-SVD：一种为稀疏表示设计过完备字典的算法，IEEE Trans。信号处理。，54, 4311-4322 (2006) ·Zbl 1375.94040号
[2]	鲁宾斯坦，R。；齐布列夫斯基，M。；Elad，M.，《双重稀疏性：学习稀疏信号近似的稀疏字典》，IEEE Trans。信号处理。，58, 1553-1564 (2010) ·Zbl 1392.94427号
[3]	Sprechmann，P。；Sapiro，G.，《无监督聚类的字典学习和稀疏编码》（ICASSP，IEEE Int.Conf.Acust.Speech Signal Process.-Proc.（2010）），2042-2045
[4]	Wright，J。；Yang，A.Y。；Ganesh，A。；Sastry，S.S。；Ma，Y.，基于稀疏表示的鲁棒人脸识别，IEEE Trans。模式分析。机器。智力。，31, 210-227 (2009)
[5]	Mairal，J。；巴赫，F.R。；彭斯，J。；萨皮罗，G。；Zisserman，A.，《用于局部图像分析的判别学习词典》，（Proc.IEEE Conf.Comput.Vis.Pattern Recognit.Proc.IEEE Conv.Comput.Vis.Pattern Recoignit.，Anchorage，AK，USA（2008）），1-8
[6]	李毅。；戴，F。；Cheng，X。；徐，L。；Gui，G.，带非凸正则化的压缩传感图像重建的多重预指定字典稀疏表示，J.Franklin Inst.，3562353-2371（2019）·Zbl 1455.94031号
[7]	李毅。；Lin，Y。；Cheng，X。；肖，Z。；Gui，G.，在（S\alpha S）噪声存在下稳健稀疏恢复的非凸惩罚正则化，IEEE Access，625474-25485（2018）
[8]	Olshausen，B.A。；Field，D.J.，《基集过完备的稀疏编码：V1？采用的策略》？，Vision Res.，37，3311-3325（1997）
[9]	王，D。；Kong，S.，《面向分类的词典学习模型：明确学习跨类别的特殊性和共性》，《模式识别》。，47, 885-898 (2014) ·Zbl 1326.68235号
[10]	Harandi先生。；哈特利，R。；沈，C。；Lovell，B。；Sanderson，C.，《格拉斯曼流形上编码和字典学习的外部方法》，国际计算机杂志。视觉。，114, 113-136 (2015) ·Zbl 1398.94034号
[11]	江，Z。；林，Z。；Davis，L.S.，标签一致性K-SVD：学习识别的区分字典，IEEE Trans。模式分析。机器。智力。，35, 2651-2664 (2013)
[12]	Pham，D.S。；Venkatesh，S.，模式识别的联合学习和词典构建，（第26届IEEE Conf.Compute.Vis.pattern recognition，CVPR（2008））
[13]	Engan，K。；阿瑟，S.O。；Husoy，J.H.，使用最佳方向方法（MOD）的基于帧的信号压缩，（IEEE国际Symp.Circuits Syst.（1999）），1-4
[14]	Lee，H。；Battle，A。；雷娜，R。；Ng，A.Y.，《高效稀疏编码算法》，Proc。Conf.Neural Inf.过程。系统。，19, 801-808 (2006)
[15]	孔，S。；Punyasena，S。；Fowlkes，C.，《化石花粉识别的空间感知词典学习和编码》，（IEEE Compute.Soc.Conf.Compute.Vis.Pattern Recognit.Work.（2016）），1305-1314
[16]	Wen，J。；Zhou，Z。；李，D。；Tang，X.，广义正交匹配追踪的一个新的充分条件，IEEE Commun。莱特。，21, 805-808 (2017)
[17]	托拉尔巴，A。；墨菲，K.P。；Freeman，W.T.，共享多类和多视图对象检测的视觉特征，IEEE Trans。模式分析。机器。智力。，29, 854-869 (2007)
[18]	张，Q。；Li，B.，人脸识别中字典学习的判别K-SVD，（Proc.IEEE Compute.Soc.Conf.Compute.Vis.Pattern Recognit.Proc.IEEE.Compute.Soc.Conf.Comput.Vis.Pattern Resognit.，San Francisco，CA，USA（2010）），2691-2698
[19]	Lian，X.C。；李，Z。；Lu，B.L。；Zhang，L.，用于多类图像分类的Max-margin字典学习，（Proc.Eur.Conf.Compute.Vis.（2010）），157-170
[20]	Mairal，J。；巴赫，F。；彭斯，J。；萨皮罗，G。；Zisserman，A.，《监督词典学习》（Adv.Neural Inf.Process.Syst.Process.Syst.（2009）），1033-1040
[21]	拉米雷斯，I。；Sprechmann，P。；Sapiro，G.，《通过字典学习利用结构化非相干和共享特征进行分类和聚类》，（Proc.IEEE Compute.Soc.Conf.Compute.Vis.Pattern Recognit..Proc.IEEE.Compute.Soc.Conf.Compute.Vis.Patter Recognit.，San Francisco，CA，USA（2010），3501-3508
[22]	王，X。；Gu，Y.，《交叉标签抑制：具有群正则化的区分性快速词典学习》，IEEE Trans。图像处理。，26, 3859-3873 (2017) ·Zbl 1409.94632号
[23]	特克，M。；Pentland，A.，识别特征脸，J.Cogn。神经科学。，3, 209-232 (1991)
[24]	Lowe，D.G.，《不同尺度关键点的独特图像特征》，《国际计算机杂志》。视觉。，91-110 (2004)
[25]	周，N。；沈毅。；彭杰。；Fan，J.，《学习对象识别的互相关视觉词典》（Proc.IEEE Compute.Soc.Conf.Compute.Vis.Pattern Recognit.（2012）），3490-3497
[26]	高，S。；Tsang，I.W.H.（曾荫权，I.W.H.）。；Ma，Y.，《针对细粒度图像分类的学习类别特定词典和共享词典》，IEEE Trans。图像处理，23，623-634（2014）·Zbl 1374.94114号
[27]	U.Von Luxburg，《光谱聚类教程》，2006年。https://www.cs.cmu.edu/～aarti/Class/10701/readings/Luxburg06_TR.pdf。
[28]	文，费；裴，L。；Yang，Y。；于伟（Yu，W.）。；Liu，P.，使用广义非凸正则化对稀疏信号和图像进行高效且稳健的恢复，IEEE Trans。计算。成像。，3, 566-579 (2017)
[29]	Chen，H.F.，支持向量网络，（马赫学习出版社，1995年），273-297·Zbl 0831.68098号
[30]	费飞，L。；弗格斯，R。；Perona，P.，从少数训练示例中学习生成性视觉模型：在101个对象类别上测试的增量贝叶斯方法，（Conf.Compute.Vis.Pattern Recognit.Work.（CVPR 2004）（2004）），178
[31]	加尼姆，B。；Ahuja，N.，《动态纹理识别的最大边缘距离学习》，（Lect.Notes Comput.Sci.（包括Subser.Lect.Nodes Artif.Intell.Lect.Notes生物信息学）。6312 LNCS（2010）），223-236
[32]	郭莹，Z。；Matti，P.，《使用局部二进制模式进行动态纹理识别，并将其应用于面部表情》，IEEE Trans。模式分析。机器。智力。，29, 915-928 (2007)
[33]	拉泽布尼克，S。；施密德，C。；Ponce，J.，Beyond bags of features:识别自然场景类别的空间金字塔匹配（CVPR（2007）），2169-2178
[34]	Krizhevsky，A。；Sutskever，I。；Hinton，G.E.，用深度卷积神经网络进行ImageNet分类，Commun。ACM，60，84-90（2017）

此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配，可能包含数据转换错误。在某些情况下，zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献，而不要求完整或完全匹配。

任何	在任何地方
一个	内部文档标识符
澳大利亚	作者、编辑
人工智能	内部作者标识符
钛	标题
洛杉矶	语言
所以	来源
ab公司	回顾，摘要
第页	出版年份
车辆	评审员
复写的副本	MSC代码
美国犹他州	关键字
日期	文档类型(j个：期刊文章；b条：book；一：图书文章）

一&b条	逻辑和
一\|b条	逻辑或
!ab公司	逻辑不
美国广播公司*	右通配符
"ab c公司"	短语
(ab c公司)	圆括号

示例

领域

操作员

基于噪声学习的图像分类判别字典学习算法。（英语） Zbl 1452.68167号

MSC公司：

软件：

参考文献：

示例

领域

操作员

基于噪声学习的图像分类判别字典学习算法。 （英语） Zbl 1452.68167号

MSC公司：

软件：

参考文献：

基于噪声学习的图像分类判别字典学习算法。（英语） Zbl 1452.68167号