×

用于图像分类的基于稀疏表示的Fisher判别字典学习。 (英语) Zbl 1328.68189号

摘要:所使用的字典在稀疏表示或基于稀疏编码的图像重建和分类中起着重要作用,而从训练数据中学习字典已经在图像分类任务中取得了最新的结果。然而,许多字典学习模型仅利用表示系数或表示残差中的判别信息,这限制了它们的性能。本文提出了一种基于Fisher判别准则的字典学习新方法。学习一个原子与主题类标签对应的结构化词典,不仅可以利用表示残差来区分不同的类,而且表示系数具有类内散布小和类间散布大的特点。因此,通过利用表示残差和表示系数中的判别信息,提出了与所提出的Fisher判别字典学习(FDDL)模型相关的分类方案。所提出的FDDL模型在各种图像数据集上进行了广泛的评估,在各种分类任务中表现出优于许多最先进的字典学习方法的性能。

MSC公司:

68吨10 模式识别、语音识别
68T05型 人工智能中的学习和自适应系统
68单位10 图像处理的计算方法
PDF格式BibTeX公司 XML格式引用
全文: DOI程序

参考文献:

[1] Aharon,M.、Elad,M.和Bruckstein,A.(2006年)。K-SVD:一种为稀疏表示设计过完备字典的算法。IEEE信号处理汇刊,54(1),4311-4322·Zbl 1375.94040号 ·doi:10.1109/TSP.2006.881199
[2] Beck,A.和Teboulle,M.(2009年)。线性反问题的快速迭代收缩阈值算法。SIAM成像科学杂志,2(1),183-202·Zbl 1175.94009号 ·doi:10.1137/080716542
[3] Bengio,S.、Pereira,F.、Singer,Y.和Strelow,D.(2009年)。分组稀疏编码。神经信息处理系统进展
[4] Bobin J.、Starck J.、Fadili J.、Mouden Y.和Donoho D.(2007年)。形态成分分析:一种自适应阈值策略。IEEE图像处理汇刊,16(11),2675-2681·Zbl 1288.94009号 ·doi:10.1109/TIP.2007.907073
[5] Boyd,S.和Vandenberghe,L.(2004年)。凸优化。剑桥:剑桥大学出版社·Zbl 1058.90049号 ·doi:10.1017/CBO9780511804441
[6] Bryt,O.和Elad,M.(2008)。使用K-SVD算法压缩面部图像。视觉传达与图像表征杂志,19(4),270-282·doi:10.1016/j.jvcir.2008.03.001
[7] Candes,E.(2006年)。压缩取样。国际数学家大会,31433-1452·Zbl 1130.94013号
[8] Castrodad,A.和Sapiro,G.(2012年)。运动图像中人体动作的稀疏建模。国际计算机视觉杂志,100,1-15·doi:10.1007/s11263-012-0534-7
[9] Cooley,J.W.和Tukey,J.W。(1965年)。复数傅里叶级数的机器计算算法。《计算数学》,19297-301·Zbl 0127.09002号 ·doi:10.1090/S0025-5718-1965-0178586-1
[10] Deng,W.H.、Hu,J.N.和Guo,J.(2012)。扩展SRC:通过类内变化字典进行欠采样人脸识别。IEEE模式分析和机器智能汇刊,34(9),1864-1870·doi:10.1109/TPAMI.2012.30
[11] Duda,R.、Hart,P.和Stork,D.(2000年)。模式分类(第二版)。纽约:Wiley-Interscience·Zbl 0968.68140号
[12] Elad,M.和Aharon,M.(2006年)。通过学习字典上的稀疏和冗余表示进行图像去噪。IEEE图像处理汇刊,15(12),3736-3745·doi:10.1109/TIP.2006.881969
[13] Engan,K.、Aase,S.O.和Husoy,J.H.(1999)。框架设计的最佳方向方法。收录:IEEE声学、语音和信号处理国际会议记录·Zbl 1098.94538号
[14] Fernando,B.、Fromont,E.和Tuytelaars,T.(2012年)。有效使用频繁项集挖掘进行图像分类。摘自:欧洲计算机视觉会议记录·Zbl 1069.62054号
[15] Gehler,P.和Nowozin,S.(2009年)。关于多类对象分类的特征组合。摘自:计算机视觉国际会议论文集
[16] Georghiades,A.、Belhumeur,P.和Kriegman,D.(2001)。从少到多:人脸识别的照明锥模型。IEEE模式分析和机器智能汇刊,23(6),643-660·doi:10.1109/34.927464
[17] Gross,R.、Matthews,I.、Cohn,J.、Kanade,T.和Baker,S.(2010年)。多个PIE。图像和视觉计算,28807-813·doi:10.1016/j.imavis.2009.08.002
[18] Guha,T.和Ward,R.K.(2012年)。学习人类动作识别的稀疏表示。IEEE模式分析和机器学习汇刊,34(8),1576-1888·doi:10.1109/TPAMI.2011.253
[19] 郭毅、李S.、杨J.、舒T.和吴L.(2003)。基于广义Fisher判别准则的广义Foley-Samon变换及其在人脸识别中的应用。模式识别字母,24(1),147-158·Zbl 1055.68092号 ·doi:10.1016/S0167-8655(02)00207-6
[20] Hoyer,P.O.(2002)。非负稀疏编码。收录:IEEE信号处理车间神经网络会议记录
[21] Huang,K.和Aviyente,S.(2006)。信号分类的稀疏表示。In:神经信息和处理系统学报·Zbl 1172.94422号
[22] 赫尔·J·J(1994)。用于手写文本识别研究的数据库。IEEE模式分析和机器智能汇刊,16(5),550-554·数字对象标识代码:10.1109/34.291440
[23] Jenatton,R.、Mairal,J.、Obozinski,G.和Bach,F.(2011)。用于分层稀疏编码的近端方法。机器学习研究杂志,122234-2297·Zbl 1280.94029号
[24] 贾义清、聂福平、张春生(2009)。跟踪比率问题再次出现。IEEE神经网络汇刊,20(4),729-735·doi:10.1109/TNN.2009.2015760
[25] Jiang,Z.L.、Lin,Z.和Davis,L.S.(2013)。abel一致K-SVD:学习识别字典。IEEE模式分析和机器智能汇刊,34533·doi:10.1109/TPAMI.2011.147
[26] Jiang,Z.L.,Zhang,G.X.,&Davis,L.S.(2012)。稀疏编码的子模块字典学习。收录:IEEE会议论文集计算机视觉和模式识别
[27] Kim,S.J.、Koh,K.、Lustig,M.、Boyd,S.和Gorinevsky,D.(2007年)。大规模l_1正则最小二乘的内点方法。IEEE信号处理专题期刊,1606-617·doi:10.1109/JSTSP.2007.910971
[28] Kong,S.和Wang,D.H.(2012年)。分类的词典学习方法:分离特殊性和共性。摘自:欧洲计算机视觉会议记录。
[29] Li,H.、Jiang,T.和Zhang,K.(2006)。基于最大边缘准则的高效鲁棒特征提取。IEEE神经网络汇刊,17(1),157-165·doi:10.1109/TNN.2005.860852
[30] Lian,X.C.,Li,Z.W.,Lu,B.L.和Zhang,L.(2010)。用于多类图像分类的Max-Margin字典学习。摘自:欧洲计算机视觉会议记录
[31] Mairal,J.、Bach,F.和Ponce,J.(2012)。任务驱动的词典学习。IEEE模式分析和机器智能汇刊,34(4),791-804·doi:10.1109/TPAMI.2011.156
[32] Mairal,J.、Bach,F.、Ponce,J.,Sapiro,G.和Zissserman,A.(2008b)。学习用于局部图像分析的判别词典。收录:IEEE计算机视觉和模式识别会议记录
[33] Mairal,J.、Bach,F.、Ponce,J.,Sapiro,G.和Zisserman,A.(2009年)。监督字典学习。In:神经信息和处理系统学报
[34] Mairal,J.、Elad,M.和Sapiro,G.(2008a)。用于彩色图像恢复的稀疏表示。IEEE图像处理汇刊,17(1),53-69·doi:10.1109/TIP.2007.911828
[35] Mairal,J.、Leordeanu,M.、Bach,F.、Hebert,M.和Ponce,J.(2008c)。用于特定类别边缘检测和图像解释的鉴别稀疏图像模型。摘自:欧洲计算机视觉会议记录·Zbl 1055.68092号
[36] Mallat,S.(1999)。信号处理的小波之旅(第二版)。圣地亚哥:学术出版社·Zbl 0998.94510号
[37] Martinez,A.和Benavente,R.(1998年)。AR人脸数据库(第24页)。报告编号:CVC技术。
[38] Nesterov,Y.和Nemirovskii,A.(1994年)。凸规划中的内点多项式算法。费城:SIAM·Zbl 0824.90112号 ·doi:10.1137/1.9781611970791
[39] Nilsback,M.和Zisserman,A.(2006年)。花卉分类的视觉词汇。收录:IEEE会议论文集计算机视觉和模式识别
[40] Okatani,T.和Deguchi,K.(2007)。关于存在缺失分量时矩阵分解的Wiberg算法。国际计算机视觉杂志,72(3),329-337·Zbl 1477.68404号 ·doi:10.1007/s11263-006-9785-5
[41] Oliva,A.和Torralba,A.(2001)。场景形状建模:空间包络线的整体表示。国际计算机视觉杂志,42145-174·Zbl 0990.68601号 ·doi:10.1023/A:101139631724
[42] Olshausen,B.A.和Field,D.J.(1996)。通过学习自然图像的稀疏代码,出现了简单的细胞感受野特性。《自然》,381,607-609·数字对象标识代码:10.1038/381607a0
[43] Olshausen,B.A.和Field,D.J.(1997)。基集过完备的稀疏编码:v1采用的策略?视觉研究,37(23),3311-3325·doi:10.1016/S0042-6989(97)00169-7
[44] Pham,D.和Venkatesh,S.(2008年)。模式识别的联合学习和词典构建。收录:IEEE会议论文集计算机视觉和模式识别
[45] Phillips,P.J.、Flynn,P.J.、Scruggs,W.T.、Bowyer,K.W.、Chang,J.、Hoffman,K.等人(2005年)。人脸识别大挑战概述。收录:IEEE计算机视觉和模式识别会议记录
[46] 邱,Q.,Jiang,Z.L.,&Chellappa,R.(2011)。基于稀疏字典的动作属性表示和识别。摘自:计算机视觉国际会议记录
[47] Ramirez,I.、Sprechmann,P.和Sapiro,G.(2010年)。通过具有结构化不连贯性和共享特征的字典学习进行分类和聚类。收录:IEEE计算机视觉和模式识别会议记录
[48] Rodriguez,F.和Sapiro,G.(2007年)。图像分类的稀疏表示:学习区分性和重建性非参数字典(第2213页)。预印本:IMA。
[49] Rodriguez,M.、Ahmed,J.和Shah,M.(2008)。一种用于动作识别的时空最大平均相关高度滤波器。收录:IEEE计算机视觉和模式识别会议记录
[50] Rosasco,L.、Verri,A.、Santoro,M.、Mosci,S.和Villa,S.(2009年)。结构化稀疏正则化的迭代投影方法。麻省理工学院技术报告,MIT-CSAIL-TR-2009-050,CBCL-282·Zbl 1317.68183号
[51] Rubinstein,R.、Bruckstein,A.M.和Elad,M.(2010年)。稀疏表示建模词典。IEEE会议录,98(6),1045-1057·doi:10.1109/JPROC.2010.2040551
[52] Sadanand,S.和Corso,J.J.(2012年)。动作银行:视频中活跃度的高级表现。收录:IEEE计算机视觉和模式识别会议记录·Zbl 1288.94009号
[53] Shen,L.、Wang,S.H.、Sun,G.、Jiang,S.Q.和Huang,Q.M.(2013)。面向分层视觉分类的多层次判别词典学习。收录:IEEE计算机视觉和模式识别会议记录
[54] Song,F.X.,Zhang,D.,Mei,D.Y.,&Guo,Z.W.(2007)。一种用于面部特征提取的多重最大散射差判别准则。IEEE系统、人与控制论汇刊B部分,37(6),1599-1606·doi:10.1109/TSMCB.2007.906579
[55] Sprechmann,P.和Sapiro,G.(2010年)。无监督聚类的字典学习和稀疏编码
[56] Szabo,Z.、Poczos,B.和Lorincz,A.(2011年)。在线群组结构词典学习。在:IEEE计算机视觉和模式识别会议论文集
[57] Tropp,J.A.和Wright,S.J.(2010年)。线性反问题稀疏解的计算方法。IEEE会议论文集压缩表示应用专题,98(6),948-958。
[58] Turk,M.和Pentland,A.(1991年)。用于识别的特征脸。认知神经科学杂志,3(1),71-86·doi:10.1162/jocn.1991.3.1.71
[59] Viola,P.和Jones,M.J.(2004年)。强大的实时人脸检测。国际计算机视觉杂志,57137-154·doi:10.1023/B:VISI.0000013087.49260.fb
[60] Wagner,A.、Wright,J.、Ganesh,A.、Zhou,Z.H.、Mobahi,H.和Ma,Y.(2012年)。面向实用人脸识别系统:通过稀疏表示实现鲁棒对齐和照明。IEEE模式分析和机器智能汇刊,34(2),373-386·doi:10.1109/TPAMI.2011.112
[61] Wang,H.、Ullah,M.、Klaser,A.、Laptev,I.和Schmid C.(2009年)。用于动作识别的局部时空特征评估。摘自:英国机器视觉会议记录。
[62] Wang,H.、Yan,S.C.、Xu,D.、Tang,X.O.和Huang,T.(2007)。用于降维的跟踪比率与比率跟踪。收录:IEEE会议论文集计算机视觉和模式识别。
[63] Wang,H.R.,Yuan,C.F.,Hu,W.M.,&Sun,C.Y.(2012)。监督动作识别中稀疏建模的类特定字典学习。模式识别,45(11),3902-3911·doi:10.1016/j.patcog.2012.04.024
[64] Wright,J.、Yang,A.Y.、Ganesh,A.、Sastry,S.S.和Ma,Y.(2009b)。基于稀疏表示的鲁棒人脸识别。IEEE跨模式分析与机器智能,31(2),210-227·doi:10.1109/TPAMI.2008.79
[65] Wright,J.S.、Nowak,D.R.和Figueiredo,T.A.M.(2009年A)。可分离近似稀疏重建。IEEE信号处理学报,57(7),2479-2493·Zbl 1391.94442号 ·doi:10.1109/TSP.2009.2016892
[66] Wu,Y.N.,Si,Z.Z.,Gong,H.F.,&Zhu,S.C.(2010)。学习用于目标检测和识别的主动基模型。国际计算机视觉杂志,90198-235·doi:10.1007/s11263-009-0287-0
[67] Xie,N.、Ling,H.、Hu,W.和Zhang,X.(2010)。使用bin-ratio信息进行类别和场景分类。收录:IEEE计算机视觉和模式识别会议记录·Zbl 1375.94040号
[68] Yang,A.Y.、Ganesh,A.、Zhou,Z.H、Sastry,S.S.和Ma,Y.(2010a)。鲁棒人脸识别的快速l1最小化算法综述。arXiv:1007.3753v2·Zbl 1280.94029号
[69] Yang,J.C.、Wright,J.、Ma,Y.和Huang,T.(2008)。图像超分辨率作为原始图像补丁的稀疏表示。收录:IEEE计算机视觉和模式识别会议记录
[70] Yang,J.C.,Yu,K.,Gong,Y.和Huang,T.(2009年)。使用稀疏编码的线性空间金字塔匹配用于图像分类。收录:IEEE计算机视觉和模式识别会议记录·Zbl 0127.09002号
[71] Yang,J.C.、Yu,K.和Huang,T.(2010b)。监督翻译-非变异稀疏编码。收录:IEEE会议论文集计算机视觉和模式识别
[72] Yang,M.和Zhang,L.(2010)。基于Gabor特征的稀疏表示的Gabor遮挡字典人脸识别。摘自:欧洲计算机视觉会议记录
[73] Yang,M.、Zhang,L.、Feng,X.C.和Zhang的D.(2011年b)。稀疏表示的Fisher判别字典学习。摘自:计算机视觉国际会议记录
[74] Yang,M.、Zhang,L.、Yang,J.和Zhang的D.(2010c)。基于稀疏表示的人脸识别元脸学习。收录:IEEE图像处理会议记录
[75] Yang,M.、Zhang,L.、Yang,J.和Zhang的D.(2011年a)。人脸识别的稳健稀疏编码。在:IEEE会议论文集计算机视觉和模式识别·Zbl 1373.94455号
[76] Yang,M.、Zhang,L.和Zhang的D.(2012)。用于实时人脸识别的高效错位鲁棒表示。摘自:欧洲计算机视觉会议记录
[77] Yao,A.、Gall,J.和Gool,L.V.(2010年)。基于hough变换的动作识别投票框架。收录:IEEE计算机视觉和模式识别会议记录
[78] Ye,G.N.,Liu,D.,Jhuo,I.-H.,&Chang,S.-F.(2012)。具有秩最小化的鲁棒后期融合。收录:IEEE计算机视觉和模式识别会议论文集
[79] Yu,K.,Xu,W.,&Gong,Y.(2009)。基于核正则化的深度学习用于视觉识别。摘自:《神经信息处理系统进展》,第21页。
[80] Yuan,X.T.和Yan,S.C.(2010年)。多任务联合稀疏表示的视觉分类。收录:IEEE计算机视觉和模式识别会议记录·Zbl 1381.62217号
[81] Zhang,L.,Yang,M.,&Feng,X.C.(2011)。稀疏表示或协作表示:这有助于人脸识别?。摘自:计算机视觉国际会议记录
[82] Zhang,Q.和Li,B.X.(2010)。人脸识别中字典学习的判别K-SVD。收录:IEEE计算机视觉和模式识别会议记录
[83] Zhang,Z.D.,Ganesh,A.,Liang,X.,&Ma,Y.(2012)。TILT:变换不变的低阶纹理。国际计算机视觉杂志,99,1-24·Zbl 1254.68290号
[84] 周明扬、陈海杰、佩斯利J.、任丽萍、李丽白、邢振明等(2012)。非参数贝叶斯字典学习用于分析含噪和不完整图像。IEEE图像处理汇刊,21(1),130-144·Zbl 1373.62334号 ·doi:10.1109/TIP.2011.2160072
[85] Zhou,N.和Fan,J.P.(2012)。学习用于对象识别的相关视觉词典。收录:IEEE计算机视觉和模式识别会议记录
[86] Zou,H.和Hastie,T.(2005)。通过弹性网进行规则化和变量选择。英国皇家统计学会期刊B,67(第2部分),301-320·Zbl 1069.62054号 ·文件编号:10.1111/j.1467-9868.2005.005.x
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。