×

低库和稀疏字典学习。 (英语) Zbl 1323.68435号

Fu,Yun(编辑),视觉分析的低秩和稀疏建模。查姆:施普林格(ISBN 978-3-319-1199-1/hbk;978-3-316-12000-3/电子书)。61-85 (2014).
摘要:学习信息字典是稀疏表示和低阶建模的关键挑战。词典的质量通常会显著影响学习模型的性能。在本章中,我们提出了一种新的低秩字典学习方法,该方法学习具有低秩约束的判别字典。我们分别为每个类学习一个子字典,并考虑字典的整体表示能力。特别是,我们的模型中加入了Fisher准则,以提高字典的可区分性,从而最大化类间散布与类内散布的比率。实际上,训练样本可能包含噪音信息,这会破坏字典的质量。受低秩矩阵恢复最新进展的启发,我们对每个类的子字典实施低秩约束,以解决此问题。我们的模型被表示为一个正则化秩最小化问题,可以用迭代投影法(IPM)和不精确增广拉格朗日乘子(ALM)算法求解。在四个公开人脸和数字图像数据集上,与现有的有代表性的字典学习和图像分类方法进行比较,评估了所提出的低阶正则化(D^2L^2R^2)判别字典学习方法。实验结果表明,我们的方法在各种设置下都优于相关方法。
关于整个系列,请参见[Zbl 1305.68023号].

MSC公司:

68T05型 人工智能中的学习和自适应系统
68T45型 机器视觉和场景理解
68单位10 图像处理的计算方法
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] M.Aharon,M.Elad,A.Bruckstein,K-svd:为稀疏表示设计过完备字典的算法。IEEE传输。信号处理。54(11), 4311-4322 (2006) ·兹比尔1375.94040 ·doi:10.1109/TSP.2006.881199
[2] T.Bai,Y.Li,使用灵活结构稀疏表示的鲁棒视觉跟踪。IEEE传输。Ind.Inf.10(1),538-547(2014)·doi:10.1109/TII.2013.2272089
[3] S.R.Becker,E.J.CandèS,M.C.Grant,凸锥问题模板及其在稀疏信号恢复中的应用。数学。程序。计算。3(3), 165-218 (2011) ·Zbl 1257.90042号 ·doi:10.1007/s12532-011-0029-5
[4] P.N.Belhumeur,J.P.Hespanha,D.J.Kriegman,特征脸与渔夫脸:使用特定类别线性投影进行识别。IEEE TPAMI 19(7),711-720(1997)·Zbl 05111919号 ·doi:10.1109/34.598228
[5] Y.Bengio,A.C.Courville,P.Vincent,《表征学习:回顾与新视角》。IEEE传输。模式分析。机器。智力。35(8), 1798-1828 (2013) ·doi:10.1109/TPAMI.2013.50
[6] D.P.Bertsekas,(约束优化和拉格朗日乘子方法)(学术出版社,纽约,1982)·Zbl 0572.90067号
[7] E.Candès,B.Recht,通过凸优化实现精确矩阵补全。已找到。计算。数学。9(6), 717-772 (2009) ·Zbl 1219.90124号 ·doi:10.1007/s10208-009-9045-5
[8] E.J.Candès,X.D.Li,Y.Ma,J.Wright,稳健主成分分析?J.ACM 58(3),11(2011)·Zbl 1327.62369号 ·数字对象标识代码:10.1145/1970392.1970395
[9] E.J.Candès,B.Recht,通过凸优化实现精确矩阵补全。已找到。计算。数学。9(6), 717-772 (2009) ·Zbl 1219.90124号 ·doi:10.1007/s10208-009-9045-5
[10] C.F.Chen,C.P.Wei,Y.F.Wang,稳健人脸识别的结构非相干低秩矩阵恢复,收录于(CVPR 2012),第2618-2625页(2012)
[11] S.Chen,S.A.Billings,W.Luo,正交最小二乘法及其在非线性系统辨识中的应用。《国际期刊控制》50(5),1873-1896(1989)·Zbl 0686.93093号 ·网址:10.1080/00207178908953472
[12] G.Davis,S.Mallat,M.Avellaneda,自适应贪婪近似。施工。近似值13(1),57-98(1997)·Zbl 0885.41006号 ·doi:10.1007/BF02678430
[13] D.L.Donoho,A.Maleki,A.Montanari,压缩感知的消息传递算法。程序。美国国家科学院。科学。106(45), 18914-18919 (2009) ·doi:10.1073/pnas.0909892106
[14] D.L.Donoho,Y.Tsaig,解可能稀疏时的快速解。IEEE传输。《信息论》54(11),4789(2008)·Zbl 1247.94009号 ·doi:10.1109/TIT.2008.929958
[15] R.O.Duda,P.E.Hart,D.G.Stork,(模式分类),第2版。(威利,纽约,2001年)·Zbl 0968.68140号
[16] B.Efron,T.Hastie,I.Johnstone,R.Tibshirani,最小角回归。Ann.Stat.32(2),407-499(2004)·Zbl 1091.62054号 ·doi:10.1214/009053604000000067
[17] M.Elad,B.Matalon,M.Zibulevsky,带非二次正则化的线性最小二乘的坐标和子空间优化方法。申请。计算。谐波分析。23(3), 346-367 (2007) ·Zbl 1133.65022号 ·doi:10.1016/j.acha.2007.02.002
[18] K.Frisch,凸规划的对数势方法。备忘录1955年5月13日(1955年)
[19] S.Gao,I.W.-H.Tsang,Y.Ma,《学习特定类别词典和用于细粒度图像分类的共享词典》。IEEE传输。图像处理。23(2), 623-634 (2014) ·Zbl 1374.94114号 ·doi:10.1109/TIP.2013.2290593
[20] H.Guo,Z.Jiang,L.Davis,《基于成对约束的判别词典学习》,载《ACCV 2012》,第7724卷(施普林格出版社,柏林,2013),第328-342页
[21] G.Irie,D.Liu,Z.Li,S.F.Chang,《多模态视觉词典学习的贝叶斯方法》,收录于(CVPR),第329-336页(2013)
[22] I.H.Jhuo,D.Liu,D.T.Lee,S.F.Chang,《低阶重建的鲁棒视觉领域适应》,载于《CVPR 2012》(2012)
[23] 江泽民、林志林、戴维斯,《通过标签一致的k-svd学习稀疏编码的判别词典》,载《CVPR 2011》,第1697-1704页(2011)
[24] N.Karmarkar,线性规划的一种新的多项式时间算法,载《1984年第16届ACM计算理论研讨会论文集》,(ACM,1984),第302-311页·Zbl 0557.90065号
[25] R.Keshavan、A.Montanari、S.Oh,《从嘈杂的条目中完成矩阵》。J.马赫。学习。2057-2078年第11号决议(2010年)·Zbl 1242.62069号
[26] K.Kreutz-Delgado,J.F.Murray,B.D.Rao,K.Engan,T.-W.Lee,T.J.Sejnowski,稀疏表示的字典学习算法。神经计算。15(2), 349-396 (2003) ·Zbl 1047.68101号 ·doi:10.1162/089976603762552951
[27] Y.LeCun,L.Bottou,Y.Bengio,P.Haaffner,基于梯度的学习应用于文档识别。程序。IEEE 86(11),2278-2324(1998)·数字对象标识代码:10.1109/5.726791
[28] H.Lee,A.Battle,R.Raina,A.Y.Ng,《高效稀疏编码算法》(NIPS 2007),B.Schölkopf,J.Platt,T.Hoffman编辑(麻省理工学院出版社,剑桥,2007),第801-808页
[29] K.-C.Lee,J.Ho,D.Kriegman,获取可变光照下人脸识别的线性子空间。IEEE TPAMI 27(5),684-698(2005)·Zbl 05111315号 ·doi:10.1109/TPAMI.2005.92
[30] M.S.Lewicki,B.A.Olshausen,图像代码自适应和比较的概率框架。JOSA A 16(7),1587-1601(1999)·doi:10.1364/JOSAA.16.001587
[31] L.Li、S.Li和Y.Fu,人脸识别低阶正则化判别词典学习,in(FG 2013)(2013)
[32] 李良良,李良良,傅良良,学习图像分类的低秩判别词典。图像可视性。计算。(2014)
[33] Z.Lin,M.Chen,Y.Ma,精确恢复受损低秩矩阵的增广拉格朗日乘子方法。arXiv预印本
[34] G.C.Liu,Z.C.Lin,Y.Yu,基于低秩表示的稳健子空间分割,in(ICML 2010),pp.663-670(2010)
[35] G.C.Liu,S.C.Yan,子空间分割和特征提取的潜在低阶表示,in(ICCV 2011)(2011)
[36] R.S.Liu、Z.C.Lin、F.D.Torre、Z.X.Su,《无监督视觉学习的固定库代表》,载《CVPR 2012》(2012)
[37] L.Ma,C.Wang,B.Xiao,W.Zhou,基于区分性低阶词典学习的人脸识别稀疏表示,载于《CVPR 2012》,第2586-2593页(2012)
[38] D.M.Malioutov,M.Cetin,A.S.Willsky,稀疏信号表示的同伦延拓,in(ICASSP 2005),IEEE,第5卷,第728-733页(2005)
[39] S.G.Mallat,Z.Zhang,将追求与时频词典相匹配。IEEE传输。信号处理。41(12), 3397-3415 (1993) ·Zbl 0842.94004号 ·数字对象标识代码:10.1109/78.258082
[40] X.Mo,V.Monga,R.Bala,Z.Fan,视频异常检测的自适应稀疏表示。IEEE传输。电路系统。视频技术24(4),631-645(2014)·doi:10.1109/TCSVT.2013.2280061
[41] I.Naseem,R.Togneri,M.Bennamoun,人脸识别的线性回归。IEEE TPAMI 32(11),2106-2112(2010)·doi:10.1109/TPAMI.2010.128
[42] Y.Nesterov,一种求解收敛速度为o(1/k2)的凸规划问题的方法。苏联。数学。多克。27, 372-376 (1983) ·Zbl 0535.90071号
[43] M.R.Osborne,B.Presnell,B.A.Turlach,最小二乘问题中变量选择的新方法。IMA J.数字。分析。20(3), 389-403 (2000) ·Zbl 0962.65036号 ·doi:10.1093/imanum/20.3.89
[44] T.Poggio、T.Serre等人,学习视觉皮层中形状成分的字典:与神经元、人类和机器的比较。麻省理工学院博士论文(2006)
[45] L.Rosasco,S.Mosci,S.Santoro,A.Verri,S.Villa,结构化稀疏正则化的迭代投影方法。技术报告,MIT-CSAIL-TR-2009-050技术报告,麻省理工学院(2009)·Zbl 1317.68183号
[46] F.Samaria,A.Harter,人脸识别随机模型的参数化,in(WACV 1994),pp.138-142(1994)
[47] M.Shao,C.Castillo,Z.Gu,Y.Fu,低库转移子空间学习,in(ICDM 2012)(2012)
[48] T.Sim、S.Baker、M.Bsat,《cmu姿势、照明和表情(饼图)数据库》,收录于(FG 2002)(2002)
[49] A.Wagner,J.Wright,A.Ganesh,Z.Zhou,H.Mobahi,Y.Ma,面向实用人脸识别系统:通过稀疏表示实现鲁棒对齐和照明。IEEE TPAMI 34(2),372-386(2012)·doi:10.1109/TPAMI.2011.112
[50] J.Wang,J.Yang,K.Yu,F.Lv,T.Huang,Y.Gong,图像分类的局部约束线性编码,见\(CVPR 2010\)(2010)
[51] N.Wang、J.Wang和D.-Y.Yeung,视觉跟踪的在线健壮非负词典学习,in(ICCV),pp.657-664(2013)
[52] J.Wright,A.Yang,A.Ganesh,S.Sastry,Y.Ma,通过稀疏表示实现鲁棒人脸识别。IEEE TPAMI 31(2),210-227(2009)·doi:10.1109/TPAMI.2008.79
[53] Y.Xie,C.Huang,T.Song,J.Ma,J.Jing,通过低秩和稀疏表示字典学习进行对象联合检测,收录于《VCIP》,第1-6页(2013)
[54] A.Y.Yang、S.Iyengar、S.Sastry、R.Bajcsy、P.Kuryloski、R.Jafari,《使用可穿戴运动传感器网络对人类行为进行分布式分割和分类》,收录于(CVPRW 2008),第1-8页(2008)
[55] A.Y.Yang,Z.Zhou,A.Ganesh,S.S.Sastry,Y.Ma,鲁棒人脸识别的快速l1-最小化算法。arXiv预印本
[56] J.Yang,J.Wright,T.S.Huang,Y.Ma,图像超分辨率作为原始图像块的稀疏表示,在\(CVPR\)(2008)
[57] J.Yang,K.Yu,Y.Gong,T.S.Huang,使用稀疏编码的线性空间金字塔匹配用于图像分类,收录于(CVPR),第1794-1801页(2009)
[58] M.Yang、L.Zhang、X.C.Feng、D.Zhang,《稀疏表示的Fisher判别词典学习》,载于《ICCV 2011》,第543-550页(2011)
[59] H.Zhang、J.Yang、Y.Zhang,N.M.Nasrabadi、T.S.Huang,闭环:稀疏表示优先的联合盲图像恢复和识别,in(ICCV 2011),第770-777页(2011)
[60] Q.Zhang,B.Li,人脸识别中字典学习的判别k-svd,in(CVPR 2010),pp.2691-2698(2010)·Zbl 1222.91021号
[61] Y.Zhang,Z.Jiang,L.S.Davis,《学习图像分类的结构化低阶表示法》,载于(CVPR),第676-683页(2013)
[62] Z.D.Zhang,A.Ganesh,X.Liang,Y.Ma,Tilt:变换不变的低阶纹理。国际期刊计算。视觉。99(1),1-24(2012)·Zbl 1254.68290号 ·文件编号:10.1007/s11263-012-0515-x
[63] G.Y.Zhu,S.C.Yan,Y.Ma,面向低阶、内容标记优先和错误稀疏的图像标记细化,in(ACM Multimedia 2010),第461-470页(2010)
[64] L.S.Zhuang,H.Y.Gao,Z.C.Lin,Y.Ma,X.Zhang,N.H.Yu,半监督学习中的非负低秩稀疏图,in(CVPR 2012),pp.2328-2335(2012)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。