×

格拉斯曼流形上编码和字典学习的外部方法。 (英语) Zbl 1398.94034号

摘要:基于稀疏的表示最近在各种视觉识别任务中取得了显著的成果。在另一个研究方向中,黎曼流形被证明对处理不在欧几里德空间中的特征和模型很有用。为了在这两个领域之间架起桥梁,我们解决了格拉斯曼流形(即线性子空间的空间)中的稀疏编码和字典学习问题。为此,我们建议通过等距映射将格拉斯曼流形嵌入对称矩阵空间。这反过来又使我们能够将两种稀疏编码方案扩展到格拉斯曼流形。此外,我们提出了一种逐个原子学习格拉斯曼字典的算法。最后,为了处理数据中的非线性,我们通过嵌入高维希尔伯特空间来扩展所提出的格拉斯曼稀疏编码和字典学习算法。在多个分类任务(性别识别、手势分类、场景分析、人脸识别、动作识别和动态纹理分类)上的实验表明,所提出的方法在识别准确率、,与核化仿射壳方法和图嵌入Grassmann判别分析等最新方法进行比较。

MSC公司:

94A08型 信息与通信理论中的图像处理(压缩、重建等)
68T05型 人工智能中的学习和自适应系统
68单位05 计算机图形学;计算几何(数字和算法方面)
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] 绝对值,P-A;Mahony,R;Sepulchre,R,Grassmann流形的黎曼几何与算法计算,应用数学学报,8199-220,(2004)·Zbl 1052.65048号 ·doi:10.1023/B:ACAP.000013855.14971.91
[2] Absil,P.-A.、Mahony,R.和Sepulchre,R.(2008)。矩阵流形上的优化算法普林斯顿:普林斯顿大学出版社·Zbl 1147.65043号 ·数字对象标识代码:10.1515/9781400830244
[3] M·亚哈龙;Elad,M;Bruckstein,A,K-svd:设计稀疏表示超完备字典的算法,IEEE信号处理学报,54,4311-4322,(2006)·Zbl 1375.94040号 ·doi:10.1109/TSP.2006.881199
[4] 阿尔西尼,V;Fillard,P;佩内克,X;Ayache,N,《扩散张量快速简单演算的核素对数度量》,《医学中的磁共振》,56,411-421,(2006)·doi:10.1002/mrm.20965年
[5] 巴斯里,R;Jacobs,DW,Lambertian反射率和线性子空间,IEEE模式分析和机器智能汇刊,25,218-233,(2003)·doi:10.1109/TPAMI.2003.1177153
[6] Begelfor,E.和Werman,M.(2006年)。重温仿射不变性。程序。IEEE计算机视觉和模式识别会议(CVPR)(第2087-2094页)。
[7] 坎迪斯,EJ;J·隆伯格;Tao,T,鲁棒不确定性原理:从高度不完整的频率信息中精确重建信号,IEEE信息理论汇刊,52,489-509,(2006)·Zbl 1231.94017号 ·doi:10.10109/TIT.2005.862083
[8] Cetingul,H.E.,&Vidal,R.(2009),stiefel和grassmann流形上聚类的内在均值偏移。IEEE计算机视觉和模式识别会议记录(第1896-1902页)。
[9] Cetingul,H.E.和Vidal,R.(2011年)。稀疏黎曼流形聚类用于HARDI分割。IEEE生物医学成像国际研讨会:从纳米到宏观(第1750-1753页)。
[10] 塞廷古尔,HE;MJ Wright;汤普森,PM;Vidal,R,使用稀疏黎曼流形聚类的高角度分辨率扩散MRI分割,IEEE医学成像汇刊,33301-317,(2014)·doi:10.1109/TMI.2013.2284360
[11] Cevikalp,H.和Triggs,B.(2010年)。基于图像集的人脸识别。在:程序。IEEE计算机视觉和模式识别会议(CVPR)(第2567-2573页)。
[12] Chan,A.B.和Vasconcelos,N.(2005年)。用于自回归视觉过程分类的概率核。IEEE计算机视觉和模式识别会议记录(第846-851页)。
[13] Chen,S.、Sanderson,C.、Harandi,M.和Lovell,B.C.(2013)。通过联合稀疏近似最近子空间改进图像集分类。IEEE计算机视觉和模式识别会议记录(第452-459页)。
[14] Chikuse,Y.(2003)。特殊歧管统计(第174卷)。纽约:施普林格·兹比尔1026.62051
[15] 旋塞,KD;Moor,BD,ARMA模型之间的子空间角度,系统和控制快报,46,265-270,(2002)·Zbl 0994.93057号 ·doi:10.1016/S0167-6911(02)00135-4
[16] Dallal,N.和Triggs,B.(2005年)。人体检测定向梯度直方图。IEEE计算机视觉和模式识别会议记录(第886-893页)。
[17] Donoho,DL,压缩感知,IEEE信息理论汇刊,521289-1306,(2006)·Zbl 1288.94016号 ·doi:10.1109/TIT.2006.871582
[18] 多雷托,G;Chiuso,A;Wu,YN;Soatto,S,动态纹理,国际计算机视觉杂志,51,91-109,(2003)·Zbl 1030.68646号 ·doi:10.1023/A:1021669406132
[19] Elad,M.(2010年)。稀疏和冗余表示——从理论到信号和图像处理应用纽约:Springer·Zbl 1211.94001号
[20] Elhamifar,E;Vidal,R,《稀疏子空间聚类:算法、理论和应用》,IEEE模式分析和机器智能汇刊,352765-2781,(2013)·doi:10.1109/TPAMI.2013.57
[21] Gallivan,K.A.、Srivastava,A.、Liu,X.和Van Dooren,P.(2003)。格拉斯曼流形上推理的有效算法。IEEE统计信号处理研讨会(第315-318页)。
[22] 加尼姆,B;Ahuja,N,动态纹理识别的最大边缘距离学习,欧洲计算机视觉会议论文集,6312,223-236,(2010)
[23] Goh,A.和Vidal,R.(2008)。黎曼流形上的聚类与降维。IEEE计算机视觉与模式识别会议记录(CVPR)(第1-7页)。
[24] Golub,G.H.和Van Loan,C.F.(1996年)。矩阵计算(第三版)。巴尔的摩:约翰·霍普金斯大学出版社·Zbl 0865.65009号
[25] Gong,B.、Shi,Y.、Sha,F.和Grauman,K.(2012)。无监督域自适应的测地流核。IEEE计算机视觉和模式识别会议记录(第2066-2073页)。
[26] 右戈帕兰;李,R;Chellappa,R,《通过生成中间数据表示实现跨域移动的无监督适应》,IEEE模式分析和机器智能学报,362288-2302,(2014)·doi:10.1109/TPAMI.2013.249
[27] 郭,K;伊斯瓦尔,P;Konrad,J,使用特征协方差矩阵从视频中识别动作,IEEE图像处理学报(TIP),222479-2494,(2013)·Zbl 1373.94784号 ·doi:10.1109/TIP.2013.2252622
[28] Hamm,J.和Lee,D.D.(2008)。格拉斯曼判别分析:基于子空间学习的统一观点。机器学习国际会议(ICML)会议记录(第376-383页)。
[29] Harandi,M.、Sanderson,C.、Shen,C.和Lovell,B.C.(2013年)。格拉斯曼流形上的字典学习和稀疏编码:一个外部解决方案。在:计算机视觉国际会议记录. ·Zbl 1398.94034号
[30] Harandi,M.T.、Hartley,R.、Lovell,B.C.和Sanderson,C.(2015)。对称正定流形上使用bregman发散的稀疏编码。IEEE神经网络和学习系统事务(TNNLS)PP(99):1-1。
[31] Harandi,M.T.、Sanderson,C.、Shirazi,S.和Lovell,B.C.(2011年)。用于改进图像集匹配的格拉斯曼流形上的图嵌入判别分析。IEEE计算机视觉和模式识别会议记录(第2705-2712页)。
[32] 哈特利,R;特朗普夫,J;戴,Y;李,H,旋转平均,国际计算机视觉杂志,103,267-305,(2013)·兹比尔1270.68346 ·doi:10.1007/s11263-012-0601-0
[33] Helmke,U.、Hüper,K.和Trumpf,J.(2007)。格拉斯曼流形上的牛顿方法。预印本:arXiv:0709.2205。
[34] Ho,J.、Xie,Y.和Vemuri,B.(2013)。关于稀疏编码和字典学习的非线性推广。在:机器学习国际会议(ICML)会议记录(第1480-1488页)。
[35] Karcher,H,黎曼质心与柔化光滑,《纯粹数学与应用数学通讯》,30509-541,(1977)·Zbl 0354.57005号 ·doi:10.1002/cpa.3160300502
[36] Kim,M.、Kumar,S.、Pavlovic,V.和Rowley,H.(2008)。真实视频中具有视觉约束的人脸跟踪和识别。IEEE计算机视觉和模式识别会议记录(第1-8页)。
[37] 金,T-K;Cipolla,R,用于动作分类和检测的视频量张量的典型相关分析,IEEE模式分析和机器智能汇刊,311415-1428,(2009)·doi:10.1109/TPAMI.2008.167
[38] 金,T-K;基特勒,J;Cipolla,R,《使用典型相关性的图像集类的判别学习和识别》,IEEE模式分析和机器智能汇刊,291005-1018,(2007)·doi:10.1109/TPAMI.2007.1037
[39] Kokiopoulou,E;陈,J;Saad,Y,降维方法中的迹优化和特征问题,数值线性代数及其应用,18,565-602,(2011)·Zbl 1249.65075号 ·doi:10.1002/nla.743
[40] Lee,J.M.(2012)。光滑流形简介(第218卷)。纽约:施普林格·Zbl 1258.53002号 ·doi:10.1007/9781-4419-9982-5
[41] Li,B.,Ayazoglu,M.,Mao,T.,Camps,O.I.,&Sznaier,M.(2011)。使用动态子空间角度进行活动识别。IEEE计算机视觉和模式识别会议记录(第3193-3200页)。
[42] Lui,YM,产品流形上的人类手势识别,《机器学习研究杂志》,13,3297-3321,(2012)·Zbl 1433.68402号
[43] 迈拉尔,J;巴赫,F;Ponce,J,任务驱动字典学习,IEEE模式分析和机器智能汇刊,34791-804,(2012)·doi:10.10109/TPAMI.2011.156
[44] 梅拉尔,J;巴赫,F;彭斯,J;Sapiro,G,矩阵分解和稀疏编码的在线学习,机器学习研究杂志,11,19-60,(2010)·Zbl 1242.62087号
[45] Mairal,J.、Bach,F.、Ponce,J.,Sapiro,G.和Zisserman,A.(2008)。用于局部图像分析的识别性学习词典。在:程序。IEEE计算机视觉和模式识别会议(CVPR)(第1-8页)。IEEE标准。
[46] 迈拉尔,J;Elad,M;Sapiro,G,彩色图像恢复的稀疏表示,IEEE图像处理学报(TIP),17,53-69,(2008)·doi:10.1109/TIP.2007.911828
[47] Manton,J.H.(2004)。计算紧李群质心的全局收敛数值算法。控制、自动化、机器人和视觉国际会议\(3)(第2211-2216页)。
[48] 奥贾拉,T;Pietikäinen,M;Mäenpää,T,具有局部二进制模式的多分辨率灰度和旋转不变纹理分类,IEEE模式分析和机器智能汇刊,24971-987,(2002)·doi:10.1109/TPAMI.2002.1017623
[49] 奥沙森,BA;Field,DJ,通过学习自然图像的稀疏代码,出现简单细胞感受野属性,《自然》,381,607-609,(1996)·数字对象标识代码:10.1038/381607a0
[50] Ramamourthi,R,用于朗伯物体图像中光照可变性理论分析的分析PCA构造,IEEE Trans。模式分析与机器智能,241322-1333,(2002)·doi:10.1109/TPAMI.2002.1039204
[51] Rao,S.R.、Tron,R.、Vidal,R.和Ma,Y.(2008)。在存在离群、不完整或损坏的轨迹时,通过鲁棒子空间分离进行运动分割。IEEE计算机视觉和模式识别会议记录(第1-8页)。
[52] Ravichandran,A.、Favaro,P.和Vidal,R.(2011)。动态纹理分割和分类的统一方法。亚洲计算机视觉会议记录(第425-438页)。斯普林格。
[53] Roweis,ST;Saul,LK,局部线性嵌入的非线性降维,《科学》,2902323-2326,(2000)·doi:10.1126/science.290.5500.2323
[54] Sanderson,C.、Harandi,M.T.、Wong,Y.和Lovell,B.C.(2012)。结合学习显著局部描述符和距离度量进行图像集人脸验证。高级视频和基于信号的监视国际会议记录(第294-299页)。
[55] Sankaranarayanan,A;图拉加,P;巴拉纽克,R;Chellappa,R,《动态场景的压缩采集》,《欧洲计算机视觉会议论文集》,631129-142,(2010)
[56] Shawe-Taylor,J.和Cristianini,N.(2004)。模式分析的核方法剑桥:剑桥大学出版社。 ·doi:10.1017/CBO9780511809682
[57] Shirazi,S.、Sanderson,C.、McCool,C.和Harandi,M.T.(2015)。用于鲁棒目标跟踪的仿射子空间包。预印本:arXiv:1408.2313。
[58] 斯利瓦斯塔瓦,A;Klassen,E,贝叶斯和几何子空间跟踪,应用概率进展,36,43-56,(2004)·Zbl 1047.93044号 ·doi:10.1239/aap/1077134463
[59] 苏巴拉奥,R;Meer,P,黎曼流形上的非线性均值漂移,国际计算机视觉杂志,84,1-20,(2009)·Zbl 1477.68426号 ·doi:10.1007/s11263-008-0195-8
[60] Tibshirani,R,《通过套索进行回归收缩和选择》,《皇家统计学会杂志》。B系列(方法学),58267-288,(1996)·兹比尔0850.62538
[61] 图拉加,P;Veeraraghavan,A;斯里瓦斯塔瓦,A;Chellappa,R,基于图像和视频识别的Grassmann和Stiefel流形的统计计算,IEEE模式分析和机器智能汇刊,332273-2286,(2011)·doi:10.1109/TPAMI.2011.52
[62] 土耳其语,M;Pentland,A,识别特征脸,认知神经科学杂志,371-86,(1991)·doi:10.1162/jocn.1991.3.1.71
[63] Vemulapalli,R.、Pillai,J.K.和Chellappa,R.(2013)。流形特征外部分类的核学习。在:程序。IEEE计算机视觉和模式识别会议(CVPR)(第1782-1789页)。
[64] 维奥拉,P;Jones,MJ,Robust实时人脸检测,国际计算机视觉杂志,57137-154,(2004)·doi:10.1023/B:VISI.0000013087.49260.fb
[65] Wang,J.,Yang,J..,Yu,K.,Lv,F.,Huang,T.,&Gong,Y.(2010)。用于图像分类的局部约束线性编码。IEEE计算机视觉和模式识别会议记录(第3360-3367页)。
[66] 王,Y;Mori,G,通过半专利主题模型进行人类动作识别,IEEE模式分析和机器智能汇刊,317762-1774,(2009)·doi:10.1109/TPAMI.2009.43
[67] 维基百科。Min-max定理-维基百科,免费百科全书,2015年。[在线;访问日期:2015年5月27日]。
[68] 赖特,J;马,Y;迈拉尔,J;萨皮罗,G;黄,TS;Yan,S,计算机视觉和模式识别的稀疏表示,IEEE学报,981031-1044,(2010)·doi:10.1109/JPROC.2010.2044470
[69] 赖特,J;杨,AY;加内什,A;Sastry,不锈钢;Ma,Y,通过稀疏表示实现鲁棒人脸识别,IEEE模式分析和机器智能汇刊,31210-227,(2009)·doi:10.1109/TPAMI.2008.79
[70] Xu,Y.,Quan,Y.、Ling,H.和Ji,H.(2011)。使用动态分形分析进行动态纹理分类。计算机视觉国际会议记录.
[71] Yang,J.、Yu,K.、Gong,Y.和Huang,T.(2009)。使用稀疏编码进行图像分类的线性空间金字塔匹配。IEEE计算机视觉和模式识别会议记录(第1794-1801页)。
[72] Yu,K.,&Zhang,T.(2010)。使用局部切线改进了局部坐标编码。机器学习国际会议(ICML)会议记录(第1215-1222页)。
[73] Yu,K.,Zhang,T.,&Gong,Y.(2009)。使用局部坐标编码的非线性学习。神经信息处理系统进展(NIPS)\(9)(第1页)。
[74] 于,S;Tan,T;黄,K;贾,K;Wu,X,基于步态的性别分类研究,IEEE图像处理汇刊(TIP),181905-1910,(2009)·Zbl 1371.94444号 ·doi:10.10109/TIP.2009.2020535
[75] Yuan,C.、Hu,W.、Li,X.、Maybank,S.和Luo,G.(2010)。对数核素黎曼度量下的人类行为识别。H.Zha、R.-I.Taniguchi和S.Maybank编辑,Proc。亚洲计算机视觉会议(ACCV),计算机科学讲稿第5994卷,第343-353页。施普林格柏林海德堡。
[76] 赵,G;Pietikäinen,M,使用局部二进制模式进行动态纹理识别,并应用于面部表情,IEEE Trans。模式分析与机器智能,29915-928,(2007)·doi:10.1010/TPAMI.2007.1110
[77] Zheng,S.,Zhang,J.,Huang,K.,He,R.,&Tan,T.(2011)。步态识别的稳健视图转换模型。国际图像处理会议(第2073-2076页)。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。