×

用于图像集分类的联合降维和度量学习。 (英语) Zbl 1457.68243号

摘要:与基于单个图像的传统分类任务相比,图像集包含更多的互补信息,这对正确分类查询主题非常有益。因此,图像集分类受到了研究者的广泛关注。然而,主要的挑战是如何有效地表示图像集以充分利用潜在的鉴别特征。与以往用单一模式或混合模式表示图像集的工作不同,本文提出了一种新的跨欧几里德空间到黎曼流形的多模型融合方法,以联合完成降维和度量学习。为了实现框架的目标,我们首先引入了三种距离度量学习模型,即欧几里德-核素、黎曼-黎曼和欧几里得-黎曼,以更好地利用图像集的互补信息。然后,通过将两个异质空间(即欧几里德空间和黎曼流形空间)集成到公共诱导马氏空间中,同时学习两个执行降维的映射和一个度量矩阵,其中类内数据集是紧密的,类间数据集是分离的。该策略可以有效地解决现有基于集合的方法在进行降维时不考虑距离度量学习的严重缺陷。此外,为了学习一个完整的马氏度量,我们采用(L_{2,1})正则化度量矩阵进行最优特征选择和分类。在人脸识别、物体分类、手势识别和手写体分类等方面的大量实验结果表明,与其他基于图像集的算法相比,该方法是有效的。

理学硕士:

68T05型 人工智能中的学习和自适应系统
62H30型 分类和区分;聚类分析(统计方面)
62华氏35 多元分析中的图像分析
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Lyons,M.J。;Budynek,J。;赤松,S.,单幅人脸图像的自动分类,IEEE Trans。模式分析。机器。智力。,21, 12, 1357-1362 (1999)
[2] 科里特科夫斯基,M。;Rutkowski,L。;Scherer,R.,《通过增强模糊分类器实现快速图像分类》,《信息科学》。,327, 175-182 (2016)
[3] 张,C。;程,J。;Zhang,Y。;刘杰。;Liang,C。;彭,J。;黄,Q。;田强,利用随机方向和位置选择增强的局部特征进行图像分类,信息科学。,310, 118-129 (2015)
[4] 塞维卡普,H。;Triggs,B.,基于图像集的人脸识别,计算机视觉和模式识别(CVPR),2010年IEEE会议,2567-2573(2010),IEEE
[5] 王,R。;Shan,S。;陈,X。;Gao,W.,流形-流形距离及其在基于图像集的人脸识别中的应用,计算机视觉和模式识别,2008年。CVPR 2008。IEEE会议,1-8(2008),IEEE
[6] Chen,L.,基于对偶线性回归的人脸聚类识别分类,IEEE计算机视觉和模式识别会议论文集,2673-2680(2014)
[7] 王,W。;王,R。;黄,Z。;Shan,S。;Chen,X.,图像集人脸识别中高斯分布黎曼流形的判别分析,IEEE Trans。图像处理。,27, 1, 151-163 (2018) ·Zbl 1409.94630号
[8] 郑,P。;赵,Z.-Q。;高杰。;Wu,X.,一种用于图像集分类的集级联合稀疏表示,Inf.Sci。,448, 75-90 (2018)
[9] 哈兰迪,M。;Salzmann,M。;Baktashmotlagh,M.,《超越高斯:PDF黎曼流形上的图像集匹配》,IEEE计算机视觉国际会议论文集,4112-4120(2015)
[10] O.山口。;福井,K。;Maeda,K.-i.,使用时间图像序列的人脸识别,自动人脸和手势识别,1998。诉讼程序。第三届IEEE国际会议,318-323(1998),IEEE
[11] OJE,E.,模式识别的子空间方法,模式识别和图像处理系列,第6卷(1983年),研究出版社
[12] Kim,T.-K。;Kittler,J。;Cipolla,R.,使用典型相关性的图像集类的判别学习和识别,IEEE Trans。模式分析。机器。智力。,29, 6, 1005-1018 (2007)
[13] 王,R。;Chen,X.,流形判别分析,计算机视觉和模式识别,2009。CVPR 2009。IEEE会议,429-436(2009),IEEE
[14] 胡,Y。;Mian,A.S。;Owens,R.,Sparse近似最近点用于图像集分类,计算机视觉和模式识别(CVPR),2011年IEEE会议,121-128(2011),IEEE
[15] Yang,M。;朱,P。;Van Gool,L。;Zhang,L.,基于图像集之间正则化最近点的人脸识别,自动人脸和手势识别(FG),2013年第10届IEEE国际会议和研讨会,1-7(2013),IEEE
[16] 沙赫纳罗维奇,G。;费希尔,J.W。;Darrell,T.,从长期观察中识别人脸,欧洲计算机视觉会议,851-865(2002),斯普林格·兹比尔1039.68719
[17] 阿兰杰洛维奇,O。;沙赫纳罗维奇,G。;费希尔,J。;Cipolla,R。;Darrell,T.,使用流形密度散度的图像集进行人脸识别,计算机视觉和模式识别,2005年。CVPR 2005。IEEE计算机学会会议,第1卷,581-588(2005),IEEE
[18] 张,M。;He,R。;曹,D。;孙,Z。;Tan,T.,图像集分类的同时特征和样本缩减。,AAAI,第16卷,1401-1407(2016)
[19] 沙阿,S.A。;美国纳迪姆。;Bennamoun,M。;Sohel,F。;Togneri,R.,《使用基于线性回归的图像重建的高效图像集分类》,IEEE计算机视觉和模式识别研讨会论文集,99-108(2017)
[20] 沙阿,S.A.A。;Bennamoun,M。;Boussaid,F.,基于图像集的人脸和物体识别的迭代深度学习,神经计算,174866-874(2016)
[21] 黄,Z。;王,R。;Shan,S。;Chen,X.,使用欧氏和黎曼混合度量学习在野外大规模视频上进行人脸识别,模式识别。,48, 10, 3113-3124 (2015)
[22] 卢,J。;王,G。;Moulin,P.,基于图像的人脸识别的局部多特征度量学习,IEEE Trans。电路系统。视频技术。,26, 3, 529-540 (2016)
[23] 黄,Z。;王,R。;Shan,S。;Van Gool,L.公司。;Chen,X.,《跨欧几里德-黎曼度量学习及其在视频人脸识别中的应用》,IEEE Trans。模式分析。机器。智力。,40, 12, 2827-2840 (2018)
[24] 高,X。;孙,Q。;Xu,H。;魏,D。;Gao,J.,用于图像集分类的多模型融合度量学习,Knowl。基于系统。,164, 253-264 (2019)
[25] Wu,Y。;贾毅。;李,P。;张杰。;Yuan,J.,对称正定矩阵的流形核稀疏表示及其应用,IEEE Trans。图像处理。,24, 11, 3729-3741 (2015) ·Zbl 1408.94722号
[26] 冯·G。;李,H。;Dong,J。;张杰,基于Volterra核直接判别分析和有效特征分类的人脸识别,信息科学。,441, 187-197 (2018)
[27] 郑,P。;赵,Z.-Q。;高杰。;Wu,X.,基于合作稀疏表示的图像集分类,模式识别。,63, 206-217 (2017)
[28] 黄,Z。;王,R。;Shan,S。;Chen,X.,Grassmann流形上的投影度量学习及其在基于视频的人脸识别中的应用,IEEE计算机视觉和模式识别会议论文集,140-149(2015)
[29] S.Liao,Y.Hu,S.Z.Li,人再识别的联合降维和度量学习,arXiv:1406.4216(2014)。
[30] 哈兰迪,M。;Salzmann,M。;Hartley,R.,《联合降维与度量学习:几何观点》,第34届机器学习国际会议论文集,第70卷,1404-1413(2017),JMLR。组织
[31] Hotelling,H.,两组变量之间的关系,统计学的突破,162-190(1992),Springer
[32] 王,W。;王,R。;Shan,S。;Chen,X.,面向人脸图像集分类的原型鉴别学习,亚洲计算机视觉会议,344-360(2016),Springer
[33] 纳西姆,I。;托涅里,R。;Bennamoun,M.,人脸识别的线性回归,IEEE Trans。模式分析。机器。智力。,32, 11, 2106-2112 (2010)
[34] 冯(Q.Feng)。;周,Y。;Lan,R.,用于图像集检索的成对线性回归分类,IEEE计算机视觉和模式识别会议论文集,4865-4872(2016)
[35] 陈,S。;桑德森,C。;哈兰迪,M.T。;Lovell,B.C.,通过联合稀疏近似最近子空间改进图像集分类,IEEE计算机视觉和模式识别会议论文集,452-459(2013)
[36] Hu,H.,图像集人脸识别的稀疏判别多流形格拉斯曼分析,IEEE Trans。电路系统。视频技术。,25, 10, 1599-1611 (2015)
[37] 黄,Z。;王,R。;Shan,S。;李,X。;Chen,X.,对称正定流形上的对数核素度量学习及其在图像集分类中的应用,机器学习国际会议,720-729(2015)
[38] 王,R。;郭,H。;Davis,L.S。;Dai,Q.,协方差判别学习:一种自然有效的图像集分类方法,计算机视觉和模式识别(CVPR),2012年IEEE会议,2496-2503(2012),IEEE
[39] 海亚特,M。;Bennamoun,M。;An,S.,图像集分类的深度重建模型,IEEE Trans。模式分析。机器。智力。,37, 4, 713-727 (2015)
[40] 卢,J。;王,G。;邓,W。;穆林,P。;周,J.,用于图像集分类的多流形深度度量学习,IEEE计算机视觉和模式识别会议论文集,1137-1145(2015)
[41] 聂,F。;黄,H。;蔡,X。;Ding,C.H.,通过联合l21范数最小化进行高效和稳健的特征选择,《神经信息处理系统的进展》,1813-1821(2010)
[42] Kumar,硕士。;Gopal,M.,用于模式分类的最小二乘双支持向量机,专家系统。申请。,36, 4, 7535-7543 (2009)
[43] Kim,M。;库马尔,S。;巴甫洛维奇,V。;Rowley,H.,《真实世界视频中带视觉约束的人脸跟踪和识别》,计算机视觉和模式识别,2008年。CVPR 2008。IEEE会议,1-8(2008),IEEE
[44] Georghiades,A.S。;Belhumeur,P.N。;Kriegman,D.J.,《从少到多:可变光照和姿势下人脸识别的照明锥模型》,IEEE Trans。模式分析。机器。智力。,23443-660(2001年)
[45] 黄,Z。;Shan,S。;王,R。;张,H。;老挝,S。;科尔班,A。;Chen,X.,基于COX人脸数据库的视频人脸识别基准和比较研究,IEEE Trans。图像处理。,24, 12, 5967-5981 (2015) ·Zbl 1408.94265号
[46] Leibe,B。;Schiele,B.,《分析基于外观和轮廓的对象分类方法》,计算机视觉和模式识别,2003年。诉讼程序。2003年IEEE计算机学会会议,第2卷,II-409(2003),IEEE
[47] Kim,T.-K。;Cipolla,R.,动作分类和检测视频量张量的典型相关分析,IEEE Trans。模式分析。机器。智力。,31, 8, 1415-1428 (2009)
[48] Deng,L.,用于机器学习研究的手写数字图像MNIST数据库[网络最佳],IEEE信号处理。Mag.,29,6,141-142(2012)
[49] 维奥拉,P。;Jones,M.J.,《鲁棒实时人脸检测》,国际计算机杂志。可见。,57, 2, 137-154 (2004)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。