×

学习判别SPD流形神经网络进行图像集分类。 (英语) Zbl 07751307号

摘要:在对称正定(SPD)流形上执行模式分析需要特定的数学计算,表征所涉及的数据点的非欧几里得性质和学习任务,例如图像集分类问题。伴随着先进的神经网络技术,最近研究了几种用于处理SPD矩阵的体系结构,以获得细粒度的结构化表示。然而,现有的方法受到了数据点外观变化多样的挑战,提出了如何通过支持理论学习不变表示以提高性能的问题。因此,本文为SPD流形神经网络设计了两个黎曼运算模块。具体来说,为了训练具有新设计的度量学习正则化项的判别流形到流形转换网络,首次提出了黎曼批量正则化(RBR)层。第二个模块通过黎曼流形上的几何计算实现黎曼池运算,特别是黎曼重心、度量学习和黎曼优化。对五个基准数据集的大量实验表明了该方法的有效性。

MSC公司:

68T05型 人工智能中的学习和自适应系统
53倍X 微分几何

软件:

马诺普特
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Abdar,M。;法哈米,医学硕士。;Chakrabarti,S。;Khosravi,A。;Pławiak,P。;Acharya,U.R.,Barf:一种新的基于不确定性感知模块的直接和交叉二进制残差特征融合,用于医学图像分类,信息科学,353-378(2021)
[2] Abdar,M。;波尔帕纳,F。;侯赛因,S。;Rezazadegan,D。;刘,L。;Ghavamzadeh,M.,《深度学习中不确定性量化综述:技术、应用和挑战》,信息融合,243-297(2021)
[3] Abdar,M。;萨拉里,S。;Qahremani,S。;香港拉姆。;Karray,F。;Hussain,S.,《不确定性usenet:稳健的不确定性感知分层特征融合与集合蒙特卡罗丢失用于covid-19检测》(2021),arXiv预印本arXiv:2105.08590
[4] Abdar,M。;Samami,M。;马哈茂达巴德,S.D。;Doan,T。;Mazoure,B。;Hashemifesharaki,R.,《使用基于三向决策的贝叶斯深度学习对皮肤癌分类进行不确定性量化》,《生物与医学中的计算机》,第104418页,(2021)
[5] Absil,P.-A.公司。;马奥尼,R。;Sepulchre,R.,《矩阵流形上的优化算法》(2009),普林斯顿大学出版社·Zbl 1147.65043号
[6] van Amersfoort,J。;史密斯,L。;杰森,A。;键,O。;Gal,Y.,关于单前向传递不确定性的特征折叠和深度内核学习(2021),arXiv预印本arXiv:2102.11409
[7] Arsigny,V。;菲尔拉德,P。;佩内克,X。;Ayache,N.,对称正定矩阵上新型向量空间结构中的几何平均值,SIAM数学分析杂志,328-347(2007)·Zbl 1144.47015号
[8] Baudat,G。;Anouar,F.,使用核方法的广义判别分析,神经计算,2385-2404(2000)
[9] Boumal,N。;米什拉,B。;Absil,P.-A.公司。;Sepulchre,R.,Manopt,一个用于流形优化的matlab工具箱,《机器学习研究杂志》,1455-1459(2014)·Zbl 1319.90003号
[10] 布鲁克斯,D。;O.施瓦德。;Barbaresco,F。;施耐德,J.-Y。;Cord,M.,spd神经网络的黎曼分批归一化(2019),arXiv预印本arXiv:1909.02414
[11] 陈,Z。;徐,T。;吴晓杰。;王,R。;Kittler,J.,用于图像集分类的混合黎曼图嵌入度量学习,IEEE大数据汇刊,1(2021)
[12] 程,H。;Yap,K.-H。;Wen,B.,稳健图像和图像集分类的统计和空间稀疏性协调(2021),arXiv预印本arXiv:2106.00256
[13] Cheng,G。;周,P。;Han,J.,图像集分类的双重度量学习,IEEE图像处理汇刊,281-292(2017)·Zbl 1409.94063号
[14] 达尔,A。;Goecke,R。;Joshi,J。;锡卡,K。;Gedeon,T.,《野外挑战中的情绪识别2014:基线、数据和协议》(ICMI(2014)),461-466
[15] 杜,Y。;Wang,W。;Wang,L.,基于骨架的动作识别的层次递归神经网络,(CVPR(2015)),1110-1118
[16] 爱德曼,A。;阿里亚斯,T.A。;Smith,S.T.,《正交约束算法的几何》,SIAM数学分析杂志,303-353(1998)·Zbl 0928.6500号
[17] 费希滕霍夫,C。;平茨,A。;Zisserman,A.,用于视频动作识别的卷积两流网络融合(CVPR(2016)),1933-1941
[18] Gal,Y。;Ghahramani,Z.,《作为贝叶斯近似的辍学:在深度学习中表示模型不确定性》,(机器学习国际会议(2016)),1050-1059
[19] 高,Z。;吴,Y。;哈兰迪,M。;Jia,Y.,spd流形上基于相似性分类的稳健距离度量,IEEE神经网络和学习系统汇刊,1-15(2019)
[20] Garcia-Hernando,G。;Kim,T.-K.,过渡森林:用于动作识别和检测的学习判别性时间过渡,(CVPR(2017)),432-440
[21] Garcia-Hernando,G。;袁,S。;Baek,S。;Kim,T.-K.,第一人称手部动作基准,包含rgb-d视频和三维手部姿势注释(CVPR(2018)),409-419
[22] 哈兰迪,M。;Salzmann,M.,《黎曼编码和字典学习:拯救内核》,(CVPR(2015)),3926-3935
[23] 哈兰迪,M。;Salzmann,M。;Hartley,R.,《联合降维与度量学习:几何研究》(ICML(2017)),1404-1413
[24] 哈兰迪,M。;Salzmann,M。;Hartley,R.,《spd流形上的降维:几何软件方法的出现》,IEEE模式分析和机器智能汇刊,48-62(2018)
[25] 哈兰迪,M。;桑德森,C。;哈特利,R。;Lovell,B.C.,《对称正定矩阵的稀疏编码和字典学习:核方法》(ECCV(2012)),216-229
[26] Hu,J.-F。;郑维生。;赖,J。;Zhang,J.,联合学习rgb-d活动识别的异质特征,(CVPR(2015)),5344-5352
[27] 黄,Z。;Van Gool,L.,spd矩阵学习的黎曼网络,(AAAI(2017)),2036-2042
[28] 黄,Z。;王,R。;掸邦,S。;Chen,X.,基于欧氏和黎曼混合度量学习的野外大规模视频人脸识别,模式识别,3113-124(2015)
[29] 黄,Z。;王,R。;Shan,S。;Chen,X.,基于grassmann流形的投影度量学习及其在基于视频的人脸识别中的应用,(CVPR(2015)),140-149
[30] 黄,Z。;王,R。;Shan,S。;李,X。;Chen,X.,对称正定流形上的对数核素度量学习及其在图像集分类中的应用,(ICML(2015)),720-729
[31] 黄,Z。;吴杰。;Van Gool,L.,《在格拉斯曼流形上构建深层网络》(AAAI(2018)),1137-1145
[32] Ionescu,C。;O.Vantzos。;Sminchisescu,C.,《通过矩阵反向传播训练具有结构化层的深层网络》(2015),arXiv预印本arXiv:1509.07838
[33] 肯德尔,A。;Gal,Y.,我们在计算机视觉的贝叶斯深度学习中需要哪些不确定性?(2017),arXiv预印arXiv:1703.04977
[34] Kim,T.-K。;Cipolla,R.,动作分类和检测中视频量张量的典型相关分析,IEEE模式分析和机器智能汇刊,1415-1428(2008)
[35] Kim,T.S。;Reiter,A.,《利用时间卷积网络进行可解释三维人体行为分析》(CVPRW(2017)),1623-1631
[36] 李·T。;刘杰。;张伟。;Ni,Y。;Wang,W。;Li,Z.,Uav人类:无人机人类行为理解的大型基准,(CVPR(2021)),16266-16275
[37] 刘,H。;Simonyan,K。;Yang,Y.,《艺术:差异化建筑搜索》(ICLR(2019))
[38] Lohit,S。;王,Q。;Turaga,P.,《时间变换网络:不变量和判别时间扭曲的联合学习》,(CVPR(2019)),12426-12435
[39] Lovrić,M。;Min-Oo,M。;Ruh,E.A.,参数化为黎曼对称空间的多元正态分布,多元分析杂志,36-48(2000)·Zbl 0995.53037号
[40] 卢,J。;Liong,V.E。;Zhou,J.,同质和异质人脸识别的同时局部二进制特征学习和编码,IEEE模式分析和机器智能汇刊,1979-1993(2017)
[41] 卢,J。;王,G。;邓,W。;穆林,P。;Zhou,J.,用于图像集分类的多流形深度度量学习,(CVPR(2015)),1137-1145
[42] 卢,J。;王,G。;Moulin,P.,使用整体多阶统计特征和局部多核度量学习进行图像集分类,(ICCV(2013)),329-336
[43] Nadeem,U.、Shah,S.A.、Bennamoun,M.、Togneri,R.和Sohel,F.(0000)。低分辨率和有限数据场景的实时监视:图像集分类方法,arXiv预打印arXiv:1803.09470。
[44] Nguyen,X.S。;Brun,L。;莱佐雷,O。;Bougleux,S.,基于spd流形学习的基于骨架的手势识别神经网络,(CVPR(2019)),12036-12045
[45] 佩内克,X。;菲尔拉德,P。;Ayache,N.,张量计算的黎曼框架,国际计算机视觉杂志,41-66(2006)·Zbl 1287.53031号
[46] 拉哈曼,R。;Thiery,A.H.,《不确定性量化和深度集成》(2020),arXiv预印本arXiv:2007.08792
[47] 拉赫玛尼,H。;Mian,A.,《基于新视角的3D动作识别》,CVPR,1506-1515(2016)
[48] Rao,Y。;卢,J。;Zhou,J.,《基于视频的人脸识别和人物再识别的学习鉴别聚合网络》,《国际计算机视觉杂志》,701-718(2019)
[49] Shroff,N。;图拉加,P。;Chellappa,R.,《移动视景:利用运动描述场景》(CVPR(2010)),1911-1918年
[50] Sun,H。;甄,X。;郑毅。;Yang,G。;Yin,Y。;Li,S.,学习深度匹配核函数用于图像集分类,(CVPR(2017)),3307-3316
[51] 唐,F。;冯·H。;蒂诺,P。;Si,B。;季,D.,对称正定矩阵流形上的概率学习矢量量化,神经网络,105-118(2021)·Zbl 1521.68161号
[52] Tekin,B。;波戈,F。;Pollefeys,M.,H+o:统一的以自我为中心的三维手势和交互识别,(CVPR(2019)),4511-4520
[53] 维穆拉帕利,R。;排列,F。;Chellappa,R.,《通过将三维骨骼表示为谎言组中的点进行人类行为识别》(CVPR(2014)),588-595
[54] 维穆拉帕利,R。;Pillai,J.K。;Chellappa,R.,流形特征外部分类的核学习,(CVPR(2013)),1782-1789
[55] 王,R。;郭,H。;Davis,L.S。;戴琦,协方差判别学习:一种自然有效的图像集分类方法,(CVPR(2012)),2496-2503
[56] 王,R。;吴晓杰。;Kittler,J.,《利用格拉斯曼流形值特征进行图像集分类的图嵌入多核度量学习》,IEEE Trans。多媒体,228-242(2020)
[57] 王,R。;吴晓杰。;Kittler,J.,Symnet:用于图像集分类的简单对称正定流形深度学习方法,IEEE神经网络和学习系统汇刊,1-15(2021)
[58] 王,R。;吴晓杰。;刘,Z。;Kittler,J.,用于图像集分类的几何图形嵌入投影度量学习,IEEE认知与发展系统汇刊,1(2021)
[59] Yan,W。;孙,Q。;Sun,H。;Li,Y.,基于统计分析的图像集分类半监督学习框架,模式识别,文章107500 pp.(2020)
[60] Yan,S。;熊,Y。;Lin,D.,基于骨架的动作识别时空图卷积网络,(AAAI(2018))
[61] 张,X。;Wang,Y。;郭台铭。;Sznaier,M。;Camps,O.,在黎曼流形上使用gram矩阵嵌入的有效时间序列比较和分类,(CVPR(2016)),4498-4507
[62] 张杰。;Wang,L。;周,L。;Li,W.,学习spd矩阵的判别stein核及其应用,IEEE神经网络和学习系统汇刊,1020-1033(2015)
[63] 张,G。;杨,J。;郑毅。;罗,Z。;Zhang,J.,图像集分类的最佳鉴别特征和字典学习,信息科学,498-513(2021)·Zbl 1475.68308号
[64] 张,T。;郑伟。;崔,Z。;Zong,Y。;李,C。;周,X.,基于骨架的动作识别的深度流形到流形转换网络,IEEE多媒体汇刊,2926-2937(2020)
[65] 周,L。;Wang,L。;张杰。;Shi,Y。;Gao,Y.,(重温基于Spd矩阵的视觉表征的度量学习(2017)),3241-3249
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。