×

超越协方差:SICE和基于核的视觉特征表示。 (英语) Zbl 1483.68454号

摘要:在过去的几年中,基于协方差的特征表示受到了越来越多的关注。它最初是作为区域描述符提出的,现在已被用作各种识别任务的一般表示,表现出良好的性能。然而,协方差矩阵有一些固有的缺点,如小样本情况下的奇异性,建模复杂特征关系的能力有限,以及单一、固定的表示形式。为了获得更好的识别性能,本文认为应该探索更强大、更灵活的基于对称正定(SPD)-矩阵的表示,并且在本工作中尝试利用数据和非线性表示的先验知识。具体来说,为了更好地处理特征向量数量少和特征维数高的问题,我们建议利用视觉特征的结构稀疏性,并将稀疏逆协方差估计作为一种新的特征表示。此外,为了有效地建模复杂的特征关系,我们建议直接计算特征维上的核矩阵,从而形成一个健壮、灵活和开放的基于SPD-矩阵的表示框架。通过理论分析和实验研究,提出的两种表示方法在骨骼人类行为识别、图像集分类和目标分类任务中均优于协方差对应方法。

MSC公司:

68T45型 机器视觉和场景理解
PDF格式BibTeX公司 XML格式引用
全文: 内政部 链接

参考文献:

[1] 阿达姆扎克,R。;利特瓦克,A。;Pajor,A。;Tomczak-Jaegermann,N.,对数压缩系综中经验协方差矩阵收敛性的定量估计,美国数学学会杂志,23,2,535-561(2010)·Zbl 1206.60006号 ·doi:10.1090/S0894-0347-09-00650-X
[2] Ali,S.、Basharat,A.和Shah,M.(2007年)。人类行为识别的混沌不变量。在IEEE国际计算机视觉会议上(第1-8页)。电气与电子工程师协会。
[3] Arsigny,V。;菲尔拉德,P。;佩内克,X。;Ayache,N.,扩散张量快速简单演算的对数核素度量,医学中的磁共振,56,2,411-421(2006)·doi:10.1002/mrm.20965年
[4] O.班纳吉。;LE Ghaoui;d'Aspremont,A.,多元高斯或二进制数据的稀疏最大似然估计模型选择,机器学习研究杂志,9,485-516(2008)·Zbl 1225.68149号
[5] Basser,PJ;马蒂埃洛,J。;LeBihan,D.,根据核磁共振自旋回波估算有效自扩散张量,《磁共振杂志》,B辑,103,3247-254(1994)·doi:10.1006/jmrb.1994.1037
[6] Cavazza,J.、Morerio,P.和Murino,V.(2017a)。三维动作识别的紧凑核近似。在图像分析和处理国际会议上(第211-222页)。斯普林格。
[7] Cavazza,J.、Morerio,P.和Murino,V.(2017b)。当核心方法遇到特征学习时:用于骨骼数据动作识别的对数-方差网络。在IEEE计算机视觉和模式识别研讨会上(第33-40页)。电气与电子工程师协会。
[8] Cavazza,J。;Morerio,P。;Murino,V.,用近似RBF内核机器进行可伸缩和紧凑的3D动作识别,模式识别,93,25-35(2019)·doi:10.1016/j.patcog.2019.03.031
[9] Cavazza,J.、Zunino,A.、Biagio,M.S.和Murino,V.(2016)。用于动作识别的核化协方差。在模式识别国际会议上(第408-413页)。电气与电子工程师协会。
[10] Chatfield,K.、Simonyan,K.,Vedaldi,A.和Zisserman,A.(2014)。细节中魔鬼的回归:深入挖掘卷积网。arXiv预打印arXiv:1405.3531。
[11] Cimpoi,M.、Maji,S.、Kokkinos,I.、Mohamed,S.和Vedaldi,A.(2014)。描述野外的纹理。IEEE计算机视觉和模式识别会议(第3606-3613页)。电气与电子工程师协会。
[12] 辛佩,M。;马吉,S。;科基诺斯,I。;Vedaldi,A.,纹理识别、描述和分割的深度过滤器库,国际计算机视觉杂志,118,1,65-94(2016)·doi:10.1007/s11263-015-0872-3
[13] Cirujeda,P.和Binefa,X.(2014)。4DCov:用于深度序列中手势识别的时空特征的嵌套协方差描述符。在3D视觉国际会议上(第1卷,第657-664页)。电气与电子工程师协会。
[14] Cui,Y.、Zhou,F.、Wang,J.、Liu,X.、Lin,Y.和Belongie,S.(2017)。卷积神经网络的核池。在IEEE关于计算机视觉和模式识别的会议上(第2921-2930页)。电气与电子工程师协会。
[15] Donahue,J.、Jia,Y.、Vinyals,O.、Hoffman,J.,Zhang,N.、Tzeng,E.等人(2014)。Decaf:用于一般视觉识别的深度卷积激活功能。在机器学习国际会议上(第647-655页)。
[16] 伊利诺伊州德莱顿;Koloydenko,A。;Zhou,D.,协方差矩阵的非核素统计,及其在扩散张量成像中的应用,应用统计年鉴,31102-123(2009)·Zbl 1196.62063号 ·doi:10.1214/09-AOAS249
[17] Du,Y.,Wang,W.,&Wang,L.(2015)。基于骨架的动作识别的递阶递归神经网络。在IEEE关于计算机视觉和模式识别的会议上(第1110-1118页)。电气与电子工程师协会。
[18] Durand,T.,Mordan,T.、Thome,N.和Cord,M.(2017年)。Wildcat:用于图像分类、逐点定位和分割的深度卷积的弱监督学习。IEEE计算机视觉和模式识别会议(第642-651页)。电气与电子工程师协会。
[19] Evangelidis,G.、Singh,G.和Horaud,R.(2014)。骨骼四边形:使用关节四边形进行人类动作识别。在模式识别国际会议上(第4513-4518页)。电气与电子工程师协会。
[20] Everingham,M。;Van Gool,L。;威廉姆斯,CK;Winn,J。;Zisserman,A.,《pascal可视对象类(voc)挑战》,《国际计算机视觉杂志》,88,2,303-338(2010)·doi:10.1007/s11263-009-0275-4
[21] Fasshauer,G.E.(2011年)。正定核:过去、现在和未来。白云石近似研究笔记4(核函数和无网格方法专刊):21-63。
[22] Feichtenhofer,C.、Pinz,A.和Zisserman,A.(2016)。用于视频动作识别的卷积两流网络融合。在IEEE计算机视觉和模式识别会议上(第1933-1941页)。电气与电子工程师协会。
[23] 弗里德曼,J。;哈斯蒂,T。;Tibshirani,R.,用图形套索进行稀疏逆协方差估计,生物统计学,9,3,432-441(2008)·Zbl 1143.62076号 ·doi:10.1093/biostatistics/kxm045
[24] Gao,Y.、Beijbom,O.、Zhang,N.和Darrell,T.(2016)。紧凑双线性池。IEEE计算机视觉和模式识别会议(第317-326页)。电气与电子工程师协会。
[25] Gross,R.和Shi,J.(2001)。身体的cmu运动(mobo)数据库。技术报告CMU-RI-TR-01-18,宾夕法尼亚州匹兹堡机器人研究所。
[26] Guo,K.、Ishwar,P.和Konrad,J.(2010)。利用光流协方差流形上的稀疏表示进行动作识别。IEEE高级视频和信号监控国际会议(第188-195页)。电气与电子工程师协会。
[27] Harandi,M.T.、Salzmann,M.和Hartley,R.(2014a)。从流形到流形:SPD矩阵的几何软件降维。在欧洲计算机视觉会议上(第17-32页)。斯普林格·兹比尔1376.94003
[28] Harandi,M.T.、Salzmann,M.和Porikli,F.M.(2014b)。无限维协方差矩阵的Bregman发散。IEEE计算机视觉和模式识别会议(第1003-1010页)。电气与电子工程师协会。
[29] Harandi,M.T.、Sanderson,C.、Hartley,R.和Lovell,B.C.(2012年)。对称正定矩阵的稀疏编码和字典学习:一种核方法。在欧洲计算机视觉会议上,施普林格,第216-229页。
[30] 哈斯蒂,T。;Tibshirani,R。;弗里德曼,J。;富兰克林,J.,《统计学习的要素:数据挖掘、推理和预测》,《数学智能》,第27、2、83-85页(2005年)
[31] 哈亚特,M。;汗,SH;Bennamoun,M.,《为基于图像集的人脸识别赋能简单二元分类器》,《国际计算机视觉杂志》,123,1-20(2017)·doi:10.1007/s11263-017-1000-3
[32] Haykin,S.,《神经网络:综合基金会》(1998年),新泽西州上鞍河:新泽西州上鞍河Prentice Hall PTR·Zbl 0828.68103号
[33] He,K.,Zhang,X.,Ren,S.,&Sun,J.(2016)。用于图像识别的深度残差学习。在IEEE计算机视觉和模式识别会议上(第770-778页)。电气与电子工程师协会。
[34] Hsu,C.W.,Chang,C.C.,&Lin,C.J.等人(2003年)。支持向量分类实用指南
[35] Hu,J.F.,Zheng,W.S.,Lai,J.,&Zhang,J.(2015)。联合学习RGB-d活动识别的异构特征。IEEE计算机视觉和模式识别会议(第5344-5352页)。电气与电子工程师协会。
[36] Hu,J.F.,Zheng,W.S.,Pan,J.,Lai,J.和Zhang,J.(2018)。用于RGB-d动作识别的深度双线性学习。在欧洲计算机视觉会议上(第335-351页)。斯普林格。
[37] 黄,J。;张,T。;Metaxas,D.,《结构化稀疏性学习》,《机器学习研究杂志》,12,3371-3412(2011)·Zbl 1280.68169号
[38] 黄,S。;李,J。;Sun,L。;Ye,J。;Fleisher,A。;Wu,T.,通过稀疏逆协方差估计学习阿尔茨海默病的大脑连通性,NeuroImage,50,3,935-949(2010)·doi:10.1016/j.neuroimage.2009.12.120
[39] Hussein,M.E.、Torki,M.、Gowayyed,M.A.和El-Saban,M.(2013年)。在3D关节位置上使用协方差描述符的时间层次进行人体动作识别。在国际人工智能联合会议上(第2466-2472页)。
[40] Ionescu,C.、Vantzos,O.和Sminchisescu,C(2015)。结构化层深层网络的矩阵反向传播。IEEE计算机视觉国际会议(第2965-2973页)。电气与电子工程师协会。
[41] Jayasumana,S.、Hartley,R.、Salzmann,M.、Li,H.和Harandi,M.(2013)。对称正定矩阵黎曼流形上的核方法。在IEEE计算机视觉和模式识别会议上(第73-80页)。电气与电子工程师协会。
[42] Ji,Y.,Ye,G.,&Cheng,H.(2014)。用于人体交互识别的交互式身体部位对比度挖掘。在IEEE多媒体和展览研讨会国际会议(第1-6页)中,IEEE。
[43] Ke,Q.、Bennamoun,M.、An,S.、Sohel,F.和Boussaid,F.(2017年)。一种新的三维动作识别骨架序列表示方法。IEEE计算机视觉和模式识别会议(第4570-4579页)。电气与电子工程师协会。
[44] Koller博士。;弗里德曼,N.,《概率图形模型:原理和技术——自适应计算和机器学习》(2009),剑桥:麻省理工学院出版社,剑桥·Zbl 1183.68483号
[45] Koniusz,P.和Cherian,A.(2016年)。三阶超对称张量描述子的稀疏编码及其在纹理识别中的应用。在IEEE关于计算机视觉和模式识别的会议上(第5395-5403页)。电气与电子工程师协会。
[46] Koniusz,P.、Cherian,A.和Porikli,F.(2016)。基于核线性化的三维骨架动作识别张量表示。在欧洲计算机视觉会议上(第37-53页)。斯普林格。
[47] Koniusz,P.、Yan,F.、Gosselin,P.H.和Mikolajczyk,K.(2013)。中低级功能上的高阶发生池:可视化概念检测。哈尔·英里亚。
[48] Kulkarni,P.、Jurie,F.、Zepeda,J.、Pérez,P.和Chevallier,L.(2016)。Spleap:用于图像分类的学习部分的软池。在欧洲计算机视觉会议上(第329-345页)。斯普林格。
[49] Lee,I.、Kim,D.、Kang,S.和Lee,S.(2017年)。使用时间滑动LSTM网络集成基于骨架的动作识别的深度学习。IEEE计算机视觉国际会议(第1012-1020页)。电气与电子工程师协会。
[50] Lehrmann,A.M.、Gehler,P.V.和Nowozin,S.(2013)。人体姿态先验的非参数贝叶斯网络。IEEE计算机视觉国际会议(第1281-1288页)。电气与电子工程师协会。
[51] Leibe,B.和Schiele,B.(2003年)。分析基于外观和轮廓的对象分类方法。IEEE计算机视觉和模式识别会议(第2卷,第II-409页)。电气与电子工程师协会。
[52] Li,P.,&Wang,Q.(2012)。用于图像表示的局部对数核素协方差矩阵(l2ecm)及其应用。在欧洲计算机视觉会议上(第469-482页)。斯普林格。
[53] Li,P.,Xie,J.,Wang,Q.,&Zuo,W.(2017)。二阶信息有助于大规模视觉识别吗?IEEE计算机视觉国际会议(第2070-2078页)。电气与电子工程师协会。
[54] Li,S.,Li,W.,Cook,C.,Zhu,C.,&Gao,Y.(2018)。独立递归神经网络(INDRNN):构建更长、更深的RNN。IEEE计算机视觉和模式识别会议(第5457-5466页)。电气与电子工程师协会。
[55] Li,W.,Wen,L.,Chuah,M.C.,&Lyu,S.(2015)。分类盲人类行为识别:一个实用的识别系统。在IEEE国际计算机视觉会议上(第4444-4452页)。电气与电子工程师协会。
[56] Lin,T.Y.、RoyChowdhury,A.和Maji,S.(2015)。用于细粒度视觉识别的双线性cnn模型。IEEE计算机视觉国际会议(第1449-1457页)。电气与电子工程师协会。
[57] 林,TY;罗伊·乔杜里,A。;Maji,S.,用于细粒度视觉识别的双线性卷积神经网络,IEEE模式分析和机器智能汇刊,40,6,1309-1322(2017)·doi:10.1109/TPAMI.2017.2723400
[58] Liu,J.、Shahroudy,A.、Xu,D.和Wang,G.(2016)。具有用于3D人类动作识别的信任门的时空LSTM。在欧洲计算机视觉会议上(第816-833页)。斯普林格。
[59] Liu,J.、Wang,G.、Hu,P.、Duan,L.Y.和Kot,A.C.(2017年)。用于3D动作识别的全球上下文软件关注LSTM网络。在IEEE计算机视觉和模式识别会议上(第7卷,第43页)。电气与电子工程师协会。
[60] 明绍森,N。;Bühlmann,P.,用套索选择高维图和变量,《统计年鉴》,341436-1462(2006)·Zbl 1113.62082号 ·doi:10.1214/0090536000000281
[61] Müller,M.、Baak,A.和Seidel,H.P.(2009年)。高效可靠的运动捕捉数据注释。美国新奥尔良ACM SIGGRAPH/欧洲制图计算机动画研讨会(第17-26页)。
[62] Ohn-Bar,E.和Trivedi,M.(2013)。关节角度相似性和hog2用于动作识别。在IEEE计算机视觉和模式识别研讨会上(第465-470页)。电气与电子工程师协会。
[63] Oquab,M.、Bottou,L.、Laptev,I.和Sivic,J.(2015)。对象本地化是免费的吗-卷积神经网络的弱监督学习。IEEE计算机视觉和模式识别会议(第685-694页)。电气与电子工程师协会。
[64] Oreifej,O.,&Liu,Z.(2013)。Hon4d:用于深度序列活动识别的定向4d法线直方图。IEEE计算机视觉和模式识别会议(第716-723页)。电气与电子工程师协会。
[65] Pang,Y。;袁,Y。;Li,X.,高维空间中的有效特征提取,IEEE系统、人与控制论汇刊B部分,控制论,38,6,1652-1656(2008)·doi:10.1109/TSMCB.2008.927276
[66] Pang,Y。;袁,Y。;Li,X.,Gabor人脸识别区域协方差矩阵,IEEE视频技术电路和系统汇刊,18,7,989-993(2008)·doi:10.1109/TCSVT.2008.924108
[67] Park,J.(2007)。多元统计中的数字相关矩阵及其在成分选择和动态相关建模中的应用。ProQuest。
[68] 菲利普斯,PJ;Moon,H。;南非里兹维;Rauss,PJ,人脸识别算法的FERET评估方法,IEEE模式分析和机器智能汇刊,22,10,1090-1104(2000)·doi:10.1009/34.879790
[69] Póczos,B.、Xiong,L.、Sutherland,D.J.和Schneider,J.G.(2012)。图像分类的非参数核估计。IEEE计算机视觉和模式识别会议(第2989-2996页)。电气与电子工程师协会。
[70] Porikli,F.、Tuzel,O.和Meer,P.(2006)。基于李代数的模型更新协方差跟踪。IEEE计算机视觉和模式识别会议(第728-735页)。电气与电子工程师协会。
[71] Quang,M.H.、Biagio,M.S.和Murino,V.(2014)。希尔伯特空间上正定算子之间的对数希尔伯特-施密特度量。神经信息处理系统会议(第388-396页)。
[72] Randen,T。;Husoy,JH,《纹理分类过滤:比较研究》,IEEE模式分析和机器智能汇刊,21,4,291-310(1999)·数字对象标识代码:10.1109/34.761261
[73] Romero,A.、Gouiffès,M.和Lacassagne,L.(2013)。用于纹理分析和对象跟踪的增强局部二进制协方差矩阵(ELBCM)。在计算机视觉/计算机图形协作技术和应用国际会议上(第1-8页)。
[74] 俄勒冈州Russakovsky。;Deng,J.,ImageNet大规模视觉识别挑战,国际计算机视觉杂志,115,3,211-252(2015)·doi:10.1007/s11263-015-0816-y
[75] Schölkopf,B。;斯莫拉,AJ;Bach,F.,《使用内核学习:支持向量机、正则化、优化和超越》(2002),剑桥:麻省理工学院出版社,剑桥
[76] Shahroudy,A.、Liu,J.、Ng,T.T.和Wang,G.(2016)。NTU RGB+D:用于三维人类活动分析的大规模数据集。IEEE计算机视觉和模式识别会议(第1010-1019页)。电气与电子工程师协会。
[77] Shahroudy,A。;Ng,TT;龚,Y。;Wang,G.,RGB+d视频中动作识别的深度多模态特征分析,IEEE模式分析和机器智能汇刊,40,1045-1058(2017)·doi:10.1109/TPAMI.2017.2691321
[78] Shi,L.,Zhang,Y.,Cheng,J.,&Lu,H.(2019)。基于骨架的动作识别的双流自适应图卷积网络。IEEE计算机视觉和模式识别会议(第12026-12035页)。
[79] Si,C.,Jing,Y.,Wang,W.,Wang.,L.,&Tan,T.(2018)。基于骨架的动作识别,具有空间推理和时间堆栈学习。在欧洲计算机视觉会议上(第103-118页)。
[80] Simonyan,K.和Zisserman,A.(2014)。用于大规模图像识别的深度卷积网络。arXiv预打印arXiv:1409.1556。
[81] 史密斯,SM;密勒,吉隆坡;萨利米·霍尔希迪,G。;韦伯斯特,M。;CF贝克曼;Nichols,TE,FMRI的网络建模方法,神经影像,54,2,875-891(2011)·doi:10.1016/j.neuroimage.2010.08.063
[82] Song,S.、Lan,C.、Xing,J.、Zeng,W.和Liu,J.(2017)。基于骨架数据的人类行为识别的端到端时空注意模型。在AAAI人工智能会议上(第4263-4270页)。
[83] Sra,S.(2011年)。正定矩阵与对称stein散度。arXiv预打印arXiv:1110.1773。
[84] Sun,H.、Zhen,X.、Zheng,Y.、Yang,G.、Yin,Y.和Li,S.(2017)。学习深度匹配核函数进行图像分类。IEEE计算机视觉和模式识别会议(第3307-3316页)。
[85] Tabia,H.、Laga,H.,Picard,D.和Gosselin,P.H.(2014)。用于3D形状匹配和检索的协方差描述符。IEEE计算机视觉和模式识别会议(第4185-4192页)。电气与电子工程师协会。
[86] Tuzel,O.、Porikli,F.和Meer,P.(2006)。区域协方差:用于检测和分类的快速描述符。在欧洲计算机视觉会议上(第589-600页)。斯普林格。
[87] Tuzel,O。;波里克利,F。;Meer,P.,通过黎曼流形分类进行行人检测,IEEE模式分析和机器智能汇刊,30,10,1713-1727(2008)·doi:10.1109/TPAMI.2008.75
[88] Vedaldi,A.和Lenc,K.(2015)。Matconvnet–用于matlab的卷积神经网络。在ACM多媒体国际会议上。
[89] Vedaldi,A。;Zisserman,A.,《通过显式特征映射实现高效加性核》,IEEE模式分析和机器智能学报,34,3,480-492(2012)·doi:10.1109/TPAMI.2011.153
[90] Vemulapalli,R.、Arrate,F.和Chellappa,R.(2014)。通过将3D骨骼表示为谎言组中的点来识别人类行为。IEEE计算机视觉和模式识别会议(第588-595页)。电气与电子工程师协会。
[91] Wang,L。;休恩,DQ;Koniusz,P.,最新基于运动的动作识别算法的比较综述,IEEE图像处理汇刊,29,15-28(2019)·Zbl 07585858号 ·doi:10.1109/TIP.2019.2925285
[92] Wang,L.,Zhang,J.,Zhou,L.、Tang,C.和Li,W.(2015a)。超越协方差:非线性核矩阵的特征表示。IEEE计算机视觉国际会议(第4570-4578页)。电气与电子工程师协会。
[93] Wang,Q.,Li,P.,Hu,Q.(2019b),Zhu,P..,&Zuo,W.(2019年b)。深全局广义高斯网络。IEEE计算机视觉和模式识别会议(第5080-5088页)。电气与电子工程师协会。
[94] Wang,Q.,Xie,J.,Zuo,W.,Zhang,L.,&Li,P.(2019c)。深度CNNS满足全球协方差池:更好的表示和泛化。arXiv预印arXiv:1904.06836。
[95] Wang,R.、Guo,H.和Davis,L.S.(2012年)。协方差判别学习:一种自然有效的图像集分类方法。IEEE计算机视觉和模式识别会议(第2496-2503页)。电气与电子工程师协会。
[96] Wang,W.、Wang,R.、Huang,Z.、Shan,S.和Chen,X.(2015b)。图像集人脸识别中高斯分布黎曼流形的判别分析。IEEE计算机视觉和模式识别会议(第2048-2057页)。电气与电子工程师协会。
[97] Wei,Z.和Hoai,M.(2016)。用于图像分类的区域排序SVM。IEEE计算机视觉和模式识别会议(第2987-2996页)。电气与电子工程师协会。
[98] Wei,Y.、Xia,W.、Huang,J.、Ni,B.、Dong,J.和Zhao,Y.等人(2014)。CNN:从单标签到多标签。arXiv预打印arXiv:1406.5726。
[99] Wolf,L.、Hassner,T.和Maoz,I.(2011年)。具有匹配背景相似性的无约束视频中的人脸识别。IEEE计算机视觉和模式识别会议(第529-534页)。电气与电子工程师协会。
[100] 吴,Y。;马,B。;Jia,Y.,使用基于核的区域协方差描述符的差分跟踪,Pattern Anal Appl,18,1,45-59(2015)·doi:10.1007/s10044-014-0430-6
[101] Yan,S.、Xiong,Y.和Lin,D.(2018)。基于骨架的动作识别的时空图卷积网络。AAAI人工会议,。智慧。
[102] Yang,X.和Tian,Y.(2014)。使用深度序列进行活动识别的超正规向量。IEEE计算机视觉和模式识别会议(第804-811页)。电气与电子工程师协会。
[103] Yuan,C.、Hu,W.、Li,X.、Maybank,S.J.和Luo,G.(2009)。对数核素黎曼度量下的人类行为识别。在亚洲计算机视觉会议上(第343-353页)。
[104] Yun,K.、Honorio,J.、Chattopadhyay,D.、Berg,T.L.和Samaras,D.(2012a)。使用身体姿势特征和多实例学习的两人交互检测。在IEEE计算机视觉和模式识别研讨会上(第28-35页)。电气与电子工程师协会。
[105] Yun,K.、Honorio,J.、Chattopadhyay,D.、Berg,T.L和Samaras,D.(2012b)。使用身体姿势特征和多实例学习的两人交互检测。IEEE计算机学会计算机视觉和模式识别研讨会(第28-35页)。电气与电子工程师协会。
[106] Zhang,P.,Lan,C.,Xing,J.,Zeng,W.,Xue,J.和Zheng,N.(2017a)。查看自适应递归神经网络,用于从骨骼数据进行高性能的人类行为识别。IEEE计算机视觉国际会议(第2136-2145页)。电气与电子工程师协会。
[107] Zhang,S.、Liu,X.和Xiao,J.(2017b)。基于骨架的多层lstm网络动作识别的几何特征。在IEEE关于计算机视觉应用的冬季会议上(第148-157页)。电气与电子工程师协会。
[108] 朱伟、兰C.、邢J.、曾伟、李Y.、沈L.等(2016)。共现特征学习用于基于骨架的动作识别,使用正则化的深层LSTM网络。在AAAI人工智能会议上(第3697-3703页)。
[109] Zunino,A.、Cavazza,J.和Murino,V.(2017)。重新审视人类行为识别:个性化与泛化。在图像分析和处理国际会议上(第469-480页)。斯普林格。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。