×

基于人类初级视觉皮层结构的傅里叶描述子及其在物体识别中的应用。 (英语) Zbl 1425.68365号

小结:在本文中,我们提出了一种利用新的全局特征并受人类初级视觉皮层V1作为半离散旋转翻译组(mathrm{SE}(2,N)={mathbb{Z}}_N\times{mathbb2{R}}^2)模型启发的有监督目标识别方法。该技术基于后一组的广义傅里叶描述子,这些描述子对自然几何变换(旋转、平移)是不变的。然后,使用这些描述符输入SVM分类器。我们在COIL-100图像数据库和ORL人脸数据库上测试了我们的方法,并将其与基于传统描述子的其他技术(全局和局部)进行了比较。所得结果表明,我们的方法看起来非常有效,并且对噪声非常稳定,在这种情况下,它优于本文分析的其他技术。

MSC公司:

68吨10 模式识别、语音识别
43A30型 非贝拉群和半群上的Fourier变换和Fourier-Stieltjes变换等。
68T05型 人工智能中的学习和自适应系统
94A08型 信息与通信理论中的图像处理(压缩、重建等)
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Barut,A.,Raçzka,R.:群表示理论及其应用。新加坡世界科学(1977)·Zbl 0471.22021号
[2] H.海湾。;Tuytelaars,T。;Van Gool,L.,《冲浪:加速强大功能》,404-417(2006),海德堡·doi:10.1007/11744023_32
[3] Boscain,U.,Dupleix,J.,Gauthier,J.P.,Rossi,F.:通过亚椭圆扩散进行拟人图像重建。SIAM J.控制优化。50, 1-25 (2012) ·Zbl 1259.94011号 ·数字对象标识码:10.1137/1082405X
[4] Boscain,U.,Chertovskih,R.,Gauthier,J.P.,Remizov,A.:超椭圆扩散和人类视觉:小理论的半离散新转折。SIAM J.成像科学。7(2),669-695(2014a)·Zbl 1343.94002号 ·doi:10.1137/130924731
[5] Boscain,U.,Gauthier,J.P.,Prandi,D.,Remizov,A.:通过Dubins/Reed-Shepp-like控制系统中的非各向同性扩散进行图像重建。摘自:第53届IEEE决策与控制会议,第4278-4283页(2014b)·Zbl 1255.68174号
[6] Bressloff,P.、Cowan,J.、Golubitsky,M.、Thomas,P.、Wiener,M.:几何视觉幻觉、欧几里得对称性和纹状体皮层的功能结构。菲洛斯。变速器。R.Soc.伦敦。序列号。生物科学B。356, 299-330 (2001) ·doi:10.1098/rstb.2000.0769
[7] Choksuriwong,A.,Emile,B.,Rosenberger,C.,Lauren,H.:用于对象识别的全局不变描述符的比较研究。《电子杂志》。成像17,1-35(2008)
[8] Chong,C.,Raveendran,P.,Mukundan,R.:Zernike矩快速计算算法的比较分析。模式识别。36(3),731-742(2003a)·Zbl 1028.68142号 ·doi:10.1016/S0031-3203(02)00091-2
[9] Chong,C.W.,Raveendran,P.,Mukundan,R.:zernike矩的平移不变量。模式识别。36(8),1765-1773(2003b)·Zbl 1055.68135号 ·doi:10.1016/S0031-3203(02)00353-9
[10] Chou,J.,O'Neill,W.,Cheng,H.:使用神经网络进行路面破损分类。1994年IEEE系统、人和控制论国际会议,1994年。《人类、信息与技术》,第1卷,第397-401页。doi:10.1109/ICSMC.1994.399871(1994)
[11] Citti,G.,Sarti,A.:旋转翻译空间中基于皮层的感知完成模型。模式识别。24(3), 307-326 (2006) ·2008年8月9日Zbl
[12] Dalal,N.,Triggs,B.:人体检测定向梯度直方图。摘自:IEEE计算机学会计算机视觉和模式识别会议,2005年。CVPR 2005,IEEE,第1卷,第886-893页(2005)·Zbl 1372.94086号
[13] Derrode,S.,Ghorbel,F.:用于不变灰度图像描述和重建的稳健且有效的四层线性变换近似。计算。视觉。图像理解。83(1), 57-78 (2001) ·Zbl 0972.68561号 ·doi:10.1006/cviu.2001.0922
[14] Dubnov,S.、Tishby,N.、Cohen,D.:多光谱作为声音纹理和音色的度量。计算。视觉。图像理解。26(4),277-314(1997)
[15] Duits,R.,Franken,E.:SE(2)上的左变抛物线演化和通过可逆定向得分的轮廓增强。第一部分:SE(2)上的线性左变扩散方程。问:申请。数学。68, 255-292 (2010) ·Zbl 1202.35334号 ·doi:10.1090/S0033-569X-10-01172-0
[16] Duits,R.,Franken,E.:SE(2)上的左变抛物线演化和通过可逆定向得分的轮廓增强。第二部分:可逆取向分数的非线性左-内变量扩散。问:申请。数学。68, 1-38 (2010) ·Zbl 1205.35326号
[17] Führ,H.,Mayer,M.:半直积的连续小波变换:循环表示和Plancherel测度。J.傅里叶分析。申请。8(4):1-23. http://www.springerlink.com/index/G7TC4AANGTUC4HXW.pdf,0102002v1(2002)·Zbl 1100.42030号
[18] Galerne,B.,Gousseau,Y.,Morel,J.:随机相纹理:理论与合成。IEEE传输。图像处理。20(1), 257-267 (2011) ·Zbl 1372.94086号 ·doi:10.1109/TIP.2010.2052822
[19] Granlund,G.H.:手印字符识别的傅里叶预处理。IEEE传输。图像处理。C-21(2),195-201(1972)·Zbl 0232.68042号
[20] 休伊特,E.,罗斯,K.:《抽象谐波分析——第1卷》。施普林格,柏林/纽约(1963年)·Zbl 0115.10603号 ·doi:10.1007/978-3-662-40409-6
[21] Hjelmas,E.,Low,B.:面部检测:一项调查。计算。视觉。图像理解。83(3), 236-274 (2001) ·Zbl 0999.68196号 ·doi:10.1006/cviu.2001.0921
[22] Hu,M.:基于不变矩的视觉模式识别。计算。视觉。图像理解。8(2), 179-187 (1962) ·Zbl 0102.13304号
[23] Hubel,D.,Wiesel,T.:猫纹状体皮层中单个神经元的感受野。计算。视觉。图像理解。148, 574-591 (1959)
[24] Kakarala,R.:双谱作为傅里叶描述子相敏不变量的来源:群论方法。计算。视觉。图像理解。44(3),341-353(2012)·Zbl 1255.68174号
[25] Ke,Y.,Sukthankar,R.:Pca-sift:局部图像描述符的更独特表示。2004年IEEE计算机学会计算机视觉和模式识别会议论文集,2004年。CVPR 2004。IEEE,第2卷,第II-506页(2004年)
[26] Kuhl,F.P.,Giardina,C.R.:闭合轮廓的椭圆傅立叶特征。计算。视觉。图像理解。18(3), 236-258 (1982)
[27] Lowe,D.:不同尺度变化关键点的独特图像特征。计算。视觉。图像理解。60(2), 91-110 (2004)
[28] Mikolajczyk,K.,Schmid,C.:局部描述符的性能评估。计算。视觉。图像理解。27(10), 1615-1630 (2005)
[29] Milgram,J.、Cheriet,M.、Sabourin,R.:“一对一”或“一对所有”:哪一个更适合SVM的手写识别?摘自:Lorette,G.(编辑)第十届笔迹识别前沿国际研讨会,雷恩大学1号,苏维索夫特,拉博尔。http://www.suvisoft.com (2006)
[30] Morel,J.M.,Yu,G.:Asift:全仿射不变图像比较的新框架。计算。视觉。图像理解。2(2), 438-469 (2009) ·Zbl 1181.68252号
[31] Nene,S.A.、Nayar,S.K.、Murase,H.等人:哥伦比亚物体图像库(线圈-20)。技术代表,技术报告CUCS-005-96(1996)
[32] Petitot,J.:视觉神经-数学模型与建筑功能体格。法国理工学院(2008)
[33] Prandi,D.,Boscain,U.,Gauthier,J.P.:旋转翻译半离散组中的图像处理。发表于:《第二届信息几何科学会议论文集》(2015年)·Zbl 1406.94005号
[34] Raja,D.M.S.,Shanmugam,A.:使用不变矩和glcm特征基于人工神经网络的战争场景分类:比较研究。国际工程科学杂志。Technol公司。3(2), 1189-1195 (2011)
[35] Rajasekaran,S.,Pai,G.V.:使用简化的模糊艺术地图和基于矩的特征提取器进行图像识别。国际J模式识别。Artif公司。智力。14(08), 1081-1095 (2000) ·doi:10.1142/S0218001400000684
[36] Samaria,F.,Harter,A.:人脸识别随机模型的参数化。摘自:1994年IEEE第二届计算机视觉应用研讨会论文集,第138-142页(1994)
[37] Sifre,L.,Mallat,S.:用于纹理识别的旋转、缩放和变形不变散射。2013年IEEE计算机视觉和模式识别会议(CVPR),第1233-1240页。doi:10.1010/CVPR.2013.163(2013)·Zbl 1343.94002号
[38] Smach,F.,Lemaêtre,C.,Gauthier,J.P.,Miteran,J.,Atri,M.:广义傅里叶描述子及其在SVM上下文中对象识别中的应用。国际J模式识别。Artif公司。智力。30, 43-71 (2008) ·兹比尔1523.68119
[39] Vapnik,V.N.,Vapnik,V.:《统计学习理论》,第1卷。威利,纽约(1998)·Zbl 0935.62007号
[40] Zahn,C.T.,Roskies,R.Z.:平面闭合曲线的傅里叶描述符。IEEE传输。计算。C-21(3),269-281(1972)·Zbl 0231.68042号 ·doi:10.1109/TC.1972.5008949
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。