×

用于图像模式识别的特征空间的降维和构造。 (英语) Zbl 1357.68194号

摘要:我们从数学和实验上评估了降维方法在图像模式识别中计算相似度的有效性。图像模式识别识别特定对象的实例并区分图像之间的差异。这种识别使用模式识别技术对图像进行分类和分类。在数字图像模式识别技术中,使用像素阵列对图像进行采样。此采样过程从图像模式导出高维度量空间中的向量。为了确保模式识别技术的准确性,向量的降维是一种重要的方法,因为处理的时间和空间复杂性取决于数据的维数。降维导致图像模式的拓扑和几何特征信息丢失。通过理论和实验比较,我们阐明了保持图像模式空间拓扑和几何的降维方法对于线性模式识别至关重要。在降维方法的实际应用中,如果我们没有输入数据的先验信息,与下采样、金字塔变换、二维随机投影、二维离散余弦变换和非线性多维缩放相比,随机投影的效果很好。

MSC公司:

68吨10 模式识别、语音识别
68单位05 计算机图形;计算几何(数字和算法方面)
68单位10 图像处理的计算方法
PDF格式BibTeX公司 XML格式引用
全文: DOI程序

参考文献:

[1] Turk,M.,Pentland,A.:识别特征脸。J.认知。神经科学。3(1), 71-86 (1991) ·doi:10.1162/jocn.1991.3.1.71
[2] Maeda,K.:从子空间方法到相互子空间方法。《计算机视觉》,第285卷,第135-156页。柏林施普林格出版社(2010年)
[3] Murase,H.、Nayar,S.K.:使用参数特征空间进行物体识别的照明规划。IEEE传输。模式分析。机器。智力。16, 1219-1227 (1994) ·doi:10.1109/34.387485
[4] Park,C.H.,Park,H.:使用快速傅里叶变换和非线性判别分析进行指纹分类。模式识别。38495-503(2005年)·Zbl 1079.68608号 ·doi:10.1016/j.patcog.2004.08.013
[5] Park,H.A.,Park,K.R.:使用SVM基于分数级融合的虹膜识别。模式识别。莱特。28, 2019-2028 (2007) ·Zbl 1366.93562号 ·doi:10.1016/j.patrec.2007.05.017
[6] Csurka,G.,Dance,C.,Fan,L.,Willamowski,J.,Bray,C.:用大量关键点进行视觉分类。摘自:ECCV计算机视觉统计学习研讨会论文集,第1-22页(2004年)·Zbl 0831.68098号
[7] Van der Maaten,L.J.P.,Postma,E.O.,Vanden Herik,H.J.:维度缩减:比较评论。蒂尔堡大学技术报告(2009年)·Zbl 1102.68601号
[8] 伯特·P.J.、阿德尔森·E.H.:拉普拉斯金字塔是一种紧凑的图像代码。IEEE传输。Commun公司。31, 532-540 (1983) ·doi:10.1109/TCOM.1983.1095851
[9] 卡尔松,A.:非扩张映射、布斯曼函数和乘法遍历理论。摘自:《动力学和几何中的刚性》,第283-294页。斯普林格(2002)·Zbl 1035.37015号
[10] Borgefors,G.、Ramella,G.和di Baja,G.S.:用于多分辨率骨架化的形状和拓扑保持多值图像金字塔。模式识别。莱特。22, 741-751 (2001) ·兹比尔1010.68905 ·doi:10.1016/S0167-8655(01)00002-2
[11] Kropatsch,W.G.,Haxhimusa,Y.,Pizlo,Z.,Langs,G.:不会长得太高的视觉金字塔。模式识别。莱特。26, 319-337 (2005) ·doi:10.1016/j.patrec.2004.10.026
[12] Lu,H.,Plataniotis,K.N.,Venetsanopoulos,A.N.:张量数据的多线性子空间学习综述。模式识别。44, 1540-1551 (2011) ·Zbl 1210.68083号 ·doi:10.1016/j.patcog.2011.01.004
[13] Yang,J.,Zhang,D.,Frangi,A.F.,Yang,J-Y.:二维PCA:基于外观的人脸表示和识别的新方法。IEEE传输。模式分析。机器。智力。26, 131-137 (2004) ·doi:10.1109/TPAMI.2004.1261097
[14] Otsu,N.:模式识别中特征提取的数学研究。电工实验室博士论文(1981年)
[15] Aase,S.O.,Husoy,J.H.,Waldemar,P.:基于SVD的图像编码系统的评论。程序。IEEE国际标准。电路系统。4, 13-16 (1999)
[16] Ding,C.,Ye,J.:2D地图和图像的二维奇异值分解(2DSVD)。摘自:SIAM国际数据挖掘会议记录,第32-43页(2005)
[17] Ye,J.,Janardan,R.,Qi,L.:GPCA:一种用于图像压缩和检索的高效降维方案。摘自:ACM SIGKDD知识发现和数据挖掘国际会议记录,第354-363页(2004)
[18] Moore,J.B.,Mahony,R.E.,Helmke,U.:特征值和奇异值计算的数值梯度算法。SIAM J.矩阵分析。申请。15, 881-902 (1994) ·Zbl 0808.65031号 ·doi:10.1137/S0036141092229732
[19] Lu,H.,Plataniotis,K.N.,Venetsanopoulos,A.N.:MPCA:张量对象的多线性主成分分析。IEEE传输。神经网络。19(1), 18-39 (2008) ·doi:10.1109/TNN.2007.901277
[20] Lathauwer,L.D.,Moor,BDe,Vandewalle,J.:多重线性奇异值分解。SIAM J.矩阵分析。申请。21(4), 1253-1278 (2000) ·Zbl 0962.15005号 ·doi:10.1137/S0895479896305696
[21] Wang,H.,Ahuja,N.:使用张量随机一分解的多维数据的紧凑表示。摘自:《模式识别国际会议记录》,第1卷,第44-47页(2004年)·兹比尔1077.68802
[22] Lu,H.,Plataniotis,K.N.,Venetsanopoulos,A.N.:无监督多线性子空间学习的不相关多线性主成分分析。IEEE传输。神经网络。20(11), 1820-1836 (2009) ·doi:10.1109/TNN.2009.2031144
[23] Allen,G.I.:稀疏高阶主成分分析。载:《国际人工智能与统计会议论文集》,第27-36页(2012年)
[24] Johnson,W.,Lindenstrauss,J.:将Lipschitz映射扩展到Hilbert空间。康斯坦普。数学。26, 189-206 (1984) ·Zbl 0539.46017号 ·doi:10.1090/conm/026/737400
[25] Arya,S.,Mount,D.M.,Netanyahu,N.S.,Silverman,R.,Wu,A.Y.:在固定维中进行近似最近邻搜索的最佳算法。摘自:ACM-SIAM离散算法研讨会论文集,第573-582页(1994年)·Zbl 0871.68068号
[26] Achlioptas,D.,McSherry,F.:低阶矩阵近似的快速计算。J.ACM 54(2),9(2007)·Zbl 1311.94031号 ·数字对象标识代码:10.1145/1219092.1219097
[27] Sakai,T.,Imiya,A.:光谱聚类的实用算法:面向大规模基于视觉的运动分析。摘自:基于视觉的运动分析的机器学习,第3-26页。施普林格(2011)
[28] Baraniuk,R.G.,Wakin,M.B.:光滑流形的随机投影。已找到。计算。数学。9, 51-77 (2009) ·Zbl 1172.53005号 ·doi:10.1007/s10208-007-9011-z
[29] Bingham,E.,Mannila,H.:降维中的随机投影:图像和文本数据的应用。摘自:《知识发现和数据挖掘国际会议论文集》,第245-250页(2001年)·Zbl 1154.51002号
[30] 阿奇利奥普塔斯(Achlioptas,D.):数据库友好型随机投影:Johnson-Lindenstraus与二进制货币。J.计算。系统。科学。66, 671-687 (2003) ·Zbl 1054.68040号 ·doi:10.1016/S0022-0000(03)00025-4
[31] Watanabe,T.、Takimoto,E.、Amano,K.、Maruoka,A.:随机投影及其在学习中的应用。摘自:《随机性与计算研讨会论文集》,第3-4页(2005年)
[32] Matousek,J.:关于Johnson-Lindenstraus引理的变体。随机结构。算法33,142-156(2008)·Zbl 1154.51002号 ·doi:10.1002/rsa.20218
[33] Ailon,N.,Liberty,E.:几乎最优的无限制快速Johnson-Lindenstraus变换。ACM事务处理。算法9,21:1-211:2(2013)·兹比尔1301.68233 ·doi:10.1145/2483699.2483701
[34] Schölkopf,B.,Smola,A.,Müller,K.-R.:作为核心特征值问题的非线性分量分析。神经计算。10, 1299-1319 (1998) ·doi:10.1162/08997669830017467
[35] Borg,I.,Groenen,P.:《现代多维尺度:理论与应用》,第2版。施普林格,纽约(2005)·Zbl 1085.62079号
[36] Williams,C.K.I.:关于内核PCA和度量多维缩放之间的联系。机器。学习。46, 11-19 (2002) ·Zbl 1052.68118号 ·doi:10.1023/A:1012485807823
[37] Tenenbaum,J.B.,de Silva,V.,Langford,J.C.:非线性降维的全球几何框架。《科学》290,2319-2323(2000)·Zbl 0955.37025号 ·doi:10.1126/science.290.5500.2319
[38] Roweis,S.T.,Saul,L.K.:通过局部线性嵌入降低非线性维数。《科学》2902323-2326(2000)·doi:10.1126/science.290.5500.2323
[39] Venna,J.,Kaski,S.:局部多维标度。神经网络。19, 889-899 (2006) ·Zbl 1102.68601号 ·doi:10.1016/j.neunet.2006.05.014
[40] Vidal,R.,Yi,M.,Sastry,S.:广义主成分分析(GPCA)。IEEE传输。模式分析。机器。智力。1945年-1959年(2005年)·doi:10.1109/TPAMI.2005.244
[41] Goh,A.,Vidal,R.:黎曼流形上的聚类和降维。摘自:IEEE计算机视觉和模式识别会议记录,第1-7页(2008年)·Zbl 0962.15005号
[42] Harandi,M.T.,Salzmann,M.,Hartley,R.:从流形到流形:PD矩阵的几何软件降维。程序。Eur.Conf.计算。视觉。8690, 17-32 (2014) ·Zbl 1376.94003号
[43] Fisher,R.A.:分类问题中多重测量的使用。安·尤根。7, 179-188 (1936) ·文件编号:10.1111/j.1469-1809.1936.tb02137.x
[44] Vapnik,V.,Lerner,A.:使用广义肖像法的模式识别。自动化。遥控器24,774-780(1963)
[45] Iijima,T.:模式识别理论。《日本的电子与通信》,第123-134页(1963年)
[46] Watanabe,S.:Karhunen-Loeve扩展和因子分析。摘自:第四届布拉格信息理论会议论文集,统计决策函数,随机过程,第635-660页(1967)
[47] Itoh,H.,Sakai,T.,Kawamoto,K.,Imiya,A.:图像模式识别的保拓扑降维方法。摘自:《斯堪的纳维亚图像分析会议记录》,第195-204页(2013年)
[48] Fukui,K.,Maki,A.:基于子空间的方法的差分子空间及其推广。IEEE传输。模式分析。机器。智力。,第1-1页,印刷版(2015年)
[49] Cock,K.D.,Moor,B.D.:ARMA模型之间的子空间角度。系统。控制信函。46, 265-270 (2002) ·Zbl 0994.93057号 ·doi:10.1016/S0167-6911(02)00135-4
[50] Hamm,J.,Lee,D.D.:格拉斯曼判别分析:基于子空间学习的统一观点。摘自:《机器学习国际会议论文集》,第376-383页(2008)
[51] Boser,E.,Guyon,I.,Vapnik,V.:最佳边缘分类器的训练算法。摘自:《计算学习理论研讨会论文集》,第144-152页(1992年)
[52] Cortes,C.,Vapnik,V.:支持向量网络。机器。学习。20(3), 273-297 (1995) ·Zbl 0831.68098号
[53] Hsu,C.-W.,Lin,C.-J.:多类支持向量机方法的比较。IEEE传输。神经网络。13, 415-425 (2002) ·doi:10.1109/TNN.2002.1000139
[54] Sivic,J.,Zisserman,A.:对作为文本检索的视频进行高效的视觉搜索。IEEE传输。模式分析。机器。因特尔。31, 591-606 (2009) ·doi:10.10109/TPAMI.2008.111
[55] Jégou,H.,Perronnin,F.,Douze,M.,Sanchez,J.,Perez,P.,Schmid,C.:将局部图像描述符聚合为紧凑代码。IEEE传输。模式分析。机器。智力。34, 1704-1716 (2012) ·doi:10.1109/TPAMI.2011.235
[56] Vempala,S.S.:随机投影法。美国数学学会,普罗维登斯(2004)·Zbl 1058.68063号
[57] Magen,A.:保留体积和到仿射空间距离的维数缩减及其算法应用。程序。计算机中的随机化和近似技术。《科学》2483,239-253(2002)·Zbl 1028.68228号
[58] Agarwal,P.K.,Har-Peled,S.,Yu,H.:欧几里德空间中曲面、曲线和移动点的嵌入。摘自:《计算几何年度研讨会论文集》,第381-389页(2007年)·Zbl 1221.51025号
[59] Dasgupta,S.,Gupta,A.:Johnson—Lindenstrauss引理的初等证明。技术报告,加州大学伯克利分校(1996)
[60] Helmke,U.,Moore,J.B.:通过梯度流和自等价流的奇异值分解。线性代数应用。169, 223-248 (1992) ·Zbl 0763.65022号 ·doi:10.1016/0024-3795(92)90180-I
[61] Liang,Z.,Shi,P.:矩阵广义低阶近似的分析算法。模式识别。38, 2213-2216 (2005) ·Zbl 1077.68802号 ·doi:10.1016/j.patcog.2005.04.012
[62] Itoh,H.、Sakai,T.、Kawamoto,K.、Imiya,A.:图像模式识别的降维方法。摘自:《基于相似性的模式识别国际研讨会论文集》,第26-42页(2013)
[63] 澳大利亚比约克。,Golub,G。H.:计算线性子空间之间角度的数值方法。数学。计算。27, 579-594 (1975) ·Zbl 0282.65031号 ·doi:10.2307/2005/5662
[64] Golub,G.H.,Van Loan,C.F.:矩阵计算。约翰·霍普金斯大学出版社,巴尔的摩(1996)·兹比尔0865.65009
[65] Georghiades,A.S.,Belhumeur,P.N.,Kriegman,D.J.:从少到多:可变光照和姿势下人脸识别的照明锥模型。IEEE传输。模式分析。机器。智力。23, 643-660 (2001) ·doi:10.1109/34.927464
[66] Samaria,F.,Harter,A.:人脸识别随机模型的参数化。在:IEEE计算机视觉应用研讨会论文集(1994)
[67] Leibe,B.,Schiele,B.:分析基于外观和轮廓的对象分类方法。收录于:IEEE计算机视觉和模式识别会议记录第2卷,第409-415页(2003)
[68] Mobahi,H.,Collobert,R.,Weston,J.:视频中时间连贯的深度学习。摘自:机器学习国际会议论文集(2009年)
[69] LeCun,Y.、Bottou,L.、Bengio,Y.和Haffner,P.:基于梯度的学习应用于文档识别。程序。IEEE 86,2278-2324(1998)·数字对象标识代码:10.1109/5.726791
[70] 斋藤,T.,山田浩,山田浩,K.:关于JIS汉字手印字符数据库ETL9及其分析。IEICE传输。J68-D、757-764(1985)
[71] Fei-Fei,L.,Fergus,R.,Perona,P.:从少数训练示例中学习生成性视觉模型:一种对101个对象类别进行测试的增量贝叶斯方法。计算。视觉。图像理解。106, 59-70 (2007) ·doi:10.1016/j.cviu.2005.09.012
[72] Everingham,M.,Van Gool,L.,Williams,C.K.I.,Winn,J.,Zisserman,A.:2010年PASCAL视觉对象类挑战赛(VOC2010)结果。http://www.pascal-network.org/challenges/VOC/voc2010/workshop/index。html格式
[73] Wright,J.,Yang,A.Y.,Ganesh,A.,Sastry,S.S.,Ma,Y.:通过稀疏表示实现鲁棒人脸识别。IEEE传输。模式分析。机器。智力。31, 210-227 (2009) ·doi:10.1109/TPAMI.2008.79
[74] Kim,T.-K.,Kittler,J.,Cipolla,R.:使用规范相关性的图像集类的判别学习和识别。IEEE传输。模式分析。机器。智力。29, 1005-1018 (2007) ·doi:10.1109/TPAMI.2007.1037
[75] Liu,H.,Ding,X.:使用梯度特征和二次分类器以及多种判别方案的手写字符识别。摘自:《文件分析和识别国际会议记录》,第19-23页(2005年)
[76] He,K.,Zhang,Z.,Ren,S.,Jian,S.:用于视觉识别的深层卷积网络中的空间金字塔池。摘自:《欧洲计算机视觉会议记录》,第346-361页(2014年)
[77] Everingham,M.,Eslami,S.M.A.,Gool,L.V.,Williams,C.K.I.,Winn,J.,Zisserman,A.:Pascal视觉对象类挑战:回顾。国际计算机杂志。视觉。111, 98-136 (2015) ·doi:10.1007/s11263-014-0733-5
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。