×

用于脱机手写数字识别的稳健的基于视觉的特征和分类方案。 (英语) Zbl 1006.68921号

摘要:我们利用生物视觉中公认的结果来构建手写数字识别模型。我们的经验表明,通过我们的模型提取的特征在一个大的训练集(MNIST)上是线性可分的。仅对这些特征使用线性判别系统,我们的模型相对简单,但在相同数据集上优于其他模型。特别是,将三向线性支持向量机应用于从去植图像中提取的基于视觉的特征,并对其进行软投票,可以获得最佳结果。

MSC公司:

68单位99 计算方法和应用
68吨10 模式识别、语音识别

软件:

SVM灯
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Jain,A.K。;Zonker,D.,使用可变形模板表示和识别手写数字,IEEE Trans。模式分析。雨衣。智力。,19, 12, 1386-1391 (1997)
[2] H.Kang,S.Lee,《基于贝叶斯错误率最小化的组合分类器》,《第五届国际文献分析与识别会议论文集》(ICDAR’99),1999年,第398-401页。;H.Kang,S.Lee,《基于贝叶斯错误率最小化的分类器组合》,《第五届国际文献分析与识别会议论文集》(ICDAR’99),1999年,第398-401页。
[3] Lecun,Y。;Boser,B。;Denker,J。;亨德森·D·。;霍华德·R。;Hubbard,W。;Jackel,L.,用反向传播网络进行手写数字识别,(Touretzky,D.,《神经信息处理系统进展》,第2卷(1990),Morgan Kaufmann:Morgan Koufmann San Mateo,CA),396-404
[4] Lecun,Y。;Jackel,L.D。;博图,L。;科尔特斯,C。;Denker,J.S。;Drucker,H。;盖恩,I。;美国穆勒。;Sackinger,E。;西马德,P。;Vapnik,V.,《分类学习算法:手写数字识别的比较》(Oh,J.H.;Kwon,C.;Cho,S.,《神经网络:统计力学观点》(1995),《世界科学:世界科学新加坡》),261-276
[5] Lecun,Y。;博图,L。;本吉奥,Y。;Haffner,P.,《基于梯度的学习应用于文档识别》,Proc。IEEE,86,11,2278-2324(1998)
[6] Mohiuddin,K.M。;Mao,J.,《手写字符识别不同分类器的比较研究》,(Gelsema,E.S.;Kanal,L.N.,《实践中的模式识别IV》(1994),Elsevier:Elsevier Amsterdam),437-448
[7] 普拉蒙顿,R。;Srihari,S.N.,《在线和离线手写识别:综合调查》,IEEE Trans。模式分析。雨衣。智力。,22, 1, 63-84 (2000)
[8] Verikas,A.A。;巴乔斯克内,M.I。;Lashas,A.V.,《多种字符识别算法的研究》,(Shapiro,L.;Rosenfeld,A.,《计算机视觉和图像处理》(1992),学术出版社:纽约学术出版社),231-243
[9] Devijver,P.A。;Kittler,J.,《模式识别:统计方法》(1982),普伦蒂斯·霍尔:普伦蒂斯霍尔伦敦·Zbl 0476.68057号
[10] L.-N.Teow,K.-F.Loe,提取线性可分离特征的新型视觉模型手写数字识别,IEEE计算机视觉和模式识别会议论文集(CVPR-2000),第2卷,2000年,第76-81页。;L.-N.Teow,K.-F.Loe,利用提取线性可分离特征的新型视觉模型进行手写数字识别,IEEE计算机视觉和模式识别会议论文集(CVPR-2000),第2卷,2000年,第76-81页。
[11] Coren,S。;沃德·L·M。;Enns,J.T.,《感觉与感知》(1994),哈科特·布雷斯:纽约哈科特·布雷斯
[12] Hubel,D.H。;Wiesel,T.N.,猫视觉皮层的接收场、双眼交互和功能结构,J.Physiol。,160, 106-154 (1962)
[13] Hubel,D.H。;Wiesel,T.N.,猴纹状体皮层的感受野和功能结构,J.Physiol。,195, 215-243 (1968)
[14] Sekuler,R。;Blake,R.,Perception(1994),McGraw-Hill:McGraw-Hill纽约
[15] H.R.Wilson,D.Levi,L.Maffei,J.Rovamo,R.DeValois,《形状感知:视网膜到纹状体皮层》,L.Spillmann,J.S.Werner(编辑),《视觉感知:神经生理学基础》,纽约学术出版社,1990年,第231-272页(第10章)。;H.R.Wilson,D.Levi,L.Maffei,J.Rovamo,R.DeValois,《形状感知:视网膜到纹状体皮层》,L.Spillmann,J.S.Werner(编辑),《视觉感知:神经生理学基础》,纽约学术出版社,1990年,第231-272页(第10章)。
[16] A.佛罗伦萨,G.Baumgartner,S.Magnussen,P.H.Schiller,J.P.Thomas,《对光明和黑暗的感知:与神经元感受野的关系》,载于:L.Spillmann,J.S.Werner(编辑),《视觉感知:神经生理学基础》,纽约学术出版社,1990年,第129-161页(第7章)。;A.佛罗伦萨,G.Baumgartner,S.Magnussen,P.H.Schiller,J.P.Thomas,《对光明和黑暗的感知:与神经元感受野的关系》,载于:L.Spillmann,J.S.Werner(编辑),《视觉感知:神经生理学基础》,纽约学术出版社,1990年,第129-161页(第7章)。
[17] 席勒,P.H。;Sandell,J.H。;Maunsel,J.H.R.,《视觉系统开启和关闭通道的功能》,《自然》,322824-825(1986)
[18] 比德曼,I.,《基于组件的认知:人类形象理解理论》,《心理学》。修订版,94、2、115-147(1987)
[19] 日本福岛。;Miyake,S.,Neocognitron:一种新的模式识别算法,可容忍变形和位置偏移,模式识别,15,455-469(1982)
[20] Dreher,B.,猫纹状体皮层的超复杂细胞,投资。眼科。,11355-356(1972年)
[21] 克鲁茨费尔特,O.D。;伊藤,M.,猫初级视觉皮层神经元的功能性突触组织,实验脑研究,6324-352(1968)
[22] Sillito,A.M.,《视觉皮层中的抑制回路和定向选择性》,(Rose,D.;Dobson,V.G.,《视皮层模型》(1985),威利:威利纽约),396-407
[23] 霍夫曼,K.P。;Stone,J.,猫视觉皮层传入的传导速度:与皮层感受野特性的相关性,《大脑研究》,32,460-466(1971)
[24] Maffei,L.,《复杂细胞控制简单细胞》(Rose,D.;Dobson,V.G.,《视觉皮层模型》(1985),威利:威利纽约),334-340
[25] 赫兹,J。;Krogh,A。;Palmer,R.G.,《神经计算理论导论》(1991),Addison-Wesley:Addison-Whesley Reading,MA
[26] 罗森布拉特,F.,《神经动力学原理》(1962),斯巴达:斯巴达纽约·兹比尔0143.43504
[27] D.E.Rumelhart、G.E.Hinton、R.J.Williams,通过错误传播学习内部表征,摘自:D.E.Rumlhart、J.L.McClelland等人(编辑),《并行分布式处理:认知微观结构的探索》,第1卷:基础,麻省理工学院出版社,马萨诸塞州剑桥,1986年,第318-362页(第8章)。;D.E.Rumelhart、G.E.Hinton、R.J.Williams,通过错误传播学习内部表征,摘自:D.E.Rumlhart、J.L.McClelland等人(编辑),《并行分布式处理:认知微观结构的探索》,第1卷:基础,麻省理工学院出版社,马萨诸塞州剑桥,1986年,第318-362页(第8章)。
[28] Burges,C.J.C.,模式识别支持向量机教程,数据挖掘知识发现,212-167(1998)
[29] 科尔特斯,C。;Vapnik,V.,支持向量网络,Mac。学习,20273-297(1995)·兹比尔08316.8098
[30] Vapnik,V.N.,《统计学习理论的本质》(1995),施普林格出版社:纽约施普林格·Zbl 0934.62009号
[31] T.Hastie,R.Tibshirani,成对耦合分类。多伦多大学技术报告,1996年。;T.Hastie,R.Tibshirani,成对耦合分类。多伦多大学技术报告,1996年·Zbl 0932.62071号
[32] M.Moreira,E.Mayoraz,《改进的成对耦合与修正分类器》,第十届欧洲机器学习会议论文集(ECML’98),柏林斯普林格出版社,1998年,第160-171页。;M.Moreira,E.Mayoraz,《改进的两两耦合与修正分类器》,第十届欧洲机器学习会议论文集(ECML’98),柏林斯普林格出版社,1998年,第160-171页。
[33] 价格,D。;Knerr,S。;Personnaz,L。;Dreyfus,G.,《具有概率输出的成对神经网络分类器》,(Tesauro,G.;Touretzky,D.;Leen,T.,《神经信息处理系统进展》,第7卷(1995),麻省理工学院出版社:麻省理学院出版社剑桥,MA),1109-1116
[34] E.B.Baum,F.Wilczek,通过神经网络监督概率分布的学习,见:D.Z.Anderson(编辑),神经信息处理系统,1988年,第52-61页。;E.B.Baum,F.Wilczek,《神经网络概率分布的监督学习》,载于:D.Z.Anderson(编辑),《神经信息处理系统》,1988年,第52-61页。
[35] Hinton,G.E.,《连接主义学习程序》,Artif。智力。,40, 185-234 (1989)
[36] 肖尔科夫,B。;Sung,K。;伯吉斯,C。;吉罗西,F。;Nigogi,P。;Poggio,T。;Vapnik,V.,《高斯核支持向量机与径向基函数分类器的比较》,IEEE Trans。信号处理。,45, 2758-2765 (1997)
[37] 杨彦,刘晓霞,文本分类方法的重新审视,第22届信息检索研究与开发国际会议论文集(SIGIR’99),1999,第42-49页。;Y.Yang,X.Liu,文本分类方法的重新审视,第22届信息检索研究与发展国际会议论文集(SIGIR'99),1999年,第42-49页。
[38] P.J.Grother,NIST特殊数据库19-手写形式和字符数据库,国家标准与技术研究所,1995年。;P.J.Grother,NIST特殊数据库19-手写形式和字符数据库,国家标准与技术研究所,1995年。
[39] Joachims,T.,《使大规模SVM学习实用化》(Scholkopf,B.;Burges,C.J.C.;Smola,A.J.,《内核方法的进展——支持向量学习》(1999),麻省理工学院出版社:麻省理工学出版社剑桥,MA)
[40] Simard,P。;LeCun,Y。;Denker,J.,使用新的转换距离进行有效的模式识别,(Hanson,S.J.;Cowan,J.D.;Giles,C.L.,《神经信息处理系统的进展》,第5卷(1993),Morgan Kaufmann:Morgan Koufmann San Mateo,CA),50-58
[41] C.J.C.Burges,Scholkopf,《提高支持向量机的准确性和速度》,载于:M.Mozer,M.Jordan,T.Petsche(编辑),《神经信息处理系统的进展》,1997年第9卷,第375-381页。;C.J.C.Burges,Scholkopf,《提高支持向量机的准确性和速度》,载于:M.Mozer,M.Jordan,T.Petsche(编辑),《神经信息处理系统的进展》,1997年第9卷,第375-381页。
[42] Drucker,H。;夏皮雷,R。;Simard,P.,《使用增强算法改进神经网络性能》,(Hanson,S.J.;Cowan,J.D.;Giles,C.L.,《神经信息处理系统的进展》,第5卷(1993),Morgan Kaufmann:Morgan Koufmann San Mateo,CA),42-49
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。