×

使用形状码本识别手写文档图像的语言。 (英语) Zbl 1187.68521号

摘要:手写文档图像的语言识别是一个开放的文档分析问题。在本文中,我们提出了一种新的方法来识别包含手写和机器打印文本的混合文档,该方法使用由形状特征码本构造的图像描述符。我们使用缩放和旋转不变的码字对局部文本结构进行编码,每个码字代表一个无分段的形状特征,该特征足够通用,可以重复检测。通过对相似的特征类型进行聚类和划分,通过图切割,我们从训练中学习到了一个简洁的、有结构索引的形状码本。我们的方法很容易扩展,不需要偏斜校正、尺度归一化或分割。我们使用一个庞大的真实世界文档图像集合来定量评估我们的方法,该集合由1512个八种语言(阿拉伯语、汉语、英语、印地语、日语、韩语、俄语和泰语)的文档组成,包含手写和机印内容的复杂混合。实验证明了我们的方法的健壮性和灵活性,并显示了超过当前技术水平的卓越的语言识别性能。

MSC公司:

68吨10 模式识别、语音识别
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] L.Vincent,《谷歌图书搜索:大规模的文档理解》,载于:《2007年国际文档分析与识别会议论文集》,第819-823页。;L.Vincent,《谷歌图书搜索:大规模的文档理解》,载于:《国际文档分析与识别会议论文集》,2007年,第819-823页。
[2] G.Zhu,T.J.Bethea,V.Krishna,提取相关命名实体用于自动费用报销,载于:ACM SIGKDD国际知识发现和数据挖掘会议记录,2007年,第1004-1012页。;G.Zhu,T.J.Bethea,V.Krishna,提取相关命名实体用于自动费用报销,载于:ACM SIGKDD国际知识发现和数据挖掘会议记录,2007年,第1004-1012页。
[3] 赖斯,S。;Nagy,G。;Nartker,T.,《光学字符识别:前沿图解指南》(1999),Kluwer学术出版社:Kluwer-学术出版社Dordrecht
[4] 李毅。;郑毅。;Doermann,D。;Jaeger,S.,自由风格手写文档中与脚本相关的文本行分割,IEEE模式分析和机器智能汇刊,30,8,1313-1329(2008)
[5] U.Marti,H.Bunke,IAM-数据库:离线手写识别的英语句子数据库,《国际文献分析与识别杂志》5(2006)39-46,可用:\(\langle;\)网址:http://www.iam.unibe.ch/∼;fki/iamDB/\(\rangle;\)。;U.Marti,H.Bunke,IAM-数据库:离线手写识别的英语句子数据库,《国际文献分析与识别杂志》5(2006)39-46,可用:\(\langle;\)网址:http://www.iam.unibe.ch/∼;fki/iamDB/\(\rangle;\)·Zbl 1039.68045号
[6] 普拉蒙顿,R。;Srihari,S.N.,在线和离线手写识别:综合调查,IEEE模式分析和机器智能汇刊,22,1,63-84(2000)
[7] 霍克伯格,J。;鲍尔斯,K。;坎农,M。;Kelly,P.,手写文档图像的脚本和语言识别,《国际文档分析与识别杂志》,第2期,第2-3期,第45-52页(1999年)
[8] D.-S.Lee,C.R.Nohl,H.S.Baird,复杂、无方向和退化文档图像中的语言识别,摘自:IAPR文档分析系统研讨会论文集,1996年,第17-39页。;D.-S.Lee,C.R.Nohl,H.S.Baird,复杂、无方向和退化文档图像中的语言识别,载于:IAPR文档分析系统研讨会论文集,1996年,第17-39页。
[9] Spitz,A.,《文档图像的脚本和语言内容的确定》,IEEE模式分析和机器智能汇刊,19,33235-245(1997)
[10] J.Ding,L.Lam,C.Y.Suen,《利用特征对东方和欧洲文字进行分类》,载《文献分析和识别国际会议论文集》,1997年,第1023-1027页。;J.Ding,L.Lam,C.Y.Suen,《利用特征对东方和欧洲文字进行分类》,载《国际文献分析与识别会议论文集》,1997年,第1023-1027页。
[11] C.Y.Suen,S.Bergler,N.Nobile,B.Waked,C.Nadal,A.Bloch,将文档图像分类为脚本和语言类,收录于:《模式识别进展国际会议论文集》,1998年,第297-306页。;C.Y.Suen,S.Bergler,N.Nobile,B.Waked,C.Nadal,A.Bloch,将文档图像分类为脚本和语言类,收录于:《模式识别进展国际会议论文集》,1998年,第297-306页。
[12] 卢,S。;Tan,C.L.,噪声和退化文档图像中的脚本和语言识别,IEEE模式分析和机器智能汇刊,30,2,14-24(2008)
[13] Tan,T.,旋转不变纹理特征及其在自动脚本识别中的应用,IEEE模式分析和机器智能汇刊,20,7,751-756(1998)
[14] Busch,A。;Boles,W.W。;Sridharan,S.,《脚本识别的纹理》,IEEE模式分析和机器智能汇刊,27,11,1720-1732(2005)
[15] 霍克伯格,J。;凯利·P。;托马斯·T。;Kerns,L.,使用基于聚类的模板从文档图像中自动识别脚本,IEEE模式分析和机器智能学报,19,2,176-181(1997)
[16] H.Ma,D.Doermann,扫描文档图像的单词级脚本识别,收录于:《文档识别和检索学报》,2004年,第124-135页。;H.Ma,D.Doermann,扫描文档图像的单词级脚本识别,收录于:《文档识别和检索学报》,2004年,第124-135页。
[17] S.Jaeger,H.Ma,D.Doermann,《以信息的可信度识别单词级的脚本》,载于:《文件分析和识别国际会议论文集》,2005年,第416-420页。;S.Jaeger,H.Ma,D.Doermann,《以信息的可信度识别单词级的脚本》,载于:《文件分析和识别国际会议论文集》,2005年,第416-420页。
[18] 弗吉尼亚州法拉利。;Fevrier,L。;F.陪审团。;Schmid,C.,用于目标检测的相邻轮廓段组,IEEE模式分析和机器智能汇刊,30,1,36-51(2008)
[19] N.Dalal,B.Triggs,人类检测定向梯度直方图,摘自:IEEE计算机视觉和模式识别会议论文集,第886-893页。;N.Dalal,B.Triggs,人类检测定向梯度直方图,摘自:IEEE计算机视觉和模式识别会议论文集,第886-893页。
[20] L.Schomaker,M.Bulacu,K.Franke,使用片段连接成分轮廓自动识别书写者,收录于:《手写识别前沿国际研讨会论文集》,2004年,第185-190页。;L.Schomeker,M.Bulacu,K.Franke,《使用碎片连接组件轮廓的自动书写者识别》,载于《手写识别前沿国际研讨会论文集》,2004年,第185-190页。
[21] Kohonen,T.,《自我组织与联想记忆》(1989),《施普林格:柏林施普林格》·Zbl 0528.68062号
[22] X.Yu,Y.Li,C.Fermuler,D.Doermann,使用形状码本进行物体检测,收录于:英国机器视觉会议论文集,2007年,第1-10页。;X.Yu,Y.Li,C.Fermuler,D.Doermann,使用形状码本进行物体检测,收录于:英国机器视觉会议论文集,2007年,第1-10页。
[23] Canny,J.,边缘检测的计算方法,IEEE模式分析和机器智能汇刊,8,6,679-697(1986)
[24] P.D.Kovesi,MATLAB和计算机视觉和图像处理的倍频程函数,2000年。可用:\(\langle;\)http://www.csse.uwa.edu.au/∼;pk/research/matlabfns/\(\rangle;\)。;P.D.Kovesi,MATLAB和计算机视觉和图像处理的倍频程函数,2000年。可用:\(\langle;\)http://www.csse.uwa.edu.au网站/~;pk/research/matlabfns/\(\rangle;\)。
[25] G.Zhu,X.Yu,Y.Li,D.Doermann,学习用于文档图像内容识别的视觉形状词汇,摘自:《欧洲计算机视觉会议论文集》,2008年第2卷,第745-758页。;G.Zhu,X.Yu,Y.Li,D.Doermann,学习用于文档图像内容识别的视觉形状词汇,收录于:《欧洲计算机视觉会议论文集》,2008年第2卷,第745-758页。
[26] 史J。;Malik,J.,标准化切割和图像分割,IEEE模式分析和机器智能汇刊,22,8,888-905(2000)
[27] 于胜星,石俊杰,多类光谱聚类,载《计算机视觉国际会议论文集》,2003年,第11-17页。;于胜星,石俊杰,多类光谱聚类,载《计算机视觉国际会议论文集》,2003年,第11-17页。
[28] Ojala,T。;Pietikainen,M。;Maenpaa,T.,具有局部二进制模式的多分辨率灰度和旋转不变纹理分类,IEEE模式分析和机器智能汇刊,24,7,971-987(2002)
[29] 海基拉,M。;Pietikainen,M.,一种基于纹理的背景建模和检测运动对象的方法,IEEE模式分析和机器智能汇刊,28,4,657-662(2006)
[30] Ahonen,T。;哈迪德,A。;Pietikainen,M.,局部二进制模式的人脸描述:在人脸识别中的应用,IEEE模式分析和机器智能汇刊,28,12,2037-2041(2006)
[31] C.-C.Chang,C.-J.Lin,LIBSVM:支持向量机库,2001年。可用:\(\langle;\)网址:http://www.csie.ntu.edu.tw/∼;cjlin/libsvm\(\rangle;\)。;C.-C.Chang,C.-J.Lin,LIBSVM:支持向量机库,2001年。可用:\(\langle;\)网址:http://www.csie.ntu.edu.tw/∼;cjlin/libsvm\(\rangle;\)。
[32] G.Zhu,X.Yu,Y.Li,D.Doermann,《使用形状码本的无约束语言识别》,载于《国际手写识别前沿会议论文集》,2008年,第13-18页。;G.Zhu,X.Yu,Y.Li,D.Doermann,使用形状码本进行无约束语言识别,收录于:《手写识别领域国际会议论文集》,2008年,第13-18页。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。