×

一种对摄像机生成的文档图像进行二值化的方法,该方法具有学习生成的规则。 (英语) Zbl 1191.68777号

摘要:我们提出了一种新的二值化方法来处理由相机生成的文档图像。这类图像通常具有不同程度的亮度,需要比仅应用统计方法来获得阈值更仔细的处理。为了解决这个问题,该方法将图像划分为多个区域,并决定如何对每个区域进行二值化。决策规则源自以训练图像为输入的学习过程。对正常光照和不足光照条件下生成的图像的测试表明,与三种全局二值化方法和四种局部自适应二值化算法相比,我们的方法产生了更好的视觉质量和更好的OCR性能。

MSC公司:

68平方英寸10 图像处理的计算方法
68吨10 模式识别、语音识别
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 塞兹金,M。;Sankur,B.,图像阈值技术和定量性能评估综述,电子成像杂志,13,1,146-168(2004)
[2] Sezan,M.I.,峰值检测算法及其在基于直方图的图像数据简化中的应用,计算机视觉、图形和图像处理,49,1,36-51(1990)
[3] 罗森菲尔德,A。;de la Torre,P.,直方图凹度分析作为阈值选择的辅助,IEEE系统、人类和控制论汇刊,13231-235(1983)
[4] T.Pavlidis,使用灰度图像二阶导数的阈值选择,收录于:ICDAR论文集,1993年,第274-277页。;T.Pavlidis,使用灰度图像二阶导数的阈值选择,收录于:ICDAR论文集,1993年,第274-277页。
[5] Otsu,N.,从灰度直方图中选择阈值的方法,IEEE系统、人与控制论汇刊,9,62-66(1979)
[6] Kittler,J。;Illingworth,J.,最小误差阈值,模式识别,19,1,41-47(1886)
[7] 卡普尔,J.N。;Sahoo,P.K。;Wong,A.K.C.,使用直方图熵进行灰度图像阈值化的新方法,计算机视觉,图形和图像处理,29273-285(1985)
[8] 赫兹,L。;Schafer,R.W.,使用边缘匹配的多级阈值处理,计算机视觉、图形和图像处理,44279-295(1988)
[9] Huang,L.K。;Wang,M.J.J.,通过最小化模糊性度量的图像阈值,模式识别,28,41-51(1995)
[10] Abutableb,A.S.,使用二维熵对灰度图像进行自动阈值处理,计算机视觉、图形和图像处理,47,22-32(1989)
[11] J.Bernsen,灰度图像的动态阈值,摘自:《第八届国际会议论文集模式识别》,巴黎,1986年,第1251-1255页。;J.Bernsen,灰度图像的动态阈值,摘自:《第八届国际会议论文集模式识别》,巴黎,1986年,第1251-1255页。
[12] Niblack,W.,《数字图像处理导论》(1986),普伦蒂斯·霍尔:普伦蒂斯·霍尔·恩格尔伍德克利夫斯,新泽西州,第115-116页
[13] Taxt,T。;弗林,P.J。;Jain,A.K.,文档图像的分割,IEEE模式分析和机器智能汇刊,11,12,1322-1329(1989)
[14] L.Eikvil,T.Taxt,K.Moen,文档图像二值化的快速自适应方法,收录于:ICDAR会议记录,1991年,第435-443页。;L.Eikvil,T.Taxt,K.Moen,文档图像二值化的快速自适应方法,收录于:ICDAR会议记录,1991年,第435-443页。
[15] Mardia,K.V。;Hainsworth,T.J.,图像分割的空间阈值方法,IEEE模式分析和机器智能汇刊,10,8,919-927(1988)
[16] Chow,C.K。;Kaneko,T.,电影血管造影、计算机和生物医学研究中的左心室自动检测,5388-410(1972)
[17] Y.中川。;Rosenfeld,A.,可变阈值的一些实验,模式识别,11,3,191-204(1979)
[18] 怀特,J.M。;Rohrer,G.D.,《用于光学字符识别和其他需要字符图像提取的应用的图像分割》,《IBM研究与开发杂志》,27,4,400-411(1983)
[19] Yasuda,Y。;Dubois,M。;Huang,T.S.,支票处理器的数据压缩,IEEE学报,68,874-885(1980)
[20] 沙沃拉,J。;Pietikäinen,M.,自适应文档图像二值化,模式识别,33,225-236(2000)
[21] J.Sauvola,T.Seppänen,S.Haapakoski,M.Pietikäinen,自适应文档二值化,收录于:ICDAR会议记录,1997年,第147-152页。;J.Sauvola,T.Seppänen,S.Haapakoski,M.Pietikäinen,自适应文档二值化,收录于:ICDAR会议记录,1997年,第147-152页。
[22] I.J.Kim,用于文档识别的相机图像多窗口二值化,载于:第九届手写识别前沿国际研讨会,2004年,第323-327页。;I.J.Kim,用于文档识别的相机图像多窗口二值化,载于:第九届手写识别前沿国际研讨会,2004年,第323-327页。
[23] 提尔。D。;Taxt,T.,改进文档图像二值化的“集成函数算法”,模式识别字母,16,3,277-283(1995)
[24] Parker,J.R.,照明不良图像中的灰度阈值,IEEE模式分析和机器智能汇刊,13,8,813-819(1991)
[25] 雅诺维茨,S.D。;Bruckstein,A.M.,图像分割的新方法,计算机视觉,图形和图像处理,46,1,82-95(1989)
[26] 卡梅尔,M。;赵,A.,从灰度文档图像中提取二进制字符/图形图像,计算机视觉,图形和图像处理,55,3,203-217(1993)
[27] Yang,Y。;Yan,H.,退化文档图像二值化的自适应逻辑方法,模式识别,33,5,787-807(2000)
[28] 叶,X。;Cheriet先生。;Suen,C.Y.,基于笔划模型的灰度文档图像字符提取,IEEE图像处理汇刊,10,8,1152-1161(2001)·Zbl 1062.68596号
[29] 提尔。D。;Taxt,T.,文档图像的文档图像二值化方法评估,IEEE模式分析和机器智能汇刊,17,3,312-315(1995)
[30] 特里尔,Ø。D。;Jain,A.K.,二值化方法的目标导向评估,IEEE模式分析和机器智能汇刊,17,12,1191-1201(1995)
[31] Weszka,J.S。;Rosenfeld,A.,阈值评估技术,IEEE系统人与控制论汇刊,SMC-8622-629(1978)
[32] P.W.Palumbo,P.Swaminathan,S.N.Srihari,《文档图像二值化:算法评估》,摘自:《SPIE学报》,第697卷,1986年,第278-285页。;P.W.Palumbo,P.Swaminathan,S.N.Srihari,《文档图像二值化:算法评估》,摘自:《SPIE学报》,第697卷,1986年,第278-285页。
[33] Sahoo,P.K。;Soltani,S。;Wong,A.K.C。;陈永川,阈值技术、计算机视觉、图形与图像处理综述,41,2233-260(1988)
[34] Lee,美国。;Chung,S.Y。;Park,R.H.,用于分割、计算机视觉、图形和图像处理的几种全局阈值技术的性能比较研究,52,171-190(1990)
[35] Glasbey,C.A.,基于直方图的阈值算法分析,CVGIP:图形模型和图像处理,55,6,532-537(1993)
[36] J.H.Park,I.H.Jang,N.C.Kim,PDA中名片图像的倾斜校正,收录于:IEEE环太平洋通信、计算机和信号处理会议,2003年,第724-727页。;J.H.Park,I.H.Jang,N.C.Kim,PDA中名片图像的倾斜校正,收录于:IEEE环太平洋通信、计算机和信号处理会议,2003年,第724-727页。
[37] 科尔特斯,C。;Vapnik,V.,支持向量网络,机器学习,20,273-297(1995)·Zbl 0831.68098号
[38] Vapnik,V.,《统计学习理论的本质》(1995),施普林格出版社:纽约施普林格·Zbl 0833.62008号
[39] T.Joachims,《支持向量机文本分类:具有许多相关特征的学习》,载于:《第十届欧洲机器学习会议论文集》,柏林,1998年,第137-142页。;T.Joachims,《支持向量机文本分类:具有许多相关特征的学习》,载于《第十届欧洲机器学习会议论文集》,柏林,1998年,第137-142页。
[40] 夏皮雷,B.E。;Singer,Y.,BoosTexter:一个基于增强的文本分类系统,机器学习,39,2/3,135-168(2000)·兹比尔0951.68561
[41] 穆特尔,M.R。;罗,J。;沈,X。;Brown,C.M.,学习多标签场景分类,模式识别,371757-1771(2004)
[42] L.Bottou,C.Cortes,J.Denker,H.Drucker,I.Guyon,L.Jackel,Y.LeCun,U.Muller,E.Sackinger,P.Simard,V.Vapnik,《分类器方法的比较:手写数字识别的案例研究》,收录于:《1994年国际模式识别会议论文集》,第77-87页。;L.Bottou,C.Cortes,J.Denker,H.Drucker,I.Guyon,L.Jackel,Y.LeCun,U.Muller,E.Sackinger,P.Simard,V.Vapnik,《分类器方法的比较:手写数字识别的案例研究》,收录于:《1994年国际模式识别会议论文集》,第77-87页。
[43] van Rijsbergen,C.J.,信息检索(1979),巴特沃斯:巴特沃斯伦敦·Zbl 0227.68052号
[44] D.D.Lewis,评估和优化自主文本分类系统,摘自:第18届ACM SIGIR信息检索研究与开发年会论文集(SIGIR 95),1995年,第246-254页。;D.D.Lewis,《评估和优化自主文本分类系统》,载于《第18届ACM SIGIR信息检索研究与开发会议论文集》(SIGIR 95),1995年,第246-254页。
[45] 徐,C.-W。;Lin,C.-J.,多类支持向量机方法的比较,IEEE神经网络汇刊,13,2,415-425(2002)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。