文件Zbl 1191.68777-zbMATH Open

一种对摄像机生成的文档图像进行二值化的方法，该方法具有学习生成的规则。（英语） Zbl 1191.68777号

模式识别 43，第4期，1518-1530（2010）.

摘要：我们提出了一种新的二值化方法来处理由相机生成的文档图像。这类图像通常具有不同程度的亮度，需要比仅应用统计方法来获得阈值更仔细的处理。为了解决这个问题，该方法将图像划分为多个区域，并决定如何对每个区域进行二值化。决策规则源自以训练图像为输入的学习过程。对正常光照和不足光照条件下生成的图像的测试表明，与三种全局二值化方法和四种局部自适应二值化算法相比，我们的方法产生了更好的视觉质量和更好的OCR性能。

引用于4文件

MSC公司：

68平方英寸10	图像处理的计算方法
68吨10	模式识别、语音识别

关键词：

文档图像二值化;全局阈值;图像处理;局部阈值;多标签问题;亮度不均匀;支持向量机

软件：

BoosTexter公司

PDF格式 BibTeX公司 XML格式引用

全文：内政部

参考文献：

[1]	塞兹金，M。；Sankur，B.，图像阈值技术和定量性能评估综述，电子成像杂志，13，1，146-168（2004）
[2]	Sezan，M.I.，峰值检测算法及其在基于直方图的图像数据简化中的应用，计算机视觉、图形和图像处理，49，1，36-51（1990）
[3]	罗森菲尔德，A。；de la Torre，P.，直方图凹度分析作为阈值选择的辅助，IEEE系统、人类和控制论汇刊，13231-235（1983）
[4]	T.Pavlidis，使用灰度图像二阶导数的阈值选择，收录于：ICDAR论文集，1993年，第274-277页。；T.Pavlidis，使用灰度图像二阶导数的阈值选择，收录于：ICDAR论文集，1993年，第274-277页。
[5]	Otsu，N.，从灰度直方图中选择阈值的方法，IEEE系统、人与控制论汇刊，9，62-66（1979）
[6]	Kittler，J。；Illingworth，J.，最小误差阈值，模式识别，19，1，41-47（1886）
[7]	卡普尔，J.N。；Sahoo，P.K。；Wong，A.K.C.，使用直方图熵进行灰度图像阈值化的新方法，计算机视觉，图形和图像处理，29273-285（1985）
[8]	赫兹，L。；Schafer，R.W.，使用边缘匹配的多级阈值处理，计算机视觉、图形和图像处理，44279-295（1988）
[9]	Huang，L.K。；Wang，M.J.J.，通过最小化模糊性度量的图像阈值，模式识别，28，41-51（1995）
[10]	Abutableb，A.S.，使用二维熵对灰度图像进行自动阈值处理，计算机视觉、图形和图像处理，47，22-32（1989）
[11]	J.Bernsen，灰度图像的动态阈值，摘自：《第八届国际会议论文集模式识别》，巴黎，1986年，第1251-1255页。；J.Bernsen，灰度图像的动态阈值，摘自：《第八届国际会议论文集模式识别》，巴黎，1986年，第1251-1255页。
[12]	Niblack，W.，《数字图像处理导论》（1986），普伦蒂斯·霍尔：普伦蒂斯·霍尔·恩格尔伍德克利夫斯，新泽西州，第115-116页
[13]	Taxt，T。；弗林，P.J。；Jain，A.K.，文档图像的分割，IEEE模式分析和机器智能汇刊，11，12，1322-1329（1989）
[14]	L.Eikvil，T.Taxt，K.Moen，文档图像二值化的快速自适应方法，收录于：ICDAR会议记录，1991年，第435-443页。；L.Eikvil，T.Taxt，K.Moen，文档图像二值化的快速自适应方法，收录于：ICDAR会议记录，1991年，第435-443页。
[15]	Mardia，K.V。；Hainsworth，T.J.，图像分割的空间阈值方法，IEEE模式分析和机器智能汇刊，10，8，919-927（1988）
[16]	Chow，C.K。；Kaneko，T.，电影血管造影、计算机和生物医学研究中的左心室自动检测，5388-410（1972）
[17]	Y.中川。；Rosenfeld，A.，可变阈值的一些实验，模式识别，11，3，191-204（1979）
[18]	怀特，J.M。；Rohrer，G.D.，《用于光学字符识别和其他需要字符图像提取的应用的图像分割》，《IBM研究与开发杂志》，27，4，400-411（1983）
[19]	Yasuda，Y。；Dubois，M。；Huang，T.S.，支票处理器的数据压缩，IEEE学报，68，874-885（1980）
[20]	沙沃拉，J。；Pietikäinen，M.，自适应文档图像二值化，模式识别，33，225-236（2000）
[21]	J.Sauvola，T.Seppänen，S.Haapakoski，M.Pietikäinen，自适应文档二值化，收录于：ICDAR会议记录，1997年，第147-152页。；J.Sauvola，T.Seppänen，S.Haapakoski，M.Pietikäinen，自适应文档二值化，收录于：ICDAR会议记录，1997年，第147-152页。
[22]	I.J.Kim，用于文档识别的相机图像多窗口二值化，载于：第九届手写识别前沿国际研讨会，2004年，第323-327页。；I.J.Kim，用于文档识别的相机图像多窗口二值化，载于：第九届手写识别前沿国际研讨会，2004年，第323-327页。
[23]	提尔。D。；Taxt，T.，改进文档图像二值化的“集成函数算法”，模式识别字母，16，3，277-283（1995）
[24]	Parker，J.R.，照明不良图像中的灰度阈值，IEEE模式分析和机器智能汇刊，13，8，813-819（1991）
[25]	雅诺维茨，S.D。；Bruckstein，A.M.，图像分割的新方法，计算机视觉，图形和图像处理，46，1，82-95（1989）
[26]	卡梅尔，M。；赵，A.，从灰度文档图像中提取二进制字符/图形图像，计算机视觉，图形和图像处理，55，3，203-217（1993）
[27]	Yang，Y。；Yan，H.，退化文档图像二值化的自适应逻辑方法，模式识别，33，5，787-807（2000）
[28]	叶，X。；Cheriet先生。；Suen，C.Y.，基于笔划模型的灰度文档图像字符提取，IEEE图像处理汇刊，10，8，1152-1161（2001）·Zbl 1062.68596号
[29]	提尔。D。；Taxt，T.，文档图像的文档图像二值化方法评估，IEEE模式分析和机器智能汇刊，17，3，312-315（1995）
[30]	特里尔，Ø。D。；Jain，A.K.，二值化方法的目标导向评估，IEEE模式分析和机器智能汇刊，17，12，1191-1201（1995）
[31]	Weszka，J.S。；Rosenfeld，A.，阈值评估技术，IEEE系统人与控制论汇刊，SMC-8622-629（1978）
[32]	P.W.Palumbo，P.Swaminathan，S.N.Srihari，《文档图像二值化：算法评估》，摘自：《SPIE学报》，第697卷，1986年，第278-285页。；P.W.Palumbo，P.Swaminathan，S.N.Srihari，《文档图像二值化：算法评估》，摘自：《SPIE学报》，第697卷，1986年，第278-285页。
[33]	Sahoo，P.K。；Soltani，S。；Wong，A.K.C。；陈永川，阈值技术、计算机视觉、图形与图像处理综述，41,2233-260（1988）
[34]	Lee，美国。；Chung，S.Y。；Park，R.H.，用于分割、计算机视觉、图形和图像处理的几种全局阈值技术的性能比较研究，52，171-190（1990）
[35]	Glasbey，C.A.，基于直方图的阈值算法分析，CVGIP：图形模型和图像处理，55，6，532-537（1993）
[36]	J.H.Park，I.H.Jang，N.C.Kim，PDA中名片图像的倾斜校正，收录于：IEEE环太平洋通信、计算机和信号处理会议，2003年，第724-727页。；J.H.Park，I.H.Jang，N.C.Kim，PDA中名片图像的倾斜校正，收录于：IEEE环太平洋通信、计算机和信号处理会议，2003年，第724-727页。
[37]	科尔特斯，C。；Vapnik，V.，支持向量网络，机器学习，20，273-297（1995）·Zbl 0831.68098号
[38]	Vapnik，V.，《统计学习理论的本质》（1995），施普林格出版社：纽约施普林格·Zbl 0833.62008号
[39]	T.Joachims，《支持向量机文本分类：具有许多相关特征的学习》，载于：《第十届欧洲机器学习会议论文集》，柏林，1998年，第137-142页。；T.Joachims，《支持向量机文本分类：具有许多相关特征的学习》，载于《第十届欧洲机器学习会议论文集》，柏林，1998年，第137-142页。
[40]	夏皮雷，B.E。；Singer，Y.，BoosTexter:一个基于增强的文本分类系统，机器学习，39，2/3，135-168（2000）·兹比尔0951.68561
[41]	穆特尔，M.R。；罗，J。；沈，X。；Brown，C.M.，学习多标签场景分类，模式识别，371757-1771（2004）
[42]	L.Bottou，C.Cortes，J.Denker，H.Drucker，I.Guyon，L.Jackel，Y.LeCun，U.Muller，E.Sackinger，P.Simard，V.Vapnik，《分类器方法的比较：手写数字识别的案例研究》，收录于：《1994年国际模式识别会议论文集》，第77-87页。；L.Bottou，C.Cortes，J.Denker，H.Drucker，I.Guyon，L.Jackel，Y.LeCun，U.Muller，E.Sackinger，P.Simard，V.Vapnik，《分类器方法的比较：手写数字识别的案例研究》，收录于：《1994年国际模式识别会议论文集》，第77-87页。
[43]	van Rijsbergen，C.J.，信息检索（1979），巴特沃斯：巴特沃斯伦敦·Zbl 0227.68052号
[44]	D.D.Lewis，评估和优化自主文本分类系统，摘自：第18届ACM SIGIR信息检索研究与开发年会论文集（SIGIR 95），1995年，第246-254页。；D.D.Lewis，《评估和优化自主文本分类系统》，载于《第18届ACM SIGIR信息检索研究与开发会议论文集》（SIGIR 95），1995年，第246-254页。
[45]	徐，C.-W。；Lin，C.-J.，多类支持向量机方法的比较，IEEE神经网络汇刊，13，2，415-425（2002）

此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配，可能包含数据转换错误。在某些情况下，zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献，而不要求完整或完全匹配。

任何	在任何地方
一个	内部文档标识符
澳大利亚	作者、编辑
人工智能	内部作者标识符
钛	标题
洛杉矶	语言
所以	来源
ab公司	回顾，摘要
第页	出版年份
车辆	评审员
复写的副本	MSC代码
美国犹他州	关键字
日期	文档类型(j个：期刊文章；b条：book；一：图书文章）

一&b条	逻辑和
一\|b条	逻辑或
!ab公司	逻辑不
美国广播公司*	右通配符
"ab c公司"	短语
(ab c公司)	圆括号

示例

领域

操作员

一种对摄像机生成的文档图像进行二值化的方法，该方法具有学习生成的规则。（英语） Zbl 1191.68777号

MSC公司：

关键词：

软件：

参考文献：

示例

领域

操作员

一种对摄像机生成的文档图像进行二值化的方法，该方法具有学习生成的规则。 （英语） Zbl 1191.68777号

MSC公司：

关键词：

软件：

参考文献：

一种对摄像机生成的文档图像进行二值化的方法，该方法具有学习生成的规则。（英语） Zbl 1191.68777号