×

一种基于学习的从场景图像中检测和分割文本的方法。 (英语) Zbl 1129.68466号

摘要:本文提出了一种基于学习的自然场景图像文本检测和分割方法。首先,利用Niblack聚类算法将输入图像分解为多个连通分量。然后,通过一个二级分类模块对包括文本CC和非文本CC在内的所有CC进行文本特征验证,其中大多数非文本CC被注意力级联分类器丢弃,其余CC则由SVM进一步验证。输出所有接受的CC以生成纯文本的二进制图像。对不同场景中的多幅图像进行的实验表明,该方法具有令人满意的性能。

MSC公司:

68T05型 人工智能中的学习和自适应系统
68单位15 文本处理的计算方法;数学排版
68单位10 图像处理的计算方法
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Chen,D.,Shearer,K.,Bourard,H.,2001年。视频OCR的对称变换文本增强。程序。国际图像分析和识别会议,第192-197页。
[2] Chun,B.T.,Bae,Y.,Kim,T.Y.,1999年。基于FFT和神经网络的数字视频文本自动提取。IEEE国际模糊系统会议。韩国首尔,2:1112-1115。
[3] Clark,P.,Mirmehdi,M.,2000年。使用本地化度量查找文本区域。程序。第11届英国机器视觉会议,第675-684页。
[4] Ekin,A.,2006年。基于局部信息的分类器融合重叠文本检测。程序。国际声学、语音和信号处理会议,2:753-756。
[5] Kim,K.I.,Jung,K.,Kim,J.H.,2003年。基于文本的图像文本检测方法,使用支持向量机和连续自适应均值漂移算法。IEEE传输。模式分析。机器智能。,25(12):1631-1639. [doi:10.1109/TPAMI.2003.1251157]·doi:10.1109/TPAMI.2003.1251157
[6] Kim,K.C.,Byun,H.R.,Song,Y.J.,Choi,Y.W.,Chi,S.Y.,Kim,KW.,Chung,Y.K.,2004年。基于层次特征组合和验证的自然场景图像中场景文本提取。程序。计算机视觉和模式识别国际会议,2:679-682。
[7] Liu,C.,Wang,C.,Dai,R.,2005年。基于边缘特征的无监督分类的图像文本检测。程序。国际文件分析和承认会议。
[8] Liu,C.L.,Koga,M.,Fujisawa,H.,2005年。用于字符识别的Gabor特征提取与梯度特征比较。程序。第八届文件分析和识别国际会议,1:121-125·doi:10.1109/ICDAR.2005.119
[9] Lyu,M.R.,Song,J.,Cai,M.,2005年。一种用于多语言视频文本检测、定位和提取的综合方法。IEEE传输。电路系统。视频技术。,15(2):243-255. [doi:10.1109/TCSVT.2004.841653]·doi:10.1109/TCSVT.2004.841653
[10] Mao,W.、Chung,F.、Lanm,K.、Siu,W.,2002年。图像和视频帧中的中英文混合文本检测。程序。计算机视觉和模式识别国际会议,3:1015-1018。
[11] 钱,X,刘,G,2006。压缩视频中的文本检测、定位和分割。程序。国际声学、语音和信号处理会议,2:385-388。
[12] Takahashi,H.,Nakajima,M.,2005年。基于区域图的室外图像文本提取。程序。第三届信息技术和应用国际会议,1:680-685。[doi:10.1109/ICITA.2005.235]·doi:10.1109/ICITA.2005.235
[13] Wang,K.Q.,Kangas,J.A.,2003年。数字相机场景图像中的字符位置。模式识别,36(10):2287-2299。[doi:10.1016/S0031-3203(03)00082-7]·Zbl 1054.68130号 ·doi:10.1016/S0031-3203(03)00082-7
[14] Weinman,J.,Hanson,A.,McCallum,A.,2004年。基于条件随机场的自然图像符号检测。程序。IEEE信号处理机器学习国际研讨会。巴西,第549-558页。[doi:10.1109/MLSP.2004.1423018]
[15] Winger,L.、Robinson,J.A.、Jernigan,M.E.,2000年。低对比度场景图像中的低复杂度字符提取。IEEE传输。模式记录。Artif公司。整数。,14(2):113-135. [doi:10.1142/S0218001400000106]·doi:10.1142/S0218001400000106
[16] Zhang,D.Q.,Chang,F.H.,2004年。学习使用带信念传播的高阶MRF检测场景文本。程序。计算机视觉和模式识别国际会议,第101-107页。
[17] 朱凯,齐峰,江荣,徐立,2005。使用Adaboost检测和分割自然场景中的角色。程序。基于摄像机的文件分析和识别会议,第52-59页。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。