文件Zbl 1129.68466-zbMATH Open

一种基于学习的从场景图像中检测和分割文本的方法。（英语） Zbl 1129.68466号

浙江科技大学学报。A类第8期，第4期，第568-574页（2007年）.

摘要：本文提出了一种基于学习的自然场景图像文本检测和分割方法。首先，利用Niblack聚类算法将输入图像分解为多个连通分量。然后，通过一个二级分类模块对包括文本CC和非文本CC在内的所有CC进行文本特征验证，其中大多数非文本CC被注意力级联分类器丢弃，其余CC则由SVM进一步验证。输出所有接受的CC以生成纯文本的二进制图像。对不同场景中的多幅图像进行的实验表明，该方法具有令人满意的性能。

MSC公司：

68T05型	人工智能中的学习和自适应系统
68单位15	文本处理的计算方法；数学排版
68单位10	图像处理的计算方法

关键词：

文本检测;文本分割;文本功能;注意级联

PDF格式 BibTeX公司 XML格式引用

全文：内政部

参考文献：

[1]	Chen，D.，Shearer，K.，Bourard，H.，2001年。视频OCR的对称变换文本增强。程序。国际图像分析和识别会议，第192-197页。
[2]	Chun，B.T.，Bae，Y.，Kim，T.Y.，1999年。基于FFT和神经网络的数字视频文本自动提取。IEEE国际模糊系统会议。韩国首尔，2:1112-1115。
[3]	Clark，P.，Mirmehdi，M.，2000年。使用本地化度量查找文本区域。程序。第11届英国机器视觉会议，第675-684页。
[4]	Ekin，A.，2006年。基于局部信息的分类器融合重叠文本检测。程序。国际声学、语音和信号处理会议，2:753-756。
[5]	Kim，K.I.，Jung，K.，Kim，J.H.，2003年。基于文本的图像文本检测方法，使用支持向量机和连续自适应均值漂移算法。IEEE传输。模式分析。机器智能。，25(12):1631-1639. [doi:10.1109/TPAMI.2003.1251157]·doi:10.1109/TPAMI.2003.1251157
[6]	Kim，K.C.，Byun，H.R.，Song，Y.J.，Choi，Y.W.，Chi，S.Y.，Kim，KW.，Chung，Y.K.，2004年。基于层次特征组合和验证的自然场景图像中场景文本提取。程序。计算机视觉和模式识别国际会议，2:679-682。
[7]	Liu，C.，Wang，C.，Dai，R.，2005年。基于边缘特征的无监督分类的图像文本检测。程序。国际文件分析和承认会议。
[8]	Liu，C.L.，Koga，M.，Fujisawa，H.，2005年。用于字符识别的Gabor特征提取与梯度特征比较。程序。第八届文件分析和识别国际会议，1:121-125·doi:10.1109/ICDAR.2005.119
[9]	Lyu，M.R.，Song，J.，Cai，M.，2005年。一种用于多语言视频文本检测、定位和提取的综合方法。IEEE传输。电路系统。视频技术。，15(2):243-255. [doi:10.1109/TCSVT.2004.841653]·doi:10.1109/TCSVT.2004.841653
[10]	Mao，W.、Chung，F.、Lanm，K.、Siu，W.，2002年。图像和视频帧中的中英文混合文本检测。程序。计算机视觉和模式识别国际会议，3:1015-1018。
[11]	钱，X，刘，G，2006。压缩视频中的文本检测、定位和分割。程序。国际声学、语音和信号处理会议，2:385-388。
[12]	Takahashi，H.，Nakajima，M.，2005年。基于区域图的室外图像文本提取。程序。第三届信息技术和应用国际会议，1:680-685。[doi:10.1109/ICITA.2005.235]·doi:10.1109/ICITA.2005.235
[13]	Wang，K.Q.，Kangas，J.A.，2003年。数字相机场景图像中的字符位置。模式识别，36（10）：2287-2299。[doi:10.1016/S0031-3203（03）00082-7]·Zbl 1054.68130号 ·doi:10.1016/S0031-3203（03）00082-7
[14]	Weinman，J.，Hanson，A.，McCallum，A.，2004年。基于条件随机场的自然图像符号检测。程序。IEEE信号处理机器学习国际研讨会。巴西，第549-558页。[doi:10.1109/MLSP.2004.1423018]
[15]	Winger，L.、Robinson，J.A.、Jernigan，M.E.，2000年。低对比度场景图像中的低复杂度字符提取。IEEE传输。模式记录。Artif公司。整数。，14(2):113-135. [doi:10.1142/S0218001400000106]·doi:10.1142/S0218001400000106
[16]	Zhang，D.Q.，Chang，F.H.，2004年。学习使用带信念传播的高阶MRF检测场景文本。程序。计算机视觉和模式识别国际会议，第101-107页。
[17]	朱凯，齐峰，江荣，徐立，2005。使用Adaboost检测和分割自然场景中的角色。程序。基于摄像机的文件分析和识别会议，第52-59页。

此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配，可能包含数据转换错误。在某些情况下，zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献，而不要求完整或完全匹配。

任何	在任何地方
一个	内部文档标识符
澳大利亚	作者、编辑
人工智能	内部作者标识符
钛	标题
洛杉矶	语言
所以	来源
ab公司	回顾，摘要
第页	出版年份
车辆	评审员
复写的副本	MSC代码
美国犹他州	关键字
数据传输时间	文档类型(j个：期刊文章；b条：book；一：图书文章）

一&b条	逻辑和
一\|b条	逻辑或
!ab公司	逻辑不
美国广播公司*	右通配符
"ab c公司"	短语
(ab c公司)	圆括号

示例

领域

操作员

一种基于学习的从场景图像中检测和分割文本的方法。（英语） Zbl 1129.68466号

MSC公司：

关键词：

参考文献：

示例

领域

操作员

一种基于学习的从场景图像中检测和分割文本的方法。 （英语） Zbl 1129.68466号

MSC公司：

关键词：

参考文献：

一种基于学习的从场景图像中检测和分割文本的方法。（英语） Zbl 1129.68466号