×

使用决策树/机器学习C4识别手印汉字。5系统。 (英语) Zbl 0911.68179号

中文识别多年来一直是人们关注的一个领域,在这一领域已经发表了大量的研究论文和报告。汉字识别存在几个主要问题:汉字清晰、表意,字符大小很大,字符集中存在大量结构相似的字符。因此,很难生成分类标准。本文提出了一种使用C4.5机器学习系统识别手写汉字的新技术。传统的方法依赖于手工编纂的词典,这些词典构造繁琐,难以容忍写作风格的变化。本文讨论了使用霍夫变换进行特征提取的汉字识别和C4.5系统。该系统使用不同作者编写的900个字符进行了测试,从质量差到可接受(每个字符有40个样本),获得的识别率为84%。

MSC公司:

68分10秒 模式识别、语音识别
68T05型 人工智能中的学习和自适应系统

软件:

4.5条
PDF格式BibTeX公司 XML格式引用
全文: DOI程序

参考文献:

[1] 哈蒙LD。打印和脚本的自动识别。IEEE 1972年会议记录;60(10): 1165-1177 ·doi:10.1109/PROC.1972.8878
[2] Spanjersberg AA。将手写数字数据自动输入大型管理系统的实验。IEEE跨人系统与控制论1978;8(4): 286-288 ·doi:10.1109/TSMC.1978.4309951
[3] Focht LR,Burger A.邮政邮政编码应用的数字脚本识别处理器。1976年控制论与社会国际会议;486-492
[4] Schuermann J.阅读机器。1982年第六届模式识别国际会议;741-745
[5] Plamondon R,Baron,R.手工打印原理图伪代码的在线识别,用于自动Fortran代码生成器。1986年第八届模式识别国际会议;741-745
[6] Amin A,Al-Fedaghi S.利用自然语言形态学对印刷的阿拉伯文本进行机器识别。国际J人机研究1991;35(6): 769-788 ·doi:10.1016/S0020-7373(05)80160-9
[7] Guillevic D,Suen CY。草书识别:快速阅读。1993年第二届国际文件分析和识别会议;311-314
[8] Brown MK,Ganapathy S.草书单词识别的预处理技术。模式识别1983;19(1): 1-12
[9] Davis RH,Lyall J.手写字符识别综述。图像与视觉计算1986;4(4): 208-218 ·doi:10.1016/0262-8856(86)90048-X
[10] Lecolinet E,Baret O。草书单词识别:方法和策略。In:Impedovo S(ed),《手写识别基础》1994;235-263
[11] Suen CY,Shingal R,Kwan CC。分散系数:手工印刷字符质量的定量测量。1977年控制论与社会国际会议;681-685
[12] Burr DJ。设计手写读取器。1980年第五届国际模式识别会议;715-722
[13] Shoukry A,Amin A.线图的拓扑和统计分析。1983年模式识别信;1: 365-374
[14] Amin A.通过IRAC II系统对手写阿拉伯语单词进行机器识别。1982年第六届模式识别国际会议;34-36
[15] Kim J,Tappert CC。手写识别精度与平板电脑分辨率和采样率的关系。1984年第七届国际模式识别大会;917-918
[16] Ward JR,Kuklinski T.手印可变性效应模型,对手写字符识别系统的设计具有指导意义。IEEE Trans-Systems Man和控制论1988;18: 438-451 ·数字对象标识代码:10.1109/21.7493
[17] Nouboud F,Plamondon R.手印字符的在线识别:调查和测试。模式识别1990;25(9): 1031-1044 ·doi:10.1016/0031-3203(90)90111-W
[18] Ulmann JR。字符识别进展。In:Fu KS(ed),模式识别的应用,1982年;197-236
[19] Bokser M.Omnidocument Technologies公司。1992年IEEE程序;80(7): 1066-1078 ·doi:10.1109/5.156470
[20] Fujisawa H,Nakano Y,Kurino K。字符识别的分割方法:从分割到文档结构分析。1992年IEEE程序;80(7): 1079-1091 ·doi:10.1109/5.156471
[21] Srihari S.从像素到段落:文本识别中模型的使用。第二届文献分析和信息检索年会。1993; 47-64
[22] Chin RT。用矩量法进行图像分析。IEEE跨模式分析与机器智能1988;10(4): 496-508 ·Zbl 0709.94543号 ·doi:10.1009/34.3913
[23] Raudys SJ,Jain AK。统计模式识别中的小样本效应,IEEE跨模式分析和机器智能1991;13(3): 252-264 ·doi:10.1109/34.75512
[24] Matsunage T,Kida H.统计模式分类器学习曲线的实验研究。1995年第三届国际文件分析和识别会议;1103-1106
[25] Berthod M,Maroy JP。学习图形板上绘制符号的语法识别。计算机图形和图像处理1979;9: 166-182 ·doi:10.1016/0146-664X(79)90055-8
[26] Wang PSP,Gupta A.用于自动识别手写字符的改进结构方法。国际模式识别与人工智能杂志1991;5(1,2): 97-121 ·doi:10.1142/S021801491000089
[27] Amin A,Fotti A.多字体拉丁语文本的识别。1993年第二届文献分析和信息检索年会;243-253
[28] Fu KS公司。句法模式识别与应用。普伦蒂斯·霍尔,1982年
[29] 大JW。一种用于汉字识别的句法-语义方法。1984年第七届国际模式识别会议;374-376
[30] Freund R.用准正则编程数组文法对手写字符进行句法分析。In:Bunke H(ed),结构和句法模式识别进展,1992年;310-319
[31] LeCun Y.反向传播应用于手写邮政编码。神经计算1989;1: 541-551 ·doi:10.1162/neco.1989.1.4.541
[32] Guyon I.神经网络在字符识别中的应用。In:Wang PSP(ed),《开拓边疆中的字符和手写识别》,1991年;353-382
[33] 阿明·A,威尔逊·怀特。使用人工神经网络的手印字符识别系统。1993年第二届国际文件分析和识别会议;943-946
[34] Suen CY,Yu CL。字符识别专家系统的性能评估。1990年专家系统应用专家系统国际会议;195-300
[35] Likfooman-Solem L、Maitre H、Sirait C。希伯来文字符分析和手稿鉴定的专家和视觉系统。模式识别1991;24: 121-137 ·doi:10.1016/0031-3203(91)90082-G
[36] Augi T,Nagahashi H。一种手写汉字的描述方法。IEEE跨模式分析与机器智能1979;1
[37] Yamamoto E等人。使用从多个角度提取的特征进行手写汉字识别。1981年IEEE模式识别和图像处理会议记录
[38] 谢聪,李华杰。基于在线模型引导匹配的手写汉字离线识别。模式识别1992;25: 1337-1352 ·doi:10.1016/0031-3203(92)90146-A
[39] Rosenfeld A.并行细化算法的特征。1975年通知和控制;29: 286-291 ·Zbl 0334.68054号 ·doi:10.1016/S0019-9958(75)90448-9
[40] Arcelli C,Cordella LP,Levialdi S.从局部最大到连接骨骼。IEEE跨模式分析与机器智能1981;3: 134-143 ·doi:10.1109/TPAMI.1981.4767071
[41] Pavlidis T.一种灵活的并行细化算法。模式识别和图像处理会议论文集1981;162-167
[42] 郭Z,霍尔RW。用两个子迭代算法进行并行细化。通信ACM 1989;32(3): 358-373 ·数字对象标识代码:10.1145/62065.62074
[43] Hall RW。快速并行细化算法:并行速度和连接保持。通信ACM 1989;32(3): 124-131 ·数字对象标识代码:10.1145/63238.63248
[44] Jolt CM,Stewart A,Clint M,Perrott RH,改进的并行细化算法。通信ACM 1987;29(3): 239-242
[45] Chu YK,Suen CY。一种用于细化数字二进制图案的交替平滑和剥离算法。1986年信号处理;11: 207-222 ·doi:10.1016/0165-1684(86)90001-0
[46] Naccache NJ,Shinghal R.SPTA:一种提出的细化二进制模式的算法。IEEE跨系统,人与控制论1984;14: 409-418
[47] Xia Y.通过在数字二元形状中实现火线的传播和消亡实现骨骼化。IEEE跨模式分析与机器智能1988;11: 1076-1086 ·数字对象标识代码:10.1109/34.42838
[48] Jang BK,Chin RT。单程平行稀释:分析、特性和定量评估。1992年IEEE机器智能跨模式分析;14; 1129-1140 ·doi:10.1109/34.166630
[49] 关于任意几何构型的编码。IEEE Trans电子计算机1968;10: 260-268 ·doi:10.1109/TEC.1961.5219197
[50] 程福华、徐文华。手写汉字识别的三笔画提取方法。《中国计算机国际会议论文集》,新加坡,1986年;191-195
[51] Hough PVC。识别复杂模式的方法和手段。美国专利号3 069 6541962
[52] Kushnir M,Abe K,Matsumoto K。使用霍夫变换空间中选择的特征识别手写希伯来文字符。模式识别1985;18(2): 103-114 ·doi:10.1016/0031-3203(85)90033-0
[53] Cheng FH,Hsu WH,Chen MY。用改进的Hough变换技术识别手写汉字。IEEE Trans-Pattern Analysis and Machine Intelligence,1989年;11(4): 429-439 ·doi:10.1109/34.19042
[54] Amin A,Singh S.手写汉字的机器识别。智能数据分析——1997年国际期刊;1 (2)
[55] Quinlan JR.C4.5:机器学习程序。摩根考夫曼,1993年
[56] 昆兰JR。发现大量示例的规则。爱丁堡大学出版社,1979年
[57] Breiman L、Friedman J、Olshen R、Stone C.分类和回归树。Wadsworth International,1984年·Zbl 0541.62042号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。