×

文本图像的多模式交互式转录。 (英语) Zbl 1191.68603号

摘要:迄今为止,自动手写识别系统还远远不够完善,经常需要大量的人工干预来检查和纠正此类系统的结果。这种“后期编辑”过程既低效又让用户感到不舒服。历史文件的转录就是一个例子:最先进的手写文本识别技术不适合自动执行这项任务,需要昂贵的古文字专家工作才能实现正确的转录。作为完全手动转录和后期编辑的替代方案,这里提出了一种多模式交互方法,用户通过触摸屏笔触和/或更传统的键盘和鼠标操作提供反馈。用户的反馈可以直接提高系统的准确性,而多模态可以提高系统的遍历性和用户的可接受性。多模式交互的方式是,主数据流和反馈数据流相互帮助,以优化整体性能和可用性。对三个草书手写任务的实证测试表明,使用这种方法,无论是纯手工工作还是非交互式编辑后处理,都可以节省大量的用户工作量。

MSC公司:

68吨10 模式识别、语音识别

软件:

IAM公司
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] S.N.Srihari,E.J.Keubert,《将手写地址解释技术融入美国邮政服务远程计算机阅读器系统》,载于:第四届文件分析和识别国际会议,第2卷,德国乌尔姆,1997年,第892-896页。;S.N.Srihari,E.J.Keubert,《将手写地址解释技术融入美国邮政服务远程计算机阅读器系统》,载于:第四届文件分析和识别国际会议,第2卷,德国乌尔姆,1997年,第892-896页。
[2] G.Dimauro,S.Impedovo,R.Modugno,G.Pirlo,银行支票处理研究的新数据库,收录于:第八届手写识别前沿国际研讨会,2002年,第524-528页。;G.Dimauro,S.Impedovo,R.Modugno,G.Pirlo,银行支票处理研究的新数据库,收录于:第八届手写识别前沿国际研讨会,2002年,第524-528页。
[3] 托塞利,A.H。;罗梅罗,V。;罗德里格斯,L。;Vidal,E.,手写文本的计算机辅助转录,(第九届文件分析和识别国际会议(ICDAR 2007)(2007),IEEE计算机学会:IEEE计算机协会库里蒂巴,巴拉那,巴西),944-948
[4] V.Romero,A.H.Toselli,L.Rodríguez,E.Vidal,古文本图像的计算机辅助转录,载于:图像分析和识别国际会议(ICIAR 2007),计算机科学讲稿,第4633卷,Springer,蒙特利尔,加拿大,2007,第1182-1193页。;V.Romero,A.H.Toselli,L.Rodríguez,E.Vidal,古文本图像的计算机辅助转录,收录于:图像分析和识别国际会议(ICIAR 2007),《计算机科学讲义》,第4633卷,Springer,加拿大蒙特利尔,2007年,第1182-1193页。
[5] 西维拉,J。;维拉尔,J.M。;Cubel,E。;拉加达,A.L。;Barrachina,S。;卡萨库贝塔,F。;维达尔,E。;皮科,D。;González,J.,《计算机辅助翻译的句法模式识别方法》(Fred,A.;Caelli,T.;Campilho,A.;Duin,R.P.;de Ridder,D.,《统计、结构和句法模式识别进展》,《计算机科学讲义》(2004),施普林格:施普林格-柏林)·Zbl 1104.68597号
[6] S.Barrachina,O.Bender,F.Casacuberta,J.Civera,E.Cubel,S.Khadivi,A.L.H.Ney,J.TomáS,E.Vidal,计算机辅助翻译的统计方法,计算语言学35(1)(2009)3-28。;S.Barrachina,O.Bender,F.Casacuberta,J.Civera,E.Cubel,S.Khadivi,A.L.H.Ney,J.TomáS,E.Vidal,计算机辅助翻译的统计方法,计算语言学35(1)(2009)3-28。
[7] L.Rodríguez,F.Casacuberta,E.Vidal,计算机辅助语音转录,摘自:第三届伊比利亚模式识别和图像分析会议记录,计算机科学讲稿,第4477卷,西班牙吉罗纳施普林格,2007年,第241-248页。;L.Rodríguez,F.Casacuberta,E.Vidal,计算机辅助语音转录,摘自:《第三届伊比利亚模式识别和图像分析会议记录》,《计算机科学讲义》,第4477卷,西班牙吉罗纳施普林格,2007年,第241-248页。
[8] E.Vidal,L.Rodríguez,F.Casacuberta,I.García-Varea,交互式模式识别,摘自:第四届多模交互和相关机器学习算法联合研讨会论文集,《计算机科学讲义》,第4892卷,斯普林格,布尔诺,捷克共和国,2007年,第60-71页。;E.Vidal,L.Rodríguez,F.Casacuberta,I.García-Varea,交互模式识别,摘自:第四届多模交互和相关机器学习算法联合研讨会论文集,《计算机科学讲义》,第4892卷,斯普林格,布尔诺,捷克共和国,2007年,第60-71页。
[9] 维达尔,E。;卡萨库贝塔,F。;罗德里格斯,L。;西维拉,J。;Martínez,C.,使用语音识别的计算机辅助翻译,IEEE音频、语音和语言处理事务,14,3,941-951(2006)
[10] 苏姆,B。;迈尔斯,B。;Waibel,A.,语音用户界面的多模错误纠正,ACM计算机与人类交互事务,8,1,60-98(2001)
[11] P.Liu,F.K.Soong,基于文字图的手写输入语音识别错误更正,载于:ICMI’06:第八届多模接口国际会议论文集,美国纽约州纽约市ACM,2006年,第339-346页。;P.Liu,F.K.Soong,基于文字图的手写输入语音识别错误纠正,收录于:ICMI’06:第八届多模态接口国际会议论文集,美国纽约州纽约市ACM,2006年,第339-346页。
[12] 巴兹,I。;施瓦茨,R。;Makhoul,J.,《英语和阿拉伯语通用开放词汇OCR系统》,IEEE模式分析和机器智能汇刊,21,6,495-504(1999)
[13] 马尔蒂,弗吉尼亚州。;Bunke,H.,《使用统计语言模型改进基于HMM的草书手写识别系统的性能》,《模式识别和人工智能国际期刊》,15,1,65-90(2001)
[14] Vinciarelli,A。;Bengio,S。;Bunke,H.,使用HMM和统计语言模型对无约束手写文本的脱机识别,IEEE模式分析和机器智能学报,26,6,709-720(2004)
[15] 托塞利,A.H。;A.胡安。;Keysers,D。;J.González。;萨尔瓦多,I。;Ney,H。;维达尔,E。;Casacuberta,F.,使用有限状态模型的集成手写识别和解释,国际模式识别和人工智能杂志,18,4,519-539(2004)
[16] Rabiner,L.,语音识别中的隐马尔可夫模型和选定应用教程,IEEE学报,77,257-286(1989)
[17] Jelinek,F.,《语音识别的统计方法》(1998),麻省理工学院出版社
[18] 马蒂,美国。;Bunke,H.,离线手写识别的完整英语句子数据库,(第五届国际文档分析与识别会议(1999)),705-708
[19] I.Guyon,L.Schomeker,R.Plamondon,M.Liberman,S.Janet,UNIPEN在线数据交换和识别器基准项目,载于:《第14届模式识别国际会议论文集》,以色列耶路撒冷,马萨诸塞州,1994年,第29-33页。;I.Guyon,L.Schomaker,R.Plamondon,M.Liberman,S.Janet,UNIPEN在线数据交换和识别器基准项目,摘自:《第十四届模式识别国际会议论文集》,马萨诸塞州耶路撒冷,1994年,第29-33页。
[20] A.H.Toselli,V.Romero,E.Vidal,文本图像和多模态交互的计算机辅助转录,摘自:第五届多模态交互和相关机器学习算法联合研讨会论文集,计算机科学讲义,第5237卷,施普林格,乌得勒支,荷兰,2008年,第296-308页。;A.H.Toselli,V.Romero,E.Vidal,文本图像和多模态交互的计算机辅助转录,摘自:第五届多模态交互和相关机器学习算法联合研讨会论文集,计算机科学讲义,第5237卷,荷兰乌得勒支斯普林格,2008年,第296-308页。
[21] 杜达,R.O。;Hart,P.E.,《模式分类和场景分析》(1973年),威利出版社:威利纽约·Zbl 0277.68056号
[22] A.H.Toselli,Reconcimiento de texto manuscrito continuo,博士论文,信息与计算系。巴伦西亚政治大学,巴伦西亚(西班牙),顾问:E.Vidal博士和A.Juan博士,2004年3月(西班牙语)。;A.H.Toselli,Reconcimiento de texto manuscrito continuo,博士论文,信息与计算系。瓦伦西亚政治大学(西班牙),顾问:E.Vidal博士和A.Juan博士,2004年3月(西班牙语)。
[23] 维达尔,E。;托拉德,F。;de la Higuera,F.C.C。;Carrasco,R.,概率有限状态机-第二部分,IEEE模式分析和机器智能汇刊,27,7,1025-1039(2005)
[24] V.Romero,A.H.Toselli,J.Civera,E.Vidal,《手写文本图像计算机辅助转录系统的改进》,摘自:《第八届信息系统模式识别国际研讨会论文集》(PRIS’08),西班牙巴塞罗那,2008年,第103-112页。;V.Romero,A.H.Toselli,J.Civera,E.Vidal,《手写文本图像计算机辅助转录系统的改进》,载于《第八届信息系统模式识别国际研讨会论文集》(PRIS’08),西班牙巴塞罗那,2008年,第103-112页。
[25] F.Drira,《努力恢复随时间退化的历史文献》,载于:DIAL'06:第二届图书馆文献图像分析国际会议论文集(DIAL'06),IEEE计算机学会,美国华盛顿特区,2006年,第350-357页。;F.Drira,《努力恢复随时间退化的历史文献》,载于:DIAL'06:第二届图书馆文献图像分析国际会议论文集(DIAL'06),IEEE计算机学会,美国华盛顿特区,2006年,第350-357页。
[26] B.Q.Huang,Y.B..Zhang,M.T.Kechadi,在线手写识别的预处理技术,载于:ISDA'07:第七届智能系统设计与应用国际会议论文集,IEEE计算机学会,美国华盛顿特区,2007年,第793-800页。;B.Q.Huang,Y.B.Zhang,M.T.Kechadi,在线手写识别预处理技术,收录于:ISDA’07:第七届智能系统设计与应用国际会议论文集,IEEE计算机学会,美国华盛顿特区,2007年,第793-800页。
[27] A.H.Toselli,M.Pastor,E.Vidal,泰米尔语手写字符在线手写识别系统,收录于:第三届伊比利亚模式识别和图像分析会议,计算机科学讲稿,第4477卷,西班牙吉罗纳施普林格,2007年,第370-377页。;A.H.Toselli,M.Pastor,E.Vidal,泰米尔手写字符在线手写识别系统,收录于:第三届伊比利亚模式识别和图像分析会议,计算机科学讲稿,第4477卷,西班牙吉罗纳施普林格,2007年,第370-377页。
[28] Kneser,R。;Ney,H.,《(n)元语言建模的改进回退》,国际声学、语音和信号处理会议,1181-184(1995)
[29] A.H.Toselli,A.Juan,E.Vidal,《自发手写识别和分类》,摘自:《第17届模式识别国际会议论文集》,第1卷,英国剑桥,2004年,第433-436页。;A.H.Toselli、A.Juan、E.Vidal,《自发手写识别和分类》,载于《第17届国际模式识别会议论文集》,第1卷,英国剑桥,2004年,第433-436页。
[30] U.Marti,H.Bunke,《IAM数据库:脱机手写识别的英语句子数据库》,《国际文献分析与识别杂志》(2002)39-46。;U.Marti,H.Bunke,《IAM数据库:离线手写识别的英语句子数据库》,《国际文献分析与识别杂志》(2002)39-46·Zbl 1039.68045号
[31] S.Johansson,E.Atwell,R.Garside,G.Leech,标记的LOB语料库,用户手册,挪威人文计算中心,挪威卑尔根,1996年。;S.Johansson,E.Atwell,R.Garside,G.Leech,标记的LOB语料库,用户手册,挪威人文计算中心,挪威卑尔根,1996年。
[32] C.Chelba,F.Jelinek,结构化语言模型的识别性能,摘自:《欧洲语音通信与技术会议论文集》,第4卷,1999年,第1567-1570页。;C.Chelba,F.Jelinek,结构化语言模型的识别性能,摘自:《欧洲语音通信与技术会议论文集》,第4卷,1999年,第1567-1570页。
[33] Zimmermann,M。;Chappelier,J.-C。;Bunke,H.,脱机手写句子的基于语法的识别,IEEE模式分析和机器智能汇刊,28,5,818-821(2006)
[34] E.H.Ratzlaff,《UNIPEN数据库上各种孤立字符识别结果比较的方法、报告和调查》,载于:《第七届国际文件分析和识别会议论文集》(ICDAR’03),第1卷,苏格兰爱丁堡,2003年,第623-628页。;E.H.Ratzlaff,《UNIPEN数据库上各种孤立字符识别结果比较的方法、报告和调查》,载于:《第七届国际文件分析和识别会议论文集》(ICDAR’03),第1卷,苏格兰爱丁堡,2003年,第623-628页。
[35] M.Parizeau,A.Lemieux,C.Gagné,使用单笔数据的字符识别实验,收录于:《第六届文件分析和识别国际会议论文集》,2001年,第481-485页。;M.Parizeau,A.Lemieux,C.Gagné,《使用单笔数据的字符识别实验》,载于:《第六届文件分析和识别国际会议论文集》,2001年,第481-485页。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。