×

通过融合基于时间和图像的特征进行草图识别。 (英语) Zbl 1209.68438号

小结:基于笔的硬件的可用性不断提高,最近导致了基于草图的用户界面的并行增长。基于草图的用户界面旨在将徒手草图的表达能力与计算机的处理能力相结合。大多数基于草图的系统都需要智能墨水处理能力,这使得开发健壮的草图识别算法成为该领域的主要关注点。迄今为止,草图识别的研究已经产生了各种独立的识别方法,每种方法都使用一种特定的信息(例如,几何和空间约束、基于图像的特征、时间笔划顺序模式)。这些方法是作为独立的算法单独设计的,很少有工作将各种识别方法作为可组合以提高草图识别准确性的替代信息源。在本文中,我们重点介绍了两种这样的方法,并将基于图像的方法与基于时间的方法相融合,试图将对象的外观知识(图像数据)与绘制方式知识(时间数据)相结合。在组合时空信息的过程中,我们还介绍了一种数学上建立良好的融合方法来组合识别器。我们的组合方法既可以用于孤立草图识别,也可以用于全图识别。我们对两个数据库的评估表明,融合基于图像的特征和时间特征可以获得更高的识别率。这些结果首次证实了基于图像和时间的全草图识别方法的互补性,这一点早就有人提出过,但从未得到数据的支持。

MSC公司:

68吨10 模式识别、语音识别
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Willems,D。;尼尔斯,R。;范格文,M。;Vuurpijl,L.,标志性和多笔画手势识别,模式识别,42,12,3303-3312(2009)·Zbl 1182.68210号
[2] Rubine,D.,通过示例指定手势,SIGGRAPH计算机图形,25,4,329-337(1991)
[3] 哈蒙德,T。;Davis,R.,LADDER,一种面向用户界面开发人员的草图语言,《计算机与图形》,28518-532(2005)
[4] 阿尔瓦拉多,C。;Davis,R.,SketchREAD:一个多域草图识别引擎,(UIST’04(2004),ACM:美国纽约州纽约市ACM),23-32
[5] J.-P.Valois、M.Cote、M.Cheriet,《电气简图的在线识别》,载于:ICDAR’01,2001年9月10日至13日,第460-464页。;J.-P.Valois、M.Cote、M.Cheriet,《电气简图的在线识别》,载于:ICDAR’01,2001年9月10日至13日,第460-464页。
[6] Mac,S。;Anquetil,E.,《在线手绘结构化文档的急切解读:DALI方法》,模式识别,42,12,3202-3214(2009)·Zbl 1343.68215号
[7] A.Hall,C.Pomm,P.Widmayer,《多领域草图识别的组合方法》,摘自:欧洲制图学会基于草图的接口和建模研讨会,2007年,第7-14页。;A.Hall,C.Pomm,P.Widmayer,《多领域草图识别的组合方法》,载于:欧洲制图学会基于草图的接口和建模研讨会,2007年,第7-14页。
[8] L.Kara,T.Stahovich,基于图像的可训练符号识别器,用于基于草图的界面,收录于:AAAI秋季研讨会系列2004:使笔式交互智能化和自然化,2004年,第501-517页。;L.Kara,T.Stahovich,基于图像的可训练符号识别器,用于基于草图的界面,收录于:AAAI秋季研讨会系列2004:使笔式交互智能化和自然化,2004年,第501-517页。
[9] H.Hse,A.R.Newton,使用Zernike矩进行略图符号识别,收录于:《模式识别国际会议论文集》,第1卷,2004年,第367-370页。;H.Hse,A.R.Newton,使用Zernike矩进行略图符号识别,收录于:《模式识别国际会议论文集》,第1卷,2004年,第367-370页。
[10] M.Oltmans,《设想草图识别:基于局部特征的非正式草图识别方法》,麻省理工学院博士论文,马萨诸塞州剑桥市,2007年5月。;M.Oltmans,《设想草图识别:基于局部特征的非正式草图识别方法》,麻省理工学院博士论文,马萨诸塞州剑桥市,2007年5月。
[11] S.Simhon,G.Dudek,使用统计模型进行草图解释和细化,收录于:欧洲制图研讨会,2004年,第23-32页。;S.Simhon,G.Dudek,使用统计模型进行草图解释和细化,收录于:欧洲制图研讨会,2004年,第23-32页。
[12] 吴江,Z.-X.Sun,基于HMM的在线多冲程草图识别,载《2005年机器学习与控制论国际会议论文集》,第7卷,2005年8月,第4564-4570页。;W.Jiang,Z.-X.Sun,基于HMM的在线多冲程草图识别,载《2005年机器学习与控制论国际会议论文集》,第7卷,2005年8月,第4564-4570页。
[13] D.Anderson,C.Bailey,M.Skubic,基于草图界面的隐马尔可夫模型符号识别,收录于:AAAI秋季研讨会系列,使笔式交互智能化和自然化,2004年,第15-21页。;D.Anderson,C.Bailey,M.Skubic,基于草图的界面的隐马尔可夫模型符号识别,收录于:AAAI秋季研讨会系列《使笔式交互智能化和自然化》,2004年,第15-21页。
[14] 塞兹金,T.M。;Davis,R.,基于HMM的高效草图识别,(第十届智能用户界面国际会议论文集(2005),ACM:ACM纽约,纽约,美国),281-283
[15] Rabiner,L.,语音识别中隐藏马尔可夫模型和选定应用的教程,IEEE学报,77,2,257-286(1989)
[16] 拉宾纳,L。;Juang,B.-H.,《语音识别基础》(1993),Prentice-Hall公司:Prentice-Hall公司,美国新泽西州上鞍河
[17] Kittler,J。;哈蒂夫,M。;Duin,R.P.W。;Matas,J.,关于组合分类器,IEEE模式分析和机器智能汇刊,20,3226-239(1998)
[18] 徐,L。;Krzyzak,A。;Suen,C.,组合多分类器的方法及其在手写识别中的应用,IEEE系统、人与控制论汇刊,22,3,418-435(1992)
[19] 杰姆斯,A。;Sebe,N.,多模式人机交互:一项调查,计算机视觉和图像理解,108,1-2116-134(2007)
[20] 拉赫曼,A。;Fairhurst,M.,字符识别的多分类器决策组合策略:综述,《国际文档分析与识别杂志》,166-194年7月5日(2003)
[21] C.-C.Chang,C.-J.Lin,(LIBSVM语言)网址:http://www.csie.ntu.edu.tw/~cjlin/libsvm\(\rangle\);C.-C.Chang,C.-J.Lin,(LIBSVM语言)网址:http://www.csie.ntu.edu.tw/~cjlin/libsvm\(\rangle\)
[22] Vapnik,V.,《统计学习理论》(1998),John Wiley&Sons:John Willey&Sons New York·Zbl 0935.62007号
[23] Lin,H。;林,C。;Weng,R.,关于支持向量机的Platt概率输出的注释,机器学习,68,3,267-276(2007)·Zbl 1471.68220号
[24] 肖尔科夫,B。;普拉特,J。;肖-泰勒,J。;Smola,A。;Williamson,R.,估计高维分布的支持,神经计算,13,7,1443-1471(2001)·Zbl 1009.62029号
[25] L.Vuurpijl,NicIcon数据库网址:http://unipen.nici.ru.nl/NicIcon/\(范围);L.Vuurpijl,NicIcon数据库网址:http://unipen.nici.ru.nl/NicIcon/\(范围)
[26] F.手册,101-5-1,作战术语和图形,华盛顿特区,陆军部,第30卷,1997年。;F.手册,101-5-1,作战术语和图形,华盛顿特区,陆军部,第30卷,1997年。
[27] O.E.海军陆战队公报,战术决策游戏符号http://www.mca-marines.org/gatezette/tdgsym.asp\(\范围\);O.E.海军陆战队公报,战术决策游戏符号http://www.mca-marines.org/gatezette/tdgsym.asp\(\等级\)
[28] C.Alvarado,M.Lazzareschi,《真实世界数字逻辑图的属性》,载于:《第一届笔杆学习技术国际研讨会论文集》,2007年,第12-24页。;C.Alvarado,M.Lazzareschi,《真实世界数字逻辑图的属性》,收录于:第一届笔杆学习技术国际研讨会论文集,2007年,第12-24页。
[29] 陈,J。;王,C。;Wang,R.,用于快速SVM多类分类的自适应二叉树,神经计算,72,13-15,3370-3375(2009)
[30] M.Shilman,H.Pasula,S.Russel,R.Newton,墨水解析的统计可视化语言模型,摘自:2002年AAAI草图理解春季研讨会论文集,第126-32页。;M.Shilman,H.Pasula,S.Russel,R.Newton,墨水解析的统计可视化语言模型,收录于:2002年AAAI草图理解春季研讨会论文集,第126-32页。
[31] T.A.Hammond,R.Davis,《快速识别穿插草图》,载于:《图形界面学报》,加拿大安大略省多伦多,加拿大信息处理学会,2009年,第157-166页。;T.A.Hammond,R.Davis,《快速识别穿插草图》,载于:《图形界面会议录》,加拿大安大略省多伦多,加拿大信息处理协会,2009年,第157-166页。
[32] J.Mas,G.Sanchez,J.Llados,B.Lamiroy,识别草图的增量在线解析算法,收录于:国际文件分析与识别会议,2007年,第452-456页。;J.Mas,G.Sanchez,J.Llados,B.Lamiroy,用于识别草图的增量在线解析算法,载于:国际文档分析和识别会议,2007年,第452-456页。
[33] D.Sharon,M.van de Panne,草图识别星座模型,摘自:基于草图的接口和建模欧洲制图研讨会,2006年,第19-26页。;D.Sharon,M.van de Panne,草图识别星座模型,摘自:基于草图的接口和建模欧洲制图研讨会,2006年,第19-26页。
[34] M.Shilman,P.Viola,文本和图形的空间识别和分组,载于:基于草图的界面和建模欧洲图形研讨会,2004年,第91-95页。;M.Shilman,P.Viola,文本和图形的空间识别和分组,载于:基于草图的界面和建模欧洲图形研讨会,2004年,第91-95页。
[35] 塞兹金,T。;Davis,R.,《使用基于时间的图形模型在穿插图形中识别草图》,《计算机与图形》,32,5,500-510(2008)
[36] S.Cates,《改进草图识别的组合表示法》,麻省理工学院博士论文,2009年9月。;S.Cates,《组合表示以改进草图识别》,麻省理工学院博士论文,2009年9月。
[37] Gennari,L。;卡拉·L.B。;斯塔霍维奇,T.F。;Shimada,K.,《结合几何和领域知识解释手绘图表》,《计算机与图形》,29,4,547-562(2005)
[38] P.J.Cowans,M.Szummer,《同时划分和标记的图形模型》,载于:《人工智能与统计国际研讨会》,2005年,第73-80页。;P.J.Cowans,M.Szummer,《同时划分和标记的图形模型》,载于:《人工智能和统计国际研讨会》,2005年,第73-80页。
[39] Y.Qi,M.Szummer,T.P.Minka,贝叶斯条件随机场图结构识别,收录于:IEEE计算机视觉与模式识别会议,2005年第2卷,第191-196页。;Y.Qi,M.Szummer,T.P.Minka,贝叶斯条件随机场图结构识别,收录于:IEEE计算机视觉与模式识别会议,2005年第2卷,第191-196页。
[40] T.M.Sezgin,手绘草图识别的通用和基于HMM的方法,收录于:麻省理工学院学生氧气研讨会论文集,2003年。;T.M.Sezgin,手绘草图识别的通用和基于HMM的方法,收录于:麻省理工学院学生氧气研讨会论文集,2003年。
[41] 冯·G。;维亚德·戈丁,C。;Sun,Z.,使用2D动态编程进行在线手绘电路图识别,模式识别,42,12,3215-3223(2009)·Zbl 1186.68410号
[42] D.Arrivoult,N.Richard,C.Fernandez-Maloigne,P.Bouyer,旧手写字符识别统计和结构方法之间的协作,收录于:第五届IAPR研讨会,第3434卷,Mars 2005,第291-300页。;D.Arrivoult,N.Richard,C.Fernandez-Maloigne,P.Bouyer,旧手写字符识别统计和结构方法之间的协作,收录于:第五届IAPR研讨会,第3434卷,Mars 2005,第291-300页·Zbl 1119.68394号
[43] Foggia,P。;Sansone,C。;托托雷拉,F。;Vento,M.,结合统计和结构方法进行手写字符描述,图像和视觉计算,17,9,701-711(1999)
[44] Steinherz,T。;Rivlin,E。;内部人,N。;Neskovic,P.,《在线和伪在线信息集成草书识别》,IEEE模式分析和机器智能汇刊,27,5,669-683(2005)
[45] H.Oda,B.Zhu,J.Tokuno,M.Onuma,A.Kitadai,M.Nakagawa,紧凑型在线和离线组合识别器,收录于:第十届手写识别前沿国际研讨会,2006年第1卷,第133-138页。;H.Oda,B.Zhu,J.Tokuno,M.Onuma,A.Kitadai,M.Nakagawa,紧凑型在线和离线组合识别器,收录于:第十届手写识别前沿国际研讨会,2006年第1卷,第133-138页。
[46] H.Tanaka,K.Nakajima,K.Ishigaki,K.Akiyama,M.Nakagawa,基于联机脱机识别集成的混合手写字符识别系统,收录于:文件分析与识别国际会议,1999年9月,第209-212页。;H.Tanaka,K.Nakajima,K.Ishigaki,K.Akiyama,M.Nakagawa,基于联机脱机识别集成的混合手写字符识别系统,收录于:国际文件分析与识别会议,1999年9月,第209-212页。
[47] M.Liwicki,H.Bunke,基于HMM的手写白板笔记在线识别,收录于:手写识别前沿国际研讨会,2006年,第595-599页。;M.Liwicki,H.Bunke,基于HMM的手写白板笔记在线识别,收录于:《手写识别前沿国际研讨会》,2006年,第595-599页。
[48] M.Liwicki,A.Graves,H.Bunke,J.Schmidhuber,基于双向长短期记忆网络的在线手写识别新方法,收录于:2007年国际文档分析与识别会议,第367-371页。;M.Liwicki,A.Graves,H.Bunke,J.Schmidhuber,基于双向长短期记忆网络的在线手写识别新方法,收录于:国际文档分析与识别会议,2007年,第367-371页。
[49] 利威基,M。;Bunke,H.,为手写文本行识别结合不同的在线和离线系统,模式识别,42,12,3254-3263(2009)·Zbl 1182.68198号
[50] 利威基,M。;Bunke,H.公司。;皮特曼,J。;Knerr,S.,《结合不同系统进行手写文本行识别》,机器视觉与应用,1-13(2009)
[51] Belongie,S。;Malik,J。;Puzicha,J.,使用形状上下文的形状匹配和对象识别,IEEE模式分析和机器智能汇刊,24,4,509-522(2002)
[52] Learnd-Miller,E.G.,《通过连续联合校准的数据驱动图像模型》,IEEE模式分析和机器智能汇刊,28,2,236-250(2006)
[53] L.Bahl,P.Brown,P.de Souza,R.Mercer,语音识别隐马尔可夫模型参数的最大互信息估计,收录于:IEEE声学、语音和信号处理国际会议,第11卷,1986年。第49-52页。;L.Bahl,P.Brown,P.de Souza,R.Mercer,语音识别隐马尔可夫模型参数的最大互信息估计,收录于:IEEE声学、语音和信号处理国际会议,第11卷,1986年。第49-52页。
[54] M.Collins,《隐马尔可夫模型的判别训练方法:感知机算法的理论和实验》,载于《ACL-02自然语言处理经验方法会议论文集》,美国新泽西州莫里斯敦,计算语言学协会,2002年,第1-8页。;M.Collins,《隐马尔可夫模型的判别训练方法:感知机算法的理论和实验》,载于《ACL-02自然语言处理经验方法会议论文集》,美国新泽西州莫里斯敦,计算语言学协会,2002年,第1-8页。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。