×

一种新的从右到左次线性扫描关键字模式匹配算法分类。 (英语) 兹比尔1209.68170

摘要:提出了一种新的次线性(多)关键词模式匹配算法分类。基于第二和第三作者早期的分类法,这种新的分类法不仅包括基于后缀的算法,还包括基于因子和基于因子的算法。特别是,我们展示了如何将基于后缀(Commentz-Walter样)、基于因子和基于因子的次线性关键字模式匹配算法视为一般次线性算法框架的实例化。在处理过程中,这些算法向前或从左到右移动或跳转文本,并从文本中的位置开始向后或从右到左读取,即它们读取文本某些前缀的后缀。他们使用有限自动机高效计算特定语言中的字符串成员身份。此外,我们还展示了为基于后缀的算法定义的移位函数可用于基于因子和基于因子的算法。分类法的基础是通过添加算法和问题细节,从公共起点派生算法,以获得高效或众所周知的算法。这样的演示提供了算法的正确性论证,以及算法如何相互关联的清晰性。此外,它有助于构建算法工具包。

MSC公司:

68页第10页 搜索和排序
65年第68季度 形式语言和自动机
68周05 非数值算法
68吨10 模式识别、语音识别

软件:

备件
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Aho,A.V.:《寻找字符串模式的算法》,《理论计算机科学手册》,255-300(1990)·Zbl 0900.68249号
[2] 阿霍,A.V。;Corasick,M.J.:《高效字符串匹配:书目搜索的辅助工具》,《ACM通讯》第18期,第333-340页(1975年)·Zbl 0301.68048号 ·doi:10.1145/360825.360855
[3] Allauzen,C。;克罗西莫尔,M。;Raffinot,M.:通过弱因子识别进行有效的字符串匹配实验,Lncs 2089(2001)·Zbl 0992.68501号
[4] C.Allauzen,M.Raffinot,《Oracle des facteurs d'un ensembly de mots》,技术代表99-11,马内拉瓦莱大学Gaspard-Monge研究所,1999年·Zbl 0964.68078号
[5] Apostolico,A。;Galil,Z.:模式匹配算法(1997)·Zbl 0874.68006号
[6] G.Barla-Szabo,《图形表示的分类法》,硕士论文,比勒陀利亚大学计算机科学系,2002年11月。
[7] 博伊尔,R.S。;Moore,J.S.:快速字符串搜索算法,《ACM 20通信》,第10期,第62-72页(1977年)·Zbl 1219.68165号 ·doi:10.1145/359842.359859
[8] 克利奥帕(Cleophas,L.)。;沃森,B.W。;Zwaan,G.:基于自动机的次线性关键词模式匹配,Lncs 3246(2004)·Zbl 1111.68428号
[9] L.Cleophas,B.W.Watson,G.Zwaan,《次线性关键词模式匹配算法的新分类法》,技术报告04/07,埃因霍温理工大学数学与计算机科学系,2004年3月·兹比尔1209.68170
[10] L.Cleophas,G.Zwaan,B.W.Watson,《构建因子预言》,技术代表04/01,埃因霍温理工大学数学和计算机科学系,2004年1月·兹比尔1135.68453
[11] 克利奥帕(Cleophas,L.)。;Zwaan,G。;Watson,B.W.:《构造因子预言》,《自动机、语言和组合学杂志》10,第5/6期,627-640页(2005年)·Zbl 1135.68453号
[12] L.G.W.A.Cleophas,《迈向空闲时间:关键字模式匹配算法的新分类法和工具包》,埃因霍温理工大学数学与计算机科学系硕士论文,2003年8月。
[13] L.G.W.A.Cleophas,Tree algorithms:two taxonomies and A toolkit,Eindhoven University of Technology数学与计算机科学系博士论文,2008年4月。
[14] 评论-Walter,B.:字符串匹配算法的平均速度,第六届自动控制、语言和编程国际学术讨论会论文集(1979年)·Zbl 0407.68092号
[15] B.Commentz Walter,一种平均快速的字符串匹配算法,技术代表TR 79.09.007,IBM德国,海德堡科学中心,1979年·Zbl 0407.68092号
[16] 克罗西莫尔,M。;Czumaj,A。;Ga\ogonek sieniec,L。;Jarominek,S。;勒克罗克,T。;普兰多夫斯基,W。;Rytter,W.:加速两种字符串匹配算法,Algorithmica 12,No.4/5,247-267(1994)·Zbl 0942.68574号 ·doi:10.1007/BF01185427
[17] 克罗西莫尔,M。;Czumaj,A。;Ga\ogonek sieniec,L。;勒克罗克,T。;普兰多夫斯基,W。;Rytter,W.:快速实用多模式匹配,信息处理字母71,No.3–4,107-113(1999)·Zbl 0999.68246号 ·doi:10.1016/S0020-0190(99)00092-7
[18] 克罗西莫尔,M。;Hancart,C.:匹配模式的自动机,形式语言手册2(1997)
[19] 克罗西莫尔,M。;Hancart,C。;Lecroq,T.:字符串算法(2007)·兹比尔1137.68060
[20] 克罗西莫尔,M。;Rytter,W.:《弦论的宝石——文本算法》(2003)·Zbl 1078.68151号
[21] Dijkstra,E.W.:编程学科(1976)·Zbl 0368.68005号
[22] Dijkstra,E.W。;Scholten,C.S.:谓词演算和程序语义,(1990)·Zbl 0698.68011号
[23] 范,J.-J。;Su,K.-Y.:一种有效的多模式匹配算法,IEEE事务知识和数据工程5,339-351(1993)
[24] Fan,J.-J。;Su,K.-Y.:一种有效的多模式匹配算法,计算机算法:字符串模式匹配策略,91-104(1994)
[25] Horspool,R.N.:字符串中的实用快速搜索,软件–实践经验10,第6期,501-506(1980)
[26] H.B.M.Jonkers,《抽象、规范和实现技术及其在垃圾收集中的应用》,技术代表166,数学中心,阿姆斯特丹,1983年·Zbl 0513.68008号
[27] Knuth,D.E。;莫里斯,J.H。;Pratt,V.R.:字符串中的快速模式匹配,SIAM计算杂志6,第2期,323-350(1977)·Zbl 0372.68005号 ·数字对象标识代码:10.1137/0206024
[28] A.Mancheron,C.Moan,《由因子和后缀oracles识别的语言的组合表征》,载于:2004年布拉格弦学会议论文集,捷克技术大学计算机科学与工程系,布拉格,2004年·兹比尔1105.68024
[29] 《韦氏大学词典》(1993)
[30] 纳瓦罗,G。;Raffinot,M.:结合位并行和后缀自动机的快速灵活字符串匹配,ACM实验算法期刊5,第4期(2000)·Zbl 1071.68563号 ·数字对象标识代码:10.1145/351827.351829
[31] 纳瓦罗,G。;Raffinot,M.:《字符串中的灵活模式匹配:文本和生物序列的实用在线搜索算法》(2002年)·Zbl 0992.92029号
[32] Smyth,W.:字符串中的计算模式,(2003)
[33] Sunday,D.M.:一种非常快速的子串搜索算法,《ACM通信》33,第8期,132-142(1990)
[34] J.P.H.W.van den Eijnde,《非循环图的程序推导及相关问题》,技术代表92/04,埃因霍温理工大学计算科学学院,1992年。
[35] B.W.Watson,《正则语言算法的分类和工具包》,埃因霍温理工大学计算科学学院博士论文,1995年9月·Zbl 0832.68064号
[36] B.W.Watson,Commentz-Walter-style多关键字模式匹配算法的新家族,载于:2000年布拉格弦学俱乐部研讨会论文集,捷克技术大学计算机科学与工程系,布拉格,2000年。
[37] 沃森,B.W。;Cleophas,L.:《备件:字符串模式识别的C++工具包》,《软件–实践经验》34,第7期,697-710(2004)
[38] 沃森,B.W。;Zwaan,G.:《次线性多关键字模式匹配算法分类》,《计算机编程科学》27,第2期,第85-118页(1996)·Zbl 0858.68026号 ·doi:10.1016/0167-6423(96)00008-1
[39] Wu,U.Manber,多模式搜索的快速算法,技术代表TR-94-17,亚利桑那大学计算机科学系,亚利桑那州图森市,1994年·Zbl 0807.68037号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。