×

小字母的近似Boyer-Moore字符串匹配。 (英语) Zbl 1198.68122号

摘要:最近,针对(k)-失配问题,提出了一种新的近似Boyer-Moore字符串匹配变体。这种变体称为FAAST,专门针对小字母进行调整。我们进一步改进了该算法,提高了预处理和搜索的速度。我们还提出了用于(k)-差分问题的算法的三种变体。我们证明了算法的搜索时间是平均最优的,并且预处理的时间复杂度也低于FAAST。我们的实验表明,我们用于解决(k)-失配问题的算法比FAAST快30%左右,并且新算法与其他最先进的近似字符串匹配算法相比效果很好。

MSC公司:

68页第10页 搜索和排序
65年第68季度 形式语言与自动机

软件:

浮雕
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Arlazarov,V.,Dinic,E.,Kronrod,M.,Faradzev,I.:关于有向图传递闭包的经济构造。多克。阿卡德。Nauk SSSR 194、487–488(1970)(俄语)。Sov的英语翻译。数学。多克。11, 1209–1210 (1975)
[2] Baeza-Yates,R.,Gonnet,G.:文本搜索的新方法。Commun公司。ACM 35(10),74–82(1992)·doi:10.145/135239.135243
[3] Baeza-Yates,R.,Gonnet,G.:不匹配的快速字符串匹配。Inf.计算。108(2), 187–199 (1994) ·Zbl 0804.68064号 ·doi:10.1006/inco.1994.1007
[4] Baeza-Yates,R.,Perleberg,C.:快速实用的近似字符串匹配。信息处理。莱特。59(1),21-27(1996)·Zbl 1046.68514号 ·doi:10.1016/0020-0190(96)00083-X
[5] Boyer,R.,Moore,J.:快速字符串搜索算法。Commun公司。ACM 10(20),762–772(1977)·Zbl 1219.68165号 ·doi:10.1145/359842.359859
[6] Chang,W.,Marr,T.:近似字符串匹配和局部相似性。摘自:第五届组合模式匹配研讨会论文集。LNCS,第807卷,第259–173页。柏林施普林格(1994)
[7] El-Mabrouk,N.,Crochemore,M.:高效近似字符串匹配的Boyer-Moore策略。摘自:第七届组合模式匹配研讨会论文集。LNCS,第1075卷,第24-38页。施普林格,柏林(1996)
[8] Fredriksson,K.,Navarro,G.:平均最优的单个和多个近似字符串匹配。ACM J.实验算法。9(4) (2004) ·Zbl 1085.68735号
[9] Horspool,N.:字符串中的实用快速搜索。柔和。实际。经验10501–506(1980)·doi:10.1002/spe.4380100608
[10] Liu,Z.,Chen,X.,Borneman,J.,Jiang,T.:基因序列近似字符串匹配的快速算法。收录于:第16届组合模式匹配研讨会论文集。LNCS,第3537卷,第79-90页。柏林施普林格出版社(2005)·Zbl 1131.68593号
[11] Masek,W.,Paterson,M.:计算字符串编辑距离的更快算法。J.计算。系统。科学。20, 18–31 (1980) ·兹伯利0436.68044 ·doi:10.1016/0022-0000(80)90002-1
[12] Myers,G.:一种基于动态规划的近似字符串匹配的快速位向量算法。《美国临床医学杂志》46(3),395–415(1999)·Zbl 1065.68663号 ·数字对象标识代码:10.1145/316542.316550
[13] Navarro,G.:在导游的带领下进行近似字符串匹配。ACM计算。Surv公司。33(1), 31–88 (2001) ·doi:10.1145/375360.375365
[14] Navarro,G.,Raffinot,M.:通过结合位并行和后缀自动机快速灵活地进行字符串匹配。ACM J.实验算法。5(4) (2000) ·兹比尔1071.68563
[15] Navarro,G.、Sutinen,E.、Tanninen,J.、Tarhio,J.:使用近似q-grams索引文本。摘自:第11届组合模式匹配研讨会论文集。LNCS,第1848卷,第350-363页。施普林格,柏林(2000)·Zbl 0964.68575号
[16] Rice,P.,Longden,I.,Bleasby,A.:欧洲分子生物学开放软件套件。趋势Genet。16(6), 276–277 (2000) ·doi:10.1016/S0168-9525(00)02024-2
[17] Tarhio,J.,Ukkonen,E.:近似Boyer-Moore字符串匹配。SIAM J.计算。22, 243–260 (1993) ·Zbl 0770.68074号 ·数字对象标识代码:10.1137/0222018
[18] Wu,S.,Manber,U.,Myers,E.:近似有限表达式匹配的次二次算法。《算法》15(1),50–67(1996)·Zbl 0960.68592号 ·doi:10.1007/BF01942606
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。