利纳·萨梅拉;乔尔马·塔尔希奥;佩特里·卡尔西 小字母的近似Boyer-Moore字符串匹配。 (英语) Zbl 1198.68122号 算法 58,第3期,591-609(2010). 摘要:最近,针对(k)-失配问题,提出了一种新的近似Boyer-Moore字符串匹配变体。这种变体称为FAAST,专门针对小字母进行调整。我们进一步改进了该算法,提高了预处理和搜索的速度。我们还提出了用于(k)-差分问题的算法的三种变体。我们证明了算法的搜索时间是平均最优的,并且预处理的时间复杂度也低于FAAST。我们的实验表明,我们用于解决(k)-失配问题的算法比FAAST快30%左右,并且新算法与其他最先进的近似字符串匹配算法相比效果很好。 引用于2文件 MSC公司: 68页第10页 搜索和排序 65年第68季度 形式语言与自动机 关键词:近似字符串匹配;编辑距离;汉明距离;算法的复杂性;生物序列 软件:浮雕 PDF格式BibTeX公司 XML格式引用 \textit{L.Salmela}等人,Algorithmica 58,No.3,591--609(2010;Zbl 1198.68122) 全文: 内政部 参考文献: [1] Arlazarov,V.,Dinic,E.,Kronrod,M.,Faradzev,I.:关于有向图传递闭包的经济构造。多克。阿卡德。Nauk SSSR 194、487–488(1970)(俄语)。Sov的英语翻译。数学。多克。11, 1209–1210 (1975) [2] Baeza-Yates,R.,Gonnet,G.:文本搜索的新方法。Commun公司。ACM 35(10),74–82(1992)·doi:10.145/135239.135243 [3] Baeza-Yates,R.,Gonnet,G.:不匹配的快速字符串匹配。Inf.计算。108(2), 187–199 (1994) ·Zbl 0804.68064号 ·doi:10.1006/inco.1994.1007 [4] Baeza-Yates,R.,Perleberg,C.:快速实用的近似字符串匹配。信息处理。莱特。59(1),21-27(1996)·Zbl 1046.68514号 ·doi:10.1016/0020-0190(96)00083-X [5] Boyer,R.,Moore,J.:快速字符串搜索算法。Commun公司。ACM 10(20),762–772(1977)·Zbl 1219.68165号 ·doi:10.1145/359842.359859 [6] Chang,W.,Marr,T.:近似字符串匹配和局部相似性。摘自:第五届组合模式匹配研讨会论文集。LNCS,第807卷,第259–173页。柏林施普林格(1994) [7] El-Mabrouk,N.,Crochemore,M.:高效近似字符串匹配的Boyer-Moore策略。摘自:第七届组合模式匹配研讨会论文集。LNCS,第1075卷,第24-38页。施普林格,柏林(1996) [8] Fredriksson,K.,Navarro,G.:平均最优的单个和多个近似字符串匹配。ACM J.实验算法。9(4) (2004) ·Zbl 1085.68735号 [9] Horspool,N.:字符串中的实用快速搜索。柔和。实际。经验10501–506(1980)·doi:10.1002/spe.4380100608 [10] Liu,Z.,Chen,X.,Borneman,J.,Jiang,T.:基因序列近似字符串匹配的快速算法。收录于:第16届组合模式匹配研讨会论文集。LNCS,第3537卷,第79-90页。柏林施普林格出版社(2005)·Zbl 1131.68593号 [11] Masek,W.,Paterson,M.:计算字符串编辑距离的更快算法。J.计算。系统。科学。20, 18–31 (1980) ·兹伯利0436.68044 ·doi:10.1016/0022-0000(80)90002-1 [12] Myers,G.:一种基于动态规划的近似字符串匹配的快速位向量算法。《美国临床医学杂志》46(3),395–415(1999)·Zbl 1065.68663号 ·数字对象标识代码:10.1145/316542.316550 [13] Navarro,G.:在导游的带领下进行近似字符串匹配。ACM计算。Surv公司。33(1), 31–88 (2001) ·doi:10.1145/375360.375365 [14] Navarro,G.,Raffinot,M.:通过结合位并行和后缀自动机快速灵活地进行字符串匹配。ACM J.实验算法。5(4) (2000) ·兹比尔1071.68563 [15] Navarro,G.、Sutinen,E.、Tanninen,J.、Tarhio,J.:使用近似q-grams索引文本。摘自:第11届组合模式匹配研讨会论文集。LNCS,第1848卷,第350-363页。施普林格,柏林(2000)·Zbl 0964.68575号 [16] Rice,P.,Longden,I.,Bleasby,A.:欧洲分子生物学开放软件套件。趋势Genet。16(6), 276–277 (2000) ·doi:10.1016/S0168-9525(00)02024-2 [17] Tarhio,J.,Ukkonen,E.:近似Boyer-Moore字符串匹配。SIAM J.计算。22, 243–260 (1993) ·Zbl 0770.68074号 ·数字对象标识代码:10.1137/0222018 [18] Wu,S.,Manber,U.,Myers,E.:近似有限表达式匹配的次二次算法。《算法》15(1),50–67(1996)·Zbl 0960.68592号 ·doi:10.1007/BF01942606 此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。