×

层次重叠图。 (英文) Zbl 1478.68222号

摘要:给定一组有限单词,重叠图(OG)是一个完整的加权有向图,其中每个单词都是一个节点,弧的权重等于一个单词与另一个单词之间最长重叠的长度(重叠是一个不对称概念)。OG用于组装DNA片段或计算最短超弦,这些超弦是输入的压缩表示。OG需要字数为二次方的空间,这限制了它的可扩展性。层次重叠图(HOG)是一种替代图,它也对所有最大重叠进行编码,但使用的空间在输入单词的长度总和中是线性的。我们提出了第一种在线性空间中为等长单词构建HOG的算法。

MSC公司:

68兰特 计算机科学中的图论(包括图形绘制)
68第05页 数据结构
68周27 在线算法;流算法
68瓦32 字符串上的算法
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] 阿霍,阿尔弗雷德五世。;Margaret J.Corasick,《高效字符串匹配:书目搜索的辅助工具》,Commun。ACM,18333-340(1975年)·Zbl 0301.68048号
[2] 伊兰本巴萨;Chor,Benny,使用增量散列构造字符串图,生物信息学,30,24,3515-3523(2014年9月)
[3] 阿夫林·布鲁姆;姜涛;李明;约翰·特隆普(John Tromp);Yannakakis,Mihalis,最短超弦的线性近似,(美国计算机学会计算理论研讨会(1991)),328-336·Zbl 0812.68075号
[4] Cánovas,罗德里戈;巴斯蒂安·卡佐;Rivals,Eric,《压缩重叠指数》(2017),CoRR
[5] 巴斯蒂安·卡佐;Cánovas,罗德里戈;Rivals,Eric,压缩空间中最短DNA循环覆盖,(数据压缩会议(2016),IEEE计算机社会出版社),536-545
[6] 巴斯蒂安·卡佐;Samuel Juhel;Rivals,Eric,最短线性超弦的实用上下限,(第17届国际实验算法研讨会(SEA))。第17届国际研讨会。关于实验算法(SEA),LIPIcs,第103卷(2018)),第18条pp·Zbl 1493.68408号
[7] 巴斯蒂安·卡佐;Rivals,Eric,字符串最短循环覆盖的线性时间算法,J.Discret。算法,37,56-67(2016)·Zbl 1362.68301号
[8] Dinh,Hieu;Rajasekaran,Sangustevar,表示精确匹配重叠图的高效存储数据结构及其在下一代DNA组装中的应用,生物信息学,27,141901-1907(2011年6月)
[9] 亚历山大·戈洛夫涅夫;亚历山大·库利科夫。;Mihajlin,Ivan,用少于(2^{\text{n}})个步骤求解有界长度字符串的SCS,Inf.Process。莱特。,114, 8, 421-425 (2014) ·Zbl 1296.68203号
[10] 乔治·冈内拉(Giorgio Gonnella);Kurtz,Stefan,Readjoiner:一种快速且内存高效的基于字符串图的序列汇编程序,BMC Bioninform。,13、1、82(2012年5月)
[11] 丹·古斯菲尔德(Dan Gusfield);Gad M.Landau。;Schieber,Baruch,全对后缀前缀问题的有效算法,Inf.Process。莱特。,181-185年4月41日(1992年)·Zbl 0748.68021号
[12] Lim,Jihyuk;Park,Kunsoo,全对后缀前缀问题的快速算法,Theor。计算。科学。,698, 14-24 (2017) ·Zbl 1380.68479号
[13] Myers,Eugene W.,片段组装字符串图,生物信息学,21,增刊2,79-85(2005)
[14] 汉努·佩尔托拉;Söderlund,汉斯;乔尔马·塔尔霍;Ukkonen,Esko,分子遗传学中一些字符串匹配问题的算法,(IFIP大会(1983)),59-64
[15] Jared T.Simpson。;Richard Durbin,《使用FM-index高效构建装配字符串图》,生物信息学,26,12,第6篇pp.(2010),i367-i373
[16] 乔尔马·塔尔霍;Ukkonen,Esko,构造最短公共超环的贪婪近似算法,Theor。计算。科学。,57, 131-145 (1988) ·Zbl 0644.68090号
[17] William H.A.Tustumi。;西蒙·高格(Simon Gog);Guilherme P.泰勒斯。;Louza,Felipe A.,全对后缀前缀问题的改进算法,J.Discret。算法,37,34-43(2016)·Zbl 1362.68305号
[18] Ukkonen,Esko,求近似最短公共超弦的线性时间算法,算法,5313-323(1990)·Zbl 0696.68075号
[19] 瓦利马基,尼科;苏珊娜·拉德拉;Mäkinen,Veli,近似所有对后缀/前缀重叠,Inf.Comput。,213, 49-58 (2012) ·Zbl 1254.68361号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。