×

德布鲁因图中的边最小化。 (英语) Zbl 1487.68172号

摘要:本文介绍了与de Bruijn图压缩相关的de Bruij图边最小化问题:求所有阶次中边数最少的序-(k)de Bruiijn图。我们描述了一个有效的算法来解决这个问题。由于边缘最小化问题与称为“隧道”的BWT压缩技术有关,本文还描述了一种最小化隧道BWT长度的方法,该方法可以保留序列分析的有用属性。因此,如前所述,它为解决寻找使空间最小化的最优不相交块这一公开问题提供了重大进展英寸[J.阿兰科等,“惠勒图上的隧道”,载于:数据压缩会议论文集,DCC’19。加利福尼亚州洛斯·阿拉米托斯:IEEE计算机协会。122–131 (2019;doi:10.1109/DCC.2019.00020)].

MSC公司:

68升10 计算机科学中的图论(包括图形绘制)
68页30 编码和信息理论(压缩、压缩、通信模型、编码方案等)(计算机科学方面)
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] de Bruijn,N.G.,一个组合问题,Koninklijke Nederlandse Akademie V.Wetenschappe,49,758-764(1946)·Zbl 0060.02701号
[2] Idury,R.M。;Waterman,M.S.,DNA序列组装的新算法,J.Compute。生物学,2,2,291-306(1995)
[3] 伊克巴尔,Z。;Caccamo,M。;特纳,I。;弗利克,P。;McVean,G.,《利用彩色De Bruijn图进行变体的从头组装和基因分型》,《自然遗传学》。,44226-232(2012年)
[4] 马库斯,S。;Lee,H。;Schatz,M.,SplitMEM:带后缀跳过的泛基因组分析的图形算法,生物信息学,30,24,3476-3483(2014)
[5] 伯罗斯,M。;Wheeler,D.J.,《块分类无损数据压缩算法》,技术代表,第124卷(1994年),数字设备公司
[6] 费拉吉纳,P。;Manzini,G.,压缩文本索引,J.ACM,52,4,552-581(2005)·Zbl 1323.68261号
[7] Baier,U.,关于Burrows-Wheeler变换中未检测到的冗余,(第29届组合模式匹配年度研讨会(2018),3:1-3:15)·Zbl 1497.68168号
[8] 阿兰科,J。;Gagie,T。;纳瓦罗,G。;Benkner,L.S.,Wheeler图上的隧道,(第29届数据压缩会议(2019年)),122-131
[9] 费拉吉纳,P。;纳瓦罗,G.,披萨和辣椒馆,上次参观时间2019年10月
[10] 费拉吉纳,P。;Navarro,G.,重复语料库,上次访问时间2019年10月
[11] Compeau,体育。;佩夫兹纳,P.A。;Tesler,G.,《如何将de Bruijn图应用于基因组组装》,国家生物技术。,29, 11, 987-991 (2011)
[12] 美国拜尔。;Beller,T。;Ohlebusch,E.,用压缩后缀树和Burrows-Wheeler变换进行图形泛基因组分析,生物信息学,32,4,497-504(2016)
[13] Fredkin,E.,Trie memory,Commun。美国医学会,3,9,490-499(1960)
[14] Weiner,P.,线性模式匹配算法,(第14届IEEE交换与自动机理论年会(1973)),1-11
[15] Beller,T。;Berger,K。;Ohlebusch,E.,基因组序列中最大和超最大重复的空间效率计算,(第19届字符串处理和信息检索国际研讨会论文集(2012)),99-110
[16] Ohlebusch,E.,《生物信息学算法:序列分析、基因组重排和系统发育重建》(2013),Oldenbusch Verlag·Zbl 1295.92011年
[17] 费拉吉纳,P。;Manzini,G.,《机会主义数据结构及其应用》(2000年IEEE第41届计算机科学基础年会论文集),390-398
[18] 格罗西,R。;古普塔,A。;Vitter,J.S.,高阶熵压缩文本索引,(第14届ACM-SIAM离散算法年度研讨会论文集(2003)),841-850·Zbl 1092.68584号
[19] 贝尔,T。;高格,S。;Ohlebusch,E。;Schnattinger,T.,基于Burrows-Wheeler变换计算最长公共前缀数组,J.Discrete。算法,18,22-31(2013)·Zbl 1267.68322号
[20] Gagie,T。;纳瓦罗,G。;Puglisi,S.J.,小波树新算法及其在信息检索中的应用,Theor。计算。科学。,426-427, 25-41 (2012) ·Zbl 1243.68161号
[21] Gog,S.图书馆,上次访问时间2019年10月
[22] Rozowsky,J。;阿比佐夫,A。;Wang,J。;阿尔维斯,P。;拉哈,D。;Harmanci,A。;Leng,J。;比约恩森,R。;孔,Y。;北朝鲜北岸。;巴德瓦吉,N。;鲁宾,M。;斯奈德,M。;Gerstein,M.,AlleleSeq:网络框架中等位基因特异性表达和结合的分析,分子系统。生物学,7,第522条pp.(2011)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。