×

有向图中气泡的一系列基于树的生成器。 (英语) Zbl 1489.05133号

摘要:气泡是有向图中一对内部顶点不相交的\((s,t)\)路径。在根据读取RNA和DNA数据构建的de Bruijn图中,气泡代表有趣的生物事件,例如选择性剪接(as)和等位基因差异(SNP和indels)。然而,根据实际数据构建的deBruijn图中的所有气泡集通常太大,无法在实践中有效地枚举和分析。特别是,尽管在这一领域进行了大量研究,但列出气泡仍然是在无参考环境中检测AS事件的工具的主要瓶颈。最近,在[V.阿库尼亚等人,Algorithmica 82,No.4,898–914(2020;Zbl 1435.68224号)]引入了气泡生成器的概念,作为获得图的气泡空间的紧凑表示的一种方法。尽管这种气泡发生器在发现AS事件方面非常有效,但初步实验表明,它比最先进的方法慢大约5倍。在本文中,我们提出了一种新的气泡发生器系列,该系列大大改进了以前的工作:该新系列中的气泡发生器大约快了两个数量级,并且在识别AS事件时仍能达到类似的精度。为了突出我们的新型气泡发生器的实用价值,我们还报告了在实际数据集上的一些实验结果。

MSC公司:

05C85号 图形算法(图形理论方面)
05C20号 有向图(有向图),比赛
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] V.Acuána、R.Grossi、G.F.Italiano、L.Lima、R.Rizzi、G.Sacomoto、M.Sagot和B.Sinaimeri。关于有向图中的气泡生成器。算法,82(4):898-9142020·Zbl 1435.68224号 ·doi:10.1007/s00453-019-00619-z
[2] V.Acuána、L.Lima、G.F.Italiano、L.Pep'e Sciarria、M.Sagot和B.Sinaimeri。有向图中气泡的基于树的生成器系列。InCombinatorial Algorithms-第31届国际研讨会,IWOCA 2020,法国波尔多,2020年6月8日至10日,会议记录,第17-29页,2020年·Zbl 07600995号
[3] U.Ashraf、C.Benoit-Pilven、V.Navratil、C.Ligneau、G.Fournier、S.Munier、O.Sismeiro、J.-Y.Copp´ee、V.Lacroix和N.Naffakh。流感病毒感染引起宿主细胞剪接的广泛改变。NAR基因组学和生物信息学,2(4),2020年11月。
[4] C.Benoit-Pilven、C.Marchet、E.Chautard、L.Lima、M.-P.Lambert、G.Sacomoto、A.Rey、A.Cologne、S.Terrone、L.Dulaurier、J.-B.Claude、C.Bourgeois、D.Auboeuf和V.Lacroix。从RNAseq数据进行选择性剪接注释和差异分析的装配第一法和映射第一法的互补性。《科学报告》,8(1),2018年。
[5] E.Birmel´E、P.Crescenzi、R.Ferreira、R.Grossi、V.Lacroix、A.Marino、N.Pisanti、G.Sacomoto和M.-F.Sagot。有向图中的有效气泡枚举。InSPIRE,第118-1292012页·doi:10.1007/978-3-642-34109-0_13
[6] L.Brankovic、C.S.Iliopoulos、R.Kundu、M.Mohamed、S.P.Pissis和F.Vayani。用于基因组组装的线性超气泡识别算法。理论计算机科学,609:374-3832016·Zbl 1331.92091号 ·doi:10.1016/j.tcs.2015.10.021
[7] J.Cheriyan、M.-Y.Kao和R.Thurimella。扫描优先搜索和稀疏证书:改进的k顶点连接并行算法。SIAM计算机杂志,22(1):157-1741993·Zbl 0767.68048号 ·doi:10.1137/0222013
[8] T.H.Cormen、C.E.Leiserson、R.L.Rivest和C.Stein。算法导论,第三版。麻省理工学院出版社,2009年第3版·Zbl 1187.68679号
[9] A.Dobin、C.A.Davis、F.Schlesinger、J.Drenkow、C.Zaleski、S.Jha、P.Batut、M.Chaisson和T.R.Gingeras。STAR:超快通用RNA-seq对准器。生物信息学,29(1):15-212013·doi:10.1093/bioinformatics/bts635
[10] P.M.Gleiss、J.Leydold和P.F.Stadler。强连通有向图的回路基。讨论数学图论,23(2):241-2602003·Zbl 1055.05068号
[11] R.H.Hammack和P.C.Kainen。Kn,nifn≥8不存在稳健循环基。离散应用数学,235:206-2112018·Zbl 1375.05150号 ·doi:10.1016/j.dam.2017.1001
[12] Z.Iqbal、M.Caccamo、I.Turner、P.Flicek和G.McVean。使用彩色De-bruijn图对变体进行从头组装和基因分型。《自然遗传学》,44(2):226-2322012年·doi:10.1038/
[13] P.C.凯南。基于稳健的循环基础。离散数学电子笔记,11:430-4372002。第九届四年一度的图论、组合数学、算法和应用国际会议·Zbl 1075.05555号
[14] T.Kavitha、C.Liebchen、K.Mehlhorn、D.Michail、R.Rizzi、T.Ueckerdt和K.A.Zweig。图的特征、算法、复杂性和应用中的循环基础。《计算机科学评论》,3(4):199-2432009·Zbl 1301.05195号 ·doi:10.1016/j.cosrev.2009.08。
[15] T.Kavitha和K.Mehlhorn。有向图中计算最小循环基的算法。计算系统理论,40(4):485-5052007·Zbl 1121.68087号 ·doi:10.1007/s00224-006-1319-6
[16] G.基尔霍夫。Ueber die aufl–osung der gleichungen,auf welche man bei der untersuchung der linearen vertheilung镀锌街ome gef–uhrt wird。《物理学年鉴》,148(12):497-5081847。
[17] K.Klemm和P.F.Stadler。关于基本、非基本和稳健循环基础的注释。离散应用数学,157(10):2432-24382009。计算生物学中的网络·Zbl 1163.92002年 ·doi:10.1016/j.dam.2008.06.047
[18] L.Lima、B.Sinaimeri、G.Sacomoto、H.Lopez-Maestre、C.Marchet、V.Miele、M.-F.Sagot和V.Lacroix。在短RNA-seq读取的局部和全局从头转录组集合中,通过重复进行捉迷藏。《分子生物学算法》,2017年12月。
[19] S.MacLane。平面图的组合条件。《数学基础》,28:22-321937年·Zbl 0015.37501号
[20] J.R.Miller、S.Koren和G.Sutton。下一代测序数据的汇编算法。基因组学,95(6):315-3272010·doi:10.1016/j.ygeno.2010.03。
[21] T.Onodera、K.Sadakane和T.Shibuya。检测装配图中的超级气泡。《生物信息学中的算法》,《生物信息学》第8126卷,第338-348页。施普林格-柏林-海德堡,2013年·doi:10.1007/978-3-642-40453-5_26
[22] G.Sacomoto、J.Kielbassa、R.Chikhi、R.Uricaru、P.Antoniou、M.-F.Sagot、P.Peterlongo和V.Lacroix。Kissplice:de-novo从rna-seq数据中调用替代剪接事件。BMC生物信息学,13(S-6):S52012·doi:10.1186/1471-2105-13-S6-S5
[23] G.萨克莫托、V.拉克鲁瓦和M.-F.萨格特。有向图中长度约束气泡计数的多项式延迟算法及其在RNA-seq数据中选择性剪接检测中的应用。InWABI,第99-111页,2013年。
[24] 桑梅特先生。完整的可选拼接事件是拼接图中的气泡。计算生物学杂志,16(8):1117-11402009·doi:10.1089/cmb.2009.0108
[25] W.-K.Sung、K.Sadakane、T.Shibuya、A.Belorkar和I.Pyrogova。检测超气泡的AnO(mlogm)时间算法。IEEE/ACM传输。计算。生物信息学,12(4):770-7772015·doi:10.1109/TCBB.2014.2385696
[26] R.Uricaru、G.Rizk、V.Lacroix、E.Quillery、O.Plantard、R.Chikhi、C.Lemaitre和P.Peterlongo。孤立SNP的无参考检测。核酸研究,43(2):e11,2015·doi:10.1093/nar/gku1187
[27] R.Younsi和D.MacLean。使用2k+2气泡搜索查找k-mer图中的单核苷酸多态性。生物信息学,31(5):642-6462015。简介序言偶数子图空间中的气泡发生器从生成树定义气泡发生器实验结果基于生成树的选择对气泡发生器特性的实证分析气泡发生器在RNA-seq数据中AS事件识别中的应用数据集1:与SP-Gen和数据集2的KisSplice分析进行比较:与KisSplce结论和未决问题进行比较·数字对象标识代码:10.1093/
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。