拆分MEM swMATH ID: 30182 软件作者: S.Marcus、H.Lee、M.C.Schatz 描述: SplitMEM:带后缀跳过的泛基因组分析的图形算法。动机:基因组学正在从一个单一的每种参考范式扩展到一个更全面的泛基因组方法,该方法可以同时分析多个个体。压缩de Bruijn图是一种复杂的数据结构,用于表示整个种群的基因组。它对共享片段、简单的单核苷酸多态性和复杂的结构变异进行了稳健的编码,远远超出了单个线性序列集合所能代表的范围。结果:我们探索了后缀树和压缩de Bruijn图之间的深层拓扑关系,并引入了一种算法splitMEM,该算法可以在给定的最大基因组大小下直接构造压缩de Bruijn图,在时间和空间上与基因组总数呈线性关系。我们引入后缀跳跃来同时遍历多个后缀链接,并使用它们高效地将最大精确匹配分解为图节点。我们通过分析九株炭疽芽孢杆菌泛基因组和多达62株大肠杆菌,展示了splitMEM的实用性,揭示了它们的核心基因组特性。可用性和实现:源代码和文档可用,开源http://splitmem.sourceforge.net。 主页: https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4253837/ 相关软件: tbwt(待定重量);BWA公司;彩虹鱼;去BGA;vg(vg);HISAT公司 引用于: 3出版物 全部的 前5名8位作者引用 1 乌韦·拜尔 1 托马斯·比切勒 1 拉维尼亚·埃吉迪 1 Felipe A.Louza。 1 乔瓦尼·曼齐尼 1 埃诺·奥勒布什 1 Jouni先生 1 帕斯卡·韦伯 2篇连载文章中引用 1 算法 1 信息与计算 在3个字段中引用 三 计算机科学(68至XX) 1 组合数学(05-XX) 1 生物学和其他自然科学(92-XX) 按年份列出的引文