利巴普米斯

libgapmis:扩展短读对齐。背景:最近出版了各种各样的短读比对程序,以解决将数百万个短阅读映射到参考基因组的问题,重点关注程序的不同方面,如时间和记忆效率、灵敏度和准确性。这些工具允许对齐中出现少量不匹配;然而,他们允许差距的能力差异很大,许多人表现不佳或根本不允许。种子和扩展策略应用于大多数短读对齐程序。在将参考序列的子串与短读的高质量前缀(seed)对齐之后,一个重要的问题是在后续的参考序列的子串和剩余的低质量读取后缀之间找到可能的最佳对齐方式。事实上,阅读时间很短,而且在各种研究中观察到的空白出现频率相当低,这表明将这些阅读(部分)与单个空白对齐实际上是可取的。结果:在本文中,我们介绍了libgapmis,一个扩展成对短读对齐的库。除了标准的CPU版本,它还包括基于SSE和GPU的超快实现。libgapmis基于一种算法,它是对传统动态规划矩阵进行序列比对的一种改进版本。大量的实验结果表明,与其他程序相比,这个库中提供的CPU版本的功能使计算速度提高了20倍。与CPU版本相比,类似的基于SSE和GPU的实现将计算速度分别提高了6倍和11倍。该库还为用户提供了根据观察到的间隙发生频率和读取长度将读取拆分为片段的灵活性,从而允许对齐中存在可变但有限制的间隙数量。结论:我们提出了libgapmis,一个扩展成对短阅读比对的库。我们证明libgapmis比现有的算法更适合这个任务,并且效率更高。所提供的功能可以无缝地集成到任何短读对齐管道中,这一事实突显了我们贡献的重要性。libgapmis的开源代码可以在http://www.exelixis-lab.org/gapmis。