最小值2

Minimap2:核苷酸序列的成对比对。测序技术的最新进展预示着超长读取平均为∼100kb,高通量的全长mRNA或cDNA读取,基因组长度超过100mb。现有的对准程序无法或效率低下,无法大规模处理这些数据,这就迫切需要开发新的对准算法。结果:Minimap2是一个通用的比对程序,可以将DNA或长mRNA序列与大型参考数据库进行比对。它的工作原理是精确的短读长度≥100bp,基因组读数≥1kb,错误率∼15%,全长有噪声的直接RNA或cDNA读写和组装contigs或数百兆碱基的紧密相关的全染色体。Minimap2做了分割读取对齐,对长插入和删除使用凹间隙成本,并引入了新的启发式方法来减少伪对齐。在可比精度下,它是主流短读映射器的3-4倍,在更高的精确度上比长读基因组或cDNA映射器快30倍以上,超过了大多数专门用于一种比对的比对器。可用性和实现:https://github.com/lh3/minimap2。