捣碎

Mash:基于MinHash的快速基因组和亚基因组距离估计。Mash扩展了MinHash降维技术,引入了成对变异距离和P值显著性检验,实现了对大量序列集合的有效聚类和搜索。Mash将大序列和序列集简化为具有代表性的小草图,从中可以快速估计全局变异距离。我们演示了几个用例,包括在33个CPU小时内对所有54118个NCBI RefSeq基因组进行聚类;使用已组装或未组装的Illumina、Pacific Biosciences和Oxford Nanopore数据进行实时数据库搜索;以及按组成对数百个元基因组样本进行可伸缩聚类。Mash是在BSD许可下免费发布的(https://github.com/marbl/Mash)。

此软件的关键字

这里的任何内容都将在支持canvas元素的浏览器上被替换