幻灯片

SlideSort:所有配对的相似性搜索简短的阅读。动机:DNA测序技术的最新进展要求快速而准确的算法来评估大量短文阅读的序列相似性。从串池中寻找相似对是从头基因组组装、全基因组比对和其他重要分析的基本过程。结果:在这项研究中,我们设计并实现了一个精确的算法SlideSort,它可以根据编辑距离从字符串池中找到所有相似的对。利用一种高效的滑动链搜索算法来发现狭长的搜索链。与现有的基于单k-mers的方法相比,该方法在减少编辑距离计算次数方面更为有效。与BWA等回溯方法相比,我们的方法在寻找远程匹配方面要快得多,容易扩展到数千万个序列。我们的软件有一个附加的单链接聚类功能,这有助于总结短文以便进一步处理。可用性:可执行二进制文件和C++库可在http://www.cbrc.jp/shimizu/slidesort/forlinux和Windows上找到。