幻灯片排序 swMATH ID: 28786 软件作者: 清水,K.,津田,K。 描述: SlideSort:所有配对的相似性搜索,用于短读。动机:DNA测序技术的最新进展要求快速准确的算法来评估大量短读的序列相似性。从字符串池中搜索相似对是从头开始基因组组装、全基因组比对和其他重要分析的基本过程。结果:在本研究中,我们设计并实现了一个精确的算法SlideSort,该算法可以根据编辑距离从字符串池中查找所有相似对。使用高效的模式增长算法,SlideSort可以发现常见k-mer链以缩小搜索范围。与现有基于单个k-mers的方法相比,我们的方法在减少编辑距离计算数量方面更有效。与BWA等回溯方法相比,我们的方法在查找远程匹配方面要快得多,很容易扩展到数千万个序列。我们的软件还有一个附加的单链接聚类功能,这有助于总结简短的读取以供进一步处理。可用性:可执行二进制文件和C++库位于http://www.cbrc.jp/用于Linux和Windows的shimizu/slidesort/。 主页: https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3035798/ 源代码: https://github.com/iskana/SlideSort网站 相关软件: d2_群集;彩虹;马什;紧身胸衣;石斑鱼;Cogent公司;LSC公司;最小值2;副帆;SimLoRD公司;易集群2;星号;MMseqs2型;DNACLUST公司;MeShClust公司;是ONclust;github;Cd命中 引用于: 1文件 2位作者引用 1 保罗·梅德韦杰夫 1 克里斯托弗·萨林 0连载引用 在2个字段中引用 1 计算机科学(68至XX) 1 生物学和其他自然科学(92-XX) 按年份列出的引文