软件搜索-zbMATH Open

SSAHA公司

swMATH ID:	17308
软件作者：	Ning Z、Cox AJ、Mullikin JC
描述：	SSAHA：大型DNA数据库的快速搜索方法。我们描述了一种算法，SSAHA（SequenceSearch and Alignment by HashingAlgorithm），用于在包含多个千兆DNA的数据库上执行快速搜索。通过将数据库中的序列分解为k个相邻基的连续k元组，然后使用哈希表存储每个k元组每次出现的位置，对其进行预处理。通过从哈希表中获取查询序列中每个k元组的“点击数”，然后对结果进行排序，可以在数据库中搜索查询序列。我们讨论了元组长度k对算法的搜索速度、内存使用和灵敏度的影响，并给出了计算实验结果，结果表明，SSAHA可以比BLAST或FASTA快三到四个数量级，同时比后缀树方法需要更少的内存。SSAHA算法用于高通量单核苷酸多态性（SNP）检测和大规模序列组装。此外，它还为Ensembl项目提供了基于Web的序列搜索工具。
主页：	http://www.sanger.ac.uk/science/tools/ssaha
相关软件：	香皂；BLAT（爆炸）；爆炸；PSI-爆炸；KEGG公司；虾；DIALIGN公司；图案猎人；BLASTZ公司；消音器；AVID公司；传奇；火烈鸟；针织物；烤面包；银河；功能计数；R子阅读；重新计票；正确
引用于：	3文件