SSAHA公司 swMATH ID: 17308 软件作者: Ning Z、Cox AJ、Mullikin JC 描述: SSAHA:大型DNA数据库的快速搜索方法。我们描述了一种算法,SSAHA(SequenceSearch and Alignment by HashingAlgorithm),用于在包含多个千兆DNA的数据库上执行快速搜索。通过将数据库中的序列分解为k个相邻基的连续k元组,然后使用哈希表存储每个k元组每次出现的位置,对其进行预处理。通过从哈希表中获取查询序列中每个k元组的“点击数”,然后对结果进行排序,可以在数据库中搜索查询序列。我们讨论了元组长度k对算法的搜索速度、内存使用和灵敏度的影响,并给出了计算实验结果,结果表明,SSAHA可以比BLAST或FASTA快三到四个数量级,同时比后缀树方法需要更少的内存。SSAHA算法用于高通量单核苷酸多态性(SNP)检测和大规模序列组装。此外,它还为Ensembl项目提供了基于Web的序列搜索工具。 主页: http://www.sanger.ac.uk/science/tools/ssaha 相关软件: 香皂;BLAT(爆炸);爆炸;PSI-爆炸;KEGG公司;虾;DIALIGN公司;图案猎人;BLASTZ公司;消音器;AVID公司;传奇;火烈鸟;针织物;烤面包;银河;功能计数;R子阅读;重新计票;正确 引用于: 3文件 全部的 前5名9位作者引用 1 瓦西里斯·阿提索斯 1 黄果秋 1 Choi,Jeong-Hyeon先生 1 高塔姆·达斯 1 肖恩·戴维斯。 1 亚历克赛省科齐法科斯 1 数学,埃维 1 帕帕彼得鲁,帕纳吉奥蒂斯 1 亚历山大·斯特凡 3篇连载文章中引用 1 数据挖掘与知识发现 1 计算生物学和化学 1 分子生物学方法 在3个字段中引用 三 生物学和其他自然科学(92-XX) 1 统计学(62-XX) 1 计算机科学(68至XX) 按年份列出的引文