萨哈

SSAHA:一种快速搜索大型DNA数据库的方法。我们描述了一种算法,SSAHA(SequenceSearch and Alignment by HashingAlgorithm),用于在包含多个千兆碱基DNA的数据库上执行快速搜索。对数据库中的序列进行预处理,方法是将序列分解为k个相邻基的连续k元组,然后使用哈希表存储每个k元组每次出现的位置。在数据库中搜索查询序列是通过从哈希表中获取查询序列中每个k元组的“命中率”,然后对结果执行排序来完成的。我们讨论了元组长度k对算法的搜索速度、内存使用和灵敏度的影响,并给出了计算实验结果,结果表明,SSAHA比BLAST和FASTA快3到4个数量级,而所需内存比后缀树方法少。SSAHA算法用于高通量单核苷酸多态性(SNP)检测和超大规模序列组装。此外,它还为Ensembl项目提供基于Web的序列搜索工具。


zbMATH中的参考文献(参考

显示第1到第10个结果,共10个。
按年份排序(引用)

  1. Mathé,Ewy(编辑);Davis,Sean(编辑):统计基因组学。方法和方案(2016)
  2. Kotsifakos,Alexios;Stefan,Alexandra;Athitsos,Vassilis;Das,Gautam;Papapetrou,Panagiotis:DRESS:降维高效序列搜索(2015)
  3. Saeed,Fahad;Perez Rathke,Alan;Gwarnicki,Jaroslaw;Berger-Wolf,Tanya;Khokhar,Ashfaq:用于从多个参考基因组中读取焦测序的高性能多序列比对系统(2012)ioport公司
  4. Daniel Maclean;Moulton,Vincent;Studholme,David J.:用nibls从高通量测序数据中寻找srna生成区域(2010)ioport公司
  5. Yu,Li;Moretti,Christopher;Thrasher,Andrew;Emrich,Scott;Judd,Kenneth;Al.:利用所有对、波前和makeflow抽象在多核簇中利用并行性(2010)ioport公司
  6. 荷马,尼尔斯;梅里曼,巴里;纳尔逊,斯坦利F.:双碱基编码DNA序列的局部比对(2009)ioport公司
  7. Papanicolaou,Alexie;Stierli,Remo;Ffrench Constant,Richard H.;Heckel,David G.:下一代基因组的下一代转录体,使用\textitest2assembly(2009)ioport公司
  8. 王文迪;张培恒;刘新春:短文DNA片段锚定算法(2009)ioport公司
  9. Joseph,Jijoy;Sasikumar,Roschen:用于全基因组比较的混沌博弈表示法(2006)ioport公司
  10. Choi,Jeong Hyeon;Cho,Hwan Gue;Kim,Sun:博弈:一种使用最大精确匹配过滤的简单有效的全基因组比对方法(2005)