法斯塔
与FASTP和FASTA的快速敏感序列比较。FASTA程序可以在IBM-PC微型计算机上用不到20分钟的时间搜索NBRF蛋白质序列库(250万个残基),并且毫不含糊地检测出在过去数十亿年中共享同一祖先的蛋白质。FASTA既快速又有选择性,因为它最初只考虑氨基酸的特性。它不仅通过使用PAM250矩阵对具有大量恒等式的区域进行评分和重扫描,而且通过连接初始区域来提高其灵敏度。使用FASTA的搜索结果与使用基于NWS的程序的搜索结果相比,后者的速度要慢100倍。FASTA的敏感性稍低,但选择性更强。目前还不清楚基于NWS的程序在寻找G蛋白偶联受体家族的远亲成员方面是否会更成功。FASTA计算initn分数的连接步骤对于共享由可变长度循环分隔的序列相似区域特别有用。FASTP和FASTA被设计用来识别来自同一祖先的蛋白质序列,并且它们已经被证明对这项任务非常有用。在许多情况下,FASTA序列搜索将产生一个与查询序列同源的高分库序列列表,或者该搜索将生成一个具有相似得分的序列列表,这些序列无法与大量的库区分开来。无论哪种情况,库中是否存在与查询序列明显相关的序列的问题都得到了明确的回答。不幸的是,结果往往不那么明确,需要仔细分析和生物学背景。在分析G-蛋白偶联受体家族的过程中,发现了一些蛋白质,因为经过优化,似乎是这个家族的成员,而这些成员是以前没有被认识到的。RDF2分析显示了临界值z值,只有对序列比对的仔细检查(集中在保守的残基上)才提供了令人信服的证据,证明高分是偶然的。随着序列比较方法变得更加敏感而变得更加强大,它们变得更容易误导,并且需要更加小心。
此软件的关键字