DNA上的BLAT旨在快速找到长度为25个碱基且相似性大于95%的序列更多信息。它可能会遗漏更多发散或更短的序列比对。它会发现20个碱基的完美序列匹配。蛋白质上的BLAT发现80%的序列,长度为20个氨基酸的相似性更大酸或更多。实际上,DNA BLAT对灵长类动物和蛋白质都很有效陆地脊椎动物的blat。 BLAT不是BLAST。DNA BLAT的工作原理是保持整个基因组的索引内存中。该指数包括所有重叠的11个月,步进5,除了那些经常重复的人。该指数约占2GB的RAM。通过将步长增加到11,RAM可以进一步减少到1GB以下。基因组本身没有保存在内存中BLAT在价格合理的Linux机箱上提供高性能。该指数用于查找可能同源的区域,然后加载到内存中以进行详细对齐。蛋白质BLAT的作用类似方式,除了4-mers而不是11-mers。蛋白质指数需要一点超过2GB。
BLAT由编写吉姆·肯特.与Jim的大多数软件一样,所有人都可以免费在该web服务器上进行交互使用。在您自己的服务器上运行批处理作业的源和可执行文件是免费的用于学术、个人和非营利目的。非排他性商业还提供了许可证。请参阅肯特信息学网站获取详细信息。
有关BLAT图形版本的更多信息,请单击帮助按钮或查看基因组浏览器常见问题解答.
|