蛋白质BLAST:使用蛋白质查询搜索蛋白质数据库
美国国旗

美国政府的官方网站

访问密钥 NCBI主页 MyNCBI主页 主要内容 主导航
标准蛋白BLAST
BLASTP程序使用蛋白质查询搜索蛋白质数据库。更多。。。
输入查询序列
在文本区域中输入查询序列。它自动确定输入的格式。为了实现此功能,需要对标识符的输入进行某些约定。更多。。。

输入坐标子范围查询序列。BLAST搜索仅适用于残留物在范围内。序列坐标来自1到序列长度。范围包括这个收件人坐标。更多。。。

帮助

使用浏览按钮从本地磁盘上载文件。文件可能包含单个序列或序列列表。数据可以是数据库登录号列表,NCBI gi数字或FASTA格式的序列。


输入BLAST搜索的描述性标题 帮助

此标题显示在所有BLAST结果和保存的搜索中。

帮助

在顶部文本框中输入一个或多个查询,在下部文本框中输入一个或多个主题序列。然后使用页面底部的BLAST按钮对齐序列。
要在输出中获取CDS注释,请仅使用NCBI登录或查询或主题的gi编号。重新格式化结果并选中“CDS功能”以显示该注释。

输入主题序列
用于BLAST搜索的主题序列应粘贴在文本区域。它自动确定格式或输入。在那里允许此功能标识符的输入需要某些约定。更多。。。

输入坐标子范围主题序列。BLAST搜索仅适用于残留物在范围内。序列坐标来自1到序列长度。范围包括这个收件人坐标。更多。。。

 
帮助

使用浏览按钮从本地磁盘上载文件。文件可能包含单个序列或序列列表。数据可以是数据库登录号列表,NCBI gi编号或FASTA格式的序列。

选择搜索集
新建
尝试实验性集群nr数据库
有关更多信息,请参阅什么是聚集nr?

Clustered nr是标准的NCBI nr数据库,每个序列与集群的其他成员具有90%的同一性和90%的长度。您的BLAST搜索针对每个集群的单个代表性序列运行。

代表用作集群的标题,并可用于获取所有其他成员。

聚类后的nr更小,搜索更紧凑。聚类nr搜索的结果比标准nr搜索结果具有更大的分类深度。

集群nr使用MMseqs2软件https://github.com/soedinglab/MMseqs2

1.Steinegger,M.,Söding,J.MMseqs2支持对大量数据集进行敏感蛋白质序列搜索分析。Nat生物技术35,1026–1028(2017)https://doi.org/10.1038/nbt.3988PMID:29035372

帮助
选择标准数据库与实验数据库进行比较。
标准
数据库序列非默认值 帮助

选择要对其运行搜索的序列数据库。BLAST数据库包含NCBI.BLAST中的所有序列数据库按信息内容(nr、RefSeq等)组织或通过测序技术(WGS、EST等)。更多。。。

输入生物体通用名、二项式或税号。只显示20个顶级分类群。 帮助

开始在文本框中键入,然后选择您的出租车。使用“加号”按钮添加另一个有机体或组,使用“排除”复选框缩小子集。搜索将限于数据库中与子集对应的序列。

创建自定义数据库
输入Entrez查询以限制搜索 帮助

您可以使用Entrez查询语法来搜索所选BLAST数据库的子集。这有助于将搜索限制在分子类型、序列长度或排除有机体。更多。。。

实验
帮助

选择要对其运行搜索的序列数据库。BLAST数据库包含NCBI.BLAST中的所有序列数据库是按信息内容(nr、RefSeq等)组织的或通过测序技术(WGS、EST等)。更多。。。

输入生物体通用名、二项式或税号。只显示20个顶级分类群。 帮助

开始在文本框中键入,然后选择您的出租车。使用“加号”按钮添加另一个有机体或组,使用“排除”复选框缩小子集。搜索将限于数据库中与子集对应的序列。

程序选择
选择BLAST算法 帮助
  • Megablast用于将查询与密切相关的序列进行比较,效果最佳如果目标百分比标识为95%或更高,但速度非常快。
  • 不连续巨胚细胞使用忽略某些碱基的初始种子(允许不匹配)并用于跨物种比较。
  • BlastN速度较慢,但允许单词大小降到七个碱基。
更多。。。

帮助

输入PHI模式以开始搜索。PHI-BLAST可能比简单模式搜索执行得更好,因为它筛选出假阳性(可能是随机且不表示同源性)。

选择BLAST算法 帮助
  • QuickBLASTP是BLASTP的一个加速版本,速度非常快,如果目标百分比标识为50%或更多,则效果最佳。
  • BlastP只是将蛋白质查询与蛋白质数据库进行比较。
  • PSI-BLAST允许用户使用第一次BlastP运行的结果构建PSSM(位置特定评分矩阵)。
  • PHI-BLAST执行搜索,但将对齐限制为与查询中的模式匹配的对齐。
  • DELTA-BLAST使用保留域数据库搜索的结果构造PSSM,并搜索序列数据库。
搜索 使用 爆炸 (蛋白质-蛋白质BLAST)
注:与默认值不同的参数值以黄色突出显示,并用标记签名