IgBlast工具
美国国旗

美国政府的官方网站

访问密钥 NCBI主页 MyNCBI主页 主要内容 主导航
介绍 参考 常见问题解答 独立IgBLAST Ig生殖系基因 其他资源
输入查询序列
帮助

序列可以是原始序列、登录号或gi的形式(例如登录Y14934)。你可以选择根据FASTA格式,在顶部包含以“>”开头的定义行。您还可以加载包含在本地文件中的序列(确保它是纯文本文件)。如果序列已经在GenBank中,您可以只输入它的accession或gi#。

可以提交多个查询序列。每个序列必须有唯一的标识符,我们建议不要在标识符中使用空格,因为空格后面的任何字符都将被排除。


种系基因数据库
帮助
指定查询序列来自的有机体。这允许程序正确报告V域描述、V-J帧状态(即帧内、帧外等)和查询核苷酸序列的翻译。
生殖系V基因数据库非默认值 帮助

所有IMGT生殖系数据库均来自IMGT/V-QUEST参考目录集.有几个不同类别的序列,包括功能基因(F),开放阅读框基因(ORF),蛋白质翻译框完整的假基因(框内P)以及位于正常免疫球蛋白或T细胞受体基因位点之外的orphon基因。

AIRR-C V基因来自AIRR社区.

NCBI人类V基因:该数据库包括“IMGT人类V基因(F+ORF+in-frame P),包括orphons”数据库和IMGT数据库中没有包含的一些假基因。它包含与前一版本IgBLAST的“Ig生殖系V基因”数据库相同的人类序列。

NCBI人类V基因(旧):这是在从IMGT数据库中添加人类生殖系序列之前,我们最早版本的人类Ig生殖系V基因数据库。它与以前版本的IgBLAST的“Ig生殖系V基因(旧)”数据库相同。

AIRR-C V基因来自AIRR社区.

NCBI小鼠V基因、NCBI鼠D基因和NCBI老鼠J基因:这些是NCBI独立收集的小鼠生殖系序列。

恒河猴种系V、D、J基因是猕猴种系序列收集自KIMDB公司.

请参见NCBI生殖系基因有关NCBI生殖系基因收集的详细信息。

自定义:您可以搜索自己的数据库。您的数据库应该包含FASTA格式的序列。

种系D基因数据库非默认值
种系J基因数据库非默认值
种系C基因数据库非默认值 帮助

C基因匹配是为了重排Ig序列,这意味着您的Ig序列需要在C区域之前有V(D)J部分。

NCBI人类C基因数据库:

这是NCBI参考基因组上注释的恒定区基因。由于这仅来自参考基因组,因此不包括其他等位基因。注意,为了与IMGT的参考C基因序列一致,在C基因序列的开头添加了一个额外的碱基(来自J基因末端),以保持C基因第一密码子的完整性,因此,IgBLAST结果通常显示J和C基因之间存在一个碱基重叠。

搜索参数
程序非默认值 帮助
蛋白质序列选择blastp,核苷酸序列选择blackn。
V基因失配惩罚非默认值 帮助
较高的失配惩罚(例如-3)有利于检测与查询序列具有较高相似性的V基因匹配,但这种匹配区域不一定长。另一方面,较低的失配惩罚(例如-1)有利于检测与查询序列不一定具有高相似性的较长V基因匹配。一般来说,如果序列中很少或没有体细胞突变,则惩罚越高效果越好。但是如果你的序列有显著的突变(>5%),那么如果你想适应突变带来的低相似性,那么应该选择较低的惩罚。

Min D基因核苷酸匹配非默认值 帮助
这控制了D基因检测的阈值。您可以设置所需的最小连续核苷酸匹配数根据您自己的标准,在查询序列和D基因之间进行匹配。请注意,匹配不包括V-D或D-J连接处的重叠匹配。默认值为5个核苷酸。
D基因失配惩罚非默认值 帮助
较高的失配惩罚(例如-4)有利于检测与查询序列具有较高相似性的D基因匹配但是这样的匹配区域不一定是长的。另一方面,较低的失配惩罚(例如-1)有利于检测与查询序列不一定具有高度相似性的较长D基因匹配。一般来说,如果你的序列很少或没有体细胞突变,那么惩罚越高效果越好。但是如果你的序列有意义突变(>5%),那么如果你想适应突变引入的低相似性,就应该选择较低的惩罚。
5'端对齐非默认值 帮助

如果您的序列与V基因5'末端的生殖系序列有太多差异(由于突变或其他原因),那么IgBLAST结果可能不会显示V基因的部分,因为IgBLAS使用局部对齐算法。然而,如果您想查看那些缺失的碱基/残基,您可以启用此选项来引导IgBLAST向该区域执行简单的无间隙对齐扩展(最多30个碱基/残留物)。请注意,此扩展不是BLAST对齐,不应用于推断查询和主题序列之间的任何同源性。这只是为了方便在生殖系序列的上下文中显示缺失的部分。如果希望看到真正的BLAST对齐以尽可能覆盖序列,请确保选择最低的不匹配惩罚(即-1)。

在3'末端延伸对齐非默认值 帮助

这与“在5'端延伸对齐”相同,只是它将J基因3'端的对齐延伸到了15个基点。

允许V(D)J基因重叠 帮助

启用此选项允许V(D)J基因在重新排列的接合处重叠(即,V(D。默认情况下,当分配V、D、J基因匹配时,程序不允许V、D和J基因重叠。虽然在某些情况下,此选项可能会更改D基因匹配的结果,但它对V基因匹配结果(以及相关匹配统计数据)没有影响。它对J基因匹配的影响很小,仅在极少数情况下发生。注意,只有当D和J基因失配惩罚分别设置为-4和-3时,此选项才有效。

最小所需V基因长度非默认值 帮助

仅当查询序列与生殖系V基因至少匹配指定的最小长度(即碱基或氨基酸的数量)时才显示结果。否则,会报告“未找到点击”。

最小所需J基因长度非默认值 帮助

仅当查询序列与生殖系J基因至少匹配指定的最小长度(即碱基数)时才显示结果。否则,报告“未找到命中数”。

J基因失配惩罚非默认值 帮助
较高的失配惩罚(例如-3)有利于检测与查询序列具有较高相似性的J基因匹配但是这样的匹配区域不一定是长的。另一方面,较低的失配惩罚(例如-1)有利于检测与查询序列不一定具有高相似性的较长匹配。一般来说,如果序列中很少或没有体细胞突变,则惩罚越高效果越好。但是如果你的序列有意义突变(>5%),如果你想适应突变带来的低相似性,那么应该选择较低的惩罚。
注:与默认值不同的参数值以黄色突出显示,并用标记
格式选项
种系V基因数非默认值 种系D基因数非默认值 种系J基因数非默认值 种系C基因数非默认值
氨基酸翻译非默认值 帮助
这将转换您的查询以及顶部生殖系序列,并将氨基酸与密码子的第二个碱基对齐。种系序列中不匹配的氨基酸将被着色。
V域划分系统非默认值 帮助
可以使用IMGT系统描绘V域(Lefranc等人2003年)或Kabat系统(Kabat等人,1991年,《免疫相关蛋白质序列》,美国国立卫生研究院第91-3242号出版物,第5版,美国卫生与公共服务部,马里兰州贝塞斯达)。查询序列的域注释基于预先注释的域信息,以获得最佳匹配的芽线命中。
要显示非默认值的克隆类型数 帮助

要显示的顶级克隆型的数量。请注意,此选项仅适用于多个查询。

对齐格式非默认值 帮助
AIRR重排表:
这是一种选项卡分隔格式AIRR社区已开发用于描述Ig/TCR序列。本质上,这种格式包括一个标题行,指示字段名称,并且每个后续行包含每个查询序列的选项卡分隔字段。所有序列位置现在都是基于1的(以前的AIRR规范使用基于0的开始和基于1的结束序列坐标系。但从2018年11月27日开始,所有序列位置都根据新的AIRR-规范更改为基于1的坐标系)。
其他数据库
其他数据库非默认值 帮助
编号:GenBank+EMBL+DDBJ+PDB+RefSeq序列,但不包括EST、STS、GSS、WGS、TSA、专利序列以及0、1和2期HTGS序列。

refseq_genomes:NCBI refseq基因组序列。

pdb:来自蛋白质数据库(pdb)的序列。

专利:源自GenBank专利部门的核苷酸序列。

哺乳动物基因组:NCBI哺乳动物基因组。

输入生物体通用名、二项式或税号。只显示20个顶级分类群。 帮助

开始在文本框中键入,然后选择您的出租车。搜索将限于数据库中与有限子集对应的序列。

仅搜索V基因非默认值 帮助

这允许用户在额外的非种系数据库中找到查询序列中V基因的最佳匹配(即nr、基因组等)。该选项对种系基因数据库的搜索没有影响(见下文解释)。

典型的重排查询序列包括一个先导、V、D、J基因(有时还包括C区域)。当提交一个序列进行blast搜索时,将对整个查询序列执行相似性匹配。与只包含V基因序列的生殖系V基因数据库不同,其他数据库(如nr)包含许多重新排列的序列还包括一个先导基因,即V、D、J和C基因。因此,这些数据库不一定与查询V基因最匹配;相反,它有整个查询序列的最佳匹配(例如,它可能与查询序列中的先导、D、J或C基因,但仅与V基因低匹配)。如果目标是试图找到与查询序列的最佳总体匹配,则这不是问题。然而,如果目标是找到与查询序列的V基因的最佳匹配,则需要从查询序列中手动分离V基因部分,然后使用它进行搜索。

启用此选项后,查询序列中的V基因部分将自动隔离(基于与生殖系V基因数据库中的点击数的比较),然后用于搜索其他数据库,如nr。但是,如果搜索目的是查找最佳点击,则应禁用此选项基于整体匹配。

路线数非默认值
应为非默认值 帮助
这是报告与数据库序列匹配的统计显著性阈值。较低的EXPECT阈值更严格,只报告高相似性匹配。如果预期查询序列和目标之间的标识较低,请选择较高的EXPECT值(例如1或更多)。请注意,此选项仅用于额外的数据库搜索(它对生殖系基因数据库搜索没有影响)。