GO证据代码指南

一个GO注释是关于特定基因功能的陈述。每个注释都包含一个证据代码,以指示如何支持对特定术语的注释。

证据代码分为六大类:

  • 实验证据
  • 系统发育证据
  • 计算证据
  • 作者声明
  • 馆长声明
  • 自动生成的注释

实验证据代码

EXP(EXP)证据代码表明,有实验证据直接支持该基因的注释。例如,通过免疫荧光确定的基因产物及其亚细胞定位之间的关联将得到直接测定推断(IDA)证据代码的支持,IDA是EXP证据的一种亚型。在GO注释中使用实验证据代码表明,引用的论文显示了支持GO术语关联的基因或基因产物的物理特征的结果。实验证据代码为:

每个实验证据码都有一个对应的“高通量”证据码(HTP)。HTP是一种实验证据,表明注释得到了高通量方法的支持。高通量证据代码为:

系统发育相关注释

系统发生原理重构进化事件以推断基因之间的关系,为深入了解基因功能提供了有力的途径。GOC支持系统发育注释工作自2008年以来。

基于系统发生学的注释是从系统发生树中特定分支的基因功能获得和损失的显式模型中派生出来的。每个推断的注释都可以追溯到用作该断言基础的直接实验注释。GO系统发育注释项目现在是GO知识库中手动审查注释的最大来源,它大大增加了注释的数量,即使是在经过实验研究的生物体中。

计算分析证据代码

计算分析证据代码的使用表明,注释基于所引用参考文献中描述的基因序列和/或其他数据的电子分析。这一类的证据代码也表明了不同程度的策展人投入。计算分析证据代码为:

作者陈述证据代码

作者声明代码表明,注释是基于作者在引用的参考文献中所作的声明。作者陈述证据代码为:

馆长声明证据代码

策展人陈述证据代码的使用表明,在策展人判断的基础上做出的注释不符合其他证据代码分类之一。馆长声明代码为:

电子注释证据代码

“电子”(IEA)注释不需要手动审查(尽管该方法本身通常要接受各种质量评估)。IEA支持的注释最终基于同源性和/或其他实验或序列信息,但通常无法追溯到实验来源。这些注释主要由三种方法组成。第一种也是最全面的方法是InterPro2GO公司基于GO项与一组同源蛋白质的广义序列模型(“签名”)的精心关联。与签名在统计上显著匹配的蛋白质序列被指定与签名相关的GO项,这是一种同源性推断。第二种方法是将UniProt控制的词汇术语(包括描述酶活性的酶委员会编号和描述亚细胞位置的UniProt关键字)计算转换为关联的GO术语。最后,注释是基于从Ensembl基因树推断出的1:1直系图进行的,这是一种自动将在一个基因中实验发现的注释转移到同一分类分支(例如脊椎动物分支内的注释,以及植物分支内的注解)中的1:1正系图的方法。