下载批注

获取选定有机体的注释

本页提供了获取几乎所有生物体GO注释的说明。如果您的生物体在官方GO产品,UniProt GAF(蛋白质组),或NCBI参考序列,我们建议使用最新版本的InterProScan公司用于未标记的生物体。

跳转到节:

必需的文件

大多数使用GO注释的工具都需要两个输入文件:

  1. 带有注释(以基因注释格式或GAF)
  2. 带有GO的文件本体论结构(采用开放生物医学本体格式或OBO)

由于本体和注释随着时间的推移不断得到改进,我们建议您下载最新版本的注释以及该GO版本的相应本体文件。应在注释文件的标题中指定版本。

引用GO

为了确保研究中任何时候使用GO的任何出版物的再现性,请包括:

1.常见研究生物

GAF下载页面包含选定的普通研究物种的注释.

对于具有许多专家管理的GO注释的生物体(具有MOD、专用数据库等),我们建议从上述链接表中的链接下载注释。这些有机体通常有大量由直接实验证据支持的人工注释以及基于其他证据类型的注释。

2.所有其他生物

对于所有其他生物体,我们建议从以下来源之一下载注释:UniProt或NCBI RefSeq。这两种方法都提供了高度准确的计算方法。注释文件的标题指定了您应该用于伴随注释文件的本体的版本。旧版本的GO本体可以从GO下载档案中下载.

  • UniProt GAF(蛋白质组):注释文件可用于约20000个完整蛋白质组(每个蛋白质编码基因一个蛋白质序列)。如果要使用,请使用这些文件UniProtKB标识符.
  • NCBI参考序列:如果您的生物体在RefSeq集合中的NCBI中有参考基因组组合(RefSeq的组合输入以全球合作框架_),GO注释通过NCBI基因标识符以GAF格式提供。NCBI RefSeq提供了所有真核生物基因组的注释文件。请注意,NCBI目前没有古菌、细菌或病毒的GO注释,也没有仅在GenBank中提供真核基因组的GO注解(只有从全球合作协议_).
    • NCBI主页
    • 在页面顶部附近的搜索框中输入您的有机体,然后单击搜索,例如。冈比亚按蚊
      NCBI主页搜索
    • 遵循“基因组”链接
      NCBI基因组链接
    • 选择参考组件位于列表顶部;该条目用绿色的“参考基因组”图标和全球合作框架_RefSeq列中列出的标识符
      NCBI参考组件
    • 单击FTP链接
      到GAF的NCBI FTP链接
    • 下载带有后缀的文件遗传学.gz,例如。GCF_943734735.2-RS_2023_12_基因遗传学.gz

3.如果您找不到如上所述的有机体注释以供下载

从GO帮助台获得帮助.

4.如果您的生物体的基因组序列尚未公开

例如,如果您有一组要用GO术语注释的新(蛋白质)序列,我们建议您使用最新版本的InterProScan生成注释。对于大多数基因组分析,虽然可以使用任何一组蛋白质序列,但每个蛋白质编码基因的输入文件都应该有一个蛋白质序列。下载InterProScanhttps://www.ebi.ac.uk/interpro/about/interporscan.

有关GO注释格式的详细信息

  • GO每月发布
  • 注释文件是特定于分类单元的,只有少数例外,包括Reactome和念珠菌基因组数据库文件
  • 当前格式指南:

对GO注释的编程访问

对于来自GO的任何资源,可以通过存储在泽诺多.+请引用DOI并访问当前版本或任何其他存档版本的完整捆绑包,网址为芝诺-记录1205166每个每月GO发布的DOI版本档案2018-08-09可通过泽诺多; 从2004年3月1日至今的版本也可以在我们的档案室.

错误或遗漏?

注释中的任何错误或遗漏应书面报告给GO帮助台.