表型本体与基因本体论(GO)一样,表型本体论通过将单个术语视为节点及其与父项(允许多个父项)的关系视为有向边,将基因突变/空表型信息从顶部非常一般的术语分类并组织到有向无环图(DAG)中更具体的术语。要导航此层次结构,我们显示所有亲本表型项按与当前项的最短距离排序的当前感兴趣的表型项。也,仅直接儿童表型术语列出了当前表型术语的。我们纳入的表型本体如下:
- 疾病本体(DO)DO通过将DO术语广泛交叉映射到MeSH、ICD、NCI词库、SNOMED和OMIM,在语义上集成了疾病和医学词汇。
- 人类表型(HP)本体(HP)HP捕获OMIM中描述的表型异常以及相应的致病基因。它包括三个互补的生物学概念:遗传模式(MI)、ONset_and_clinical_course(ON)和表型异常(PA)。
- 小鼠表型(MP)本体(MP)MP描述了特定基因被基因破坏后小鼠的表型。利用它,小鼠基因组信息学(MGI)为小鼠提供了高覆盖率的基因水平表型。
- 蠕虫表型本体WP对秀丽线虫和其他线虫的表型描述进行分类和组织。使用它,WormBase为秀丽线虫的表型注释提供了主要资源。
- 酵母表型本体酵母基因组数据库(SGD)基于YP,YP是子囊菌表型本体的主要贡献者,为酵母基因组中的每个基因提供单一突变表型。
- 苍蝇表型本体FP指FlyBase控制的词汇表。具体来说,FlyBase中的等位基因注释(针对其诱变剂等)使用结构化受控词汇。
- 蝇类解剖本体FA是黑腹果蝇解剖学的一个结构化控制词汇,用于描述表型和基因表达的位置。
- 斑马鱼解剖学本体ZA使用标准解剖学术语和受影响的基因显示斑马鱼的解剖学术语。
- 爪蟾解剖学本体XA代表青蛙(非洲爪蟾和热带爪蟾)的组织谱系和发育时间。它用于注释爪蟾基因表达模式以及突变和变体表型。
- 拟南芥植物本体(AP)作为描述植物解剖和形态结构(AN)以及生长发育阶段(DE)的植物本体的主要贡献者,拟南芥信息资源(TAIR)为模式高等植物拟南芥(Arabidopsis thaliana)提供了拟南芥子植物本体注释。
- 酶委员会本体论每个酶都有一个四位数的EC编号,前三位数定义了催化的反应,第四位数是唯一的标识符(序列号)。每种酶都有一个系统名称,唯一地定义了所催化的反应。
- DrugBank ATC(DB)本体(DB)在解剖治疗化学(ATC)分类系统中,药物根据作用的器官或系统(第一级,解剖主要组)及其治疗(第二级,治疗亚组)、药理(第三级,药理亚组)分为五个不同级别的组和化学性质(第4级,化学亚组;第5级,化学物质)。只考虑DrugBank中的药物。
- UniProtKB关键字(KW)本体UniProtKB中的关键字是受控词汇表,提供条目内容的摘要,并用于基于10个类别(此处不包括“技术术语”类别)索引UniProtKB/Swiss-Prot条目。每个关键字都手动归属于UniProtKB/Swiss-Prot条目,并自动归属于UniProtKB/TrEMBL条目(根据特定的注释规则)。
- UniProtKB UniPathway(UP)本体UP是一个完全手动管理的资源,用于表示和注释代谢途径,在UniProtKB中用作路径注释的受控词汇。
结构域表型本体及其注释蛋白质结构分类(SCOP)将进化相关域划分为超级家族水平和家庭级别。利用上述表型本体,我们生成了以域为中心的表型注释,并进一步确定了注释SCOP域信息最丰富的表型术语。令人欣慰的是,以域为中心的表型注释可以作为探索基因型-表型关系的另一个起点。我们为下载提供了几个相关文件,包括每个表型本体的注释和相应的本体。
超域表型本体及其注释虽然以域为中心的注释在描述独立域的表型性质方面有很大的希望,但大多数域本身可能不只是单独工作。在多域蛋白质中,它们可以结合在一起形成不同的域结构。现有结构域的重组被认为是表型多样性的主要驱动力之一。作为扩展,我们还生成了超域表型本体及其注释。与以域为中心的表型本体论和注释(SCOP域超级家族水平和家庭级别),此版本仅关注超域和单个SCOP域超级家族级别。此外,就单个超家族而言,其以域为中心的版本的注释可能与超域版本的注释不同。根据您的关注点,前者应用于考虑超级家族水平和家庭级别,否则,如果您对域组合感兴趣,应使用后者。此外,我们还为下载提供了几个相关文件,包括每个表型本体的注释和相应的本体。