(排序)生命的参考物种树这棵树是完全解析的(分叉+估计的分支长度),并充分利用了蛋白质结构进化信息和现有的分类信息。它由RAxML在NCBI分类约束下使用结构系统发育信息重建:SCOP域(在超家族和家族水平)和超域(仅在超家族水平)。重建后,NCBI分类法对其进行了注释,即每个内部节点要么映射到唯一的taxon_id,要么留空(假设是一个假设的未知祖先)。
NCBI分类法NCBI分类法将来自各种来源的系统发育和分类知识整合到一个分辨率较低的常见物种树中。拓扑上,它是多分支的,有些节点有两个以上的子节点。此外,分支长度均匀,缺乏量化信息来衡量分歧。值得注意的是,它还包括分类学等级,常见的等级(从高到低)依次包括超级王国,王国,门,等级,订单,家庭,属,物种和没有排名。请记住,它不是二进制的,只允许一个子级或多个子级,外加两个子级。
树浏览网关为了导航(排序)生命的参考物种树,我们显示了一条从给定节点向上通向其超王国起源祖先的路径(即,所有祖先节点到当前感兴趣节点的顺序。列表也是其直接子节点。对于路径上的每个特定分支,我们使用树向量用于可视化,并提供Newick树格式用于下载,带有节点对象:或者代码(即SUPERFAMILY数据库使用的2个字母的基因组标识符),或出租车ID(即NCBI分类ID),或姓名(全名)。
小规模研究中的应用树或其派生子树可用于显示以下内容的分布:1)特定域,例如核受体配体结合域(sunid=48508)分布在从人类通向Eukaryta的路径上,或2)作为一组注释为特定GO术语的域,例如注释为干细胞维护(GO:0019827)分布在从人类通往Eukaryta的路径上。
大规模研究中的应用更有前途的应用程序是注释整个现存/祖先领域曲目。如本文所示,我们首先应用Dollo简约性来推断真核生物进化中主要分支点的祖先超家族域序列,并获得这些点上存在的祖先域序列,与它们的直系父母相比,它们的获得和失去。然后,我们使用以域为中心的GO注释在每个超家族和家族级别上对现有/获得/丢失的祖先域曲目进行富集分析。通过富集分析推断出真核生物中的祖先GO术语,告诉我们真核生物进化过程中的功能含义。