跳到主页内容
美国国旗

美国政府的官方网站

Dot政府

gov意味着它是官方的。
联邦政府网站通常以.gov或.mil结尾。之前分享敏感信息,确保你在联邦政府网站。

Https系统

该站点是安全的。
这个https(https)://确保您连接到官方网站,并且您提供的任何信息都是加密的并安全传输。

访问密钥 NCBI主页 MyNCBI主页 主要内容 主导航
.2011年9月;12(5):449-62.
doi:10.1093/bib/bbr042。 Epub 2011年8月27日。

基因本体联盟中基于系统发育的功能注释传播

附属公司

基因本体联盟中基于系统发育的功能注释传播

帕斯卡尔·高德特等。 生物信息简介. 2011年9月.

摘要

基因本体(GO)项目的目标是提供一种统一的方法来描述来自生命所有王国的生物体的基因产品的功能,从而能够分析基因组数据。蛋白质注释要么基于实验,要么根据蛋白质序列进行预测。由于大多数序列还没有经过实验表征,所以大多数可用的注释都需要基于预测。为了尽可能做出准确的推断,GO联盟的参考基因组项目正在使用一个明确的进化框架,以半自动化的方式从一组广泛的基因组从实验注释中推断蛋白质注释。管道中的大多数组件,如序列的选择、构建多序列比对和系统发育树、检索实验注释和保存推断注释,都是完全自动化的。然而,我们管道中最关键的一步依赖于由专家生物学家进行的软件辅助管理。这个管理工具,系统发育注释和引用工具(PAINT)帮助管理者推断蛋白质家族成员之间的注释。PAINT使策展人能够准确地断言功能在进化过程中何时获得和丢失,并记录这些断言的证据(例如实验支持的GO注释和系统发育信息,包括正畸学)。在这篇文章中,我们描述了如何使用PAINT在系统发育背景下推断蛋白质功能,并强调了其优势、局限性和指导原则。我们还讨论了一些具体的示例,这些示例显示了PAINT注释与其他高度使用的基于同源性的方法生成的注释的比较。

PubMed免责声明

数字

图1:
图1:
涂料的概念。这个例子展示了一个MutS同源家族,显示了“GO项”的实验证据。(A类)对一个术语或其任何祖先(浅绿色标签)的初步实验性注释被用来推断所有这些蛋白质的最新共同祖先(CA)也具有该功能。馆长通过将术语拖到MCRA(橙色框)的节点上来注意到这一点。(B类)随后,PAINT将此注释向前传播到其他后代叶(蓝色标签)。
图2:
图2:
功能增益。所有真核生物MSH2同源序列(最左边的橙色圆圈)的MRCA可能已经在DNA修复(从LUCA遗传,数据未显示)和DNA重复的维持中发挥作用。然后,该基因在动物MRCA中与凋亡有关,随后在脊椎动物MRCA上与免疫球蛋白基因的体细胞过度突变有关。祖先基因(橙色圆圈)的推断基于绿色显示的基因的实验GO注释,这是通过后代的遗传推断得出的,包括蓝色显示的现存生物体中的未特征化基因。因此Bos金牛例如,将由PAINT注释,其功能与中的正交函数不同酿酒酵母.
图3:
图3:
功能丧失。根据PGM的3D蛋白质结构,在CDD数据库中注释了PGM1亲属的活性位点残基草履虫在PAINT中,生物验证器使用集成的多序列比对查看器来确定所有脊椎动物PGM5同源序列中的关键活性位点残基都发生了突变,这表明磷酸葡萄糖变位酶活性在复制后不久就丧失了。生物验证器相应地用“非磷酸葡萄糖变位酶活性”注释了PGM5的脊椎动物祖先,然后PAINT将其传播到所有PGM5脊椎动物直系祖先。
图4:
图4:
使用PAINT注释功能演变事件的一般工作流。第1步:馆长使用基于实验的注释给出一个初始假设,即该功能首先出现在所有基因的MRCA中,并带有相关的基于实验的注解。第二步:馆长决定哪一个祖先最适合注释:要么是最初假设的MRCA(选项A);较早的祖先(选项B),这意味着来自步骤1的MRCA可能从较早的祖先继承了其注释;或更近的祖先(选项C),这意味着存在同源性,步骤1中的MRCA不是功能首次出现的地方。
图5:
图5:
SOD家族的简化系统发育(PTHR10003)。最后一个通用的共同祖先,LUCA,在真核生物的祖先中被复制(方形节点)。与祖先差异最小的复制后代也保留了SOD活性。这在CCS分支中丢失了。

类似文章

引用人

工具书类

    1. 基因本体联盟。基因本体:生物学统一的工具。自然遗传学。2000;25:25–9.-项目管理咨询公司-公共医学
    1. 基因本体联盟。2010年的基因本体论:扩展和完善。核酸研究2010;38:D331-5。-项目管理咨询公司-公共医学
    1. du Plessis L,Skunca N,Dessimoz C.基因本体论的内容、地点、方式和原因——生物信息学家的引物。简要生物信息。2011年新闻稿doi:10.1093/bib/bbr002。-项目管理咨询公司-公共医学
    1. Gaudet P和基因本体联盟的参考基因组组。基因本体论的参考基因组项目:跨物种功能注释的统一框架。公共科学图书馆计算生物学。2009;5(7):e1000431。-项目管理咨询公司-公共医学
    1. Felsenstein J.推断系统发育。马萨诸塞州:Sinauer Associates Inc。;2004年,ISBN 0-87893-177-5。

出版物类型