保护,进化

来自Proteopedia

跳转到:航行,搜索

有关此主题的更基本的解释,请参阅进化保护导论.

每一代都会自发发生突变,随机改变蛋白质的氨基酸序列。突变损害蛋白质关键功能的个体可能会出现问题,使其繁殖能力降低。有害突变从基因库中消失,因为携带它们的个体繁殖效率较低。随着时间的推移,基因库中只保留了无害(或非常罕见的有益)突变。这是进化.

当给定蛋白质的序列在分类群使用多序列比对(MSA),序列之间的差异通常表示(进化)允许持续存在的突变,因为它们是无害的。在序列相同的地方,我们说序列是保守的.此类进化保守性之所以会发生,是因为这些氨基酸的突变对蛋白质功能有害,并且会随着时间的推移而丢失。保守的氨基酸是对蛋白质功能最关键的氨基酸。因此,在3D蛋白质结构中寻找进化上保守的氨基酸片断是一个很好的方法定位功能站点.

Proteopedia的进化保护颜色是通过以下公式预先计算得出的ConSurf-DB公司.

图片:Consurf_key_small.gif ConSurf-DB和ConSurf使用的九种保护级颜色,加上黄色表示数据不足的氨基酸,以及灰色表示ConSurf无法处理的链。请参见帮助:颜色键.

  • 数据不足描述了无法从所使用的同源序列集导出有意义的保守水平的氨基酸。当计算出的守恒水平的置信区间太大时,就会出现这种情况。有关详细信息,请参阅ConSurfDB进程.

    例如,show进化保护1小时.


  • 无数据描述了ConSurf-DB无法处理的整个蛋白质链。有关详细信息,请参阅ConSurfDB进程.例如,show进化保护1小时.



目录

定位保存的补丁

蛋白质分子结构表面高度保守的氨基酸残基斑块是功能性场地.几乎Proteopedia中的每一篇文章标题为PDB代码有一个进化保护分子场景下面的部分。(小范围内无法获得结果百分比--请参阅ConSurfDB进程.)单击显示蓝色的进化保护根据ConSurf-DB计算的进化守恒,bar自动为分子中的所有链着色。要看一些示例,单击随机PDB条目在中随机的,随机的Proteopedia中每页左上角的框。

简言之,ConSurf-DB收集与所述蛋白质相似的序列,然后构建多序列比对,并分析保守(序列间差异低于平均值)和可变(序列间的差异高于平均值)的序列位置。在Proteopedia的交互式3D分子场景中,每个氨基酸都被分配了一个保护分数和相应的颜色。

ConSurf-DB的分析采用了成熟、公开、同行评审的最先进方法。更详细的概述ConSurf-DB采用的流程可用。Proteopedia内置的ConSurf-DB结果显示是寻找保守补丁的好地方。

然而,ConSurf-DB通常不显示具有相同功能的蛋白质中存在的所有保守斑块因此,您可能希望通过使用ConSurf服务器来扩展您的保护分析将分析局限于具有一种功能的蛋白质这种分析的结果可以显示在蛋白质纲的分子场景中。请参见帮助:如何将ConSurf结果插入Proteopedia绿色链接.

定位可变修补程序

在某些情况下,高度可变(快速突变)残基的斑块也是功能位点。这些也可以用Proteopedia的进化保护场景来自ConSurfDB公司,以及更明确的守恒分析仅限于具有单一功能的蛋白质例如,流感血凝素的突变有助于病毒逃避宿主防御(参见1小时). 另一个例子是主要组织相容性复合体I类这种变异性有助于任何个体内的等位基因凹槽结合多种肽,从而使T淋巴细胞系统能够抵御包括流感病毒在内的多种病原体。

域折叠的守恒

蛋白质分子表面的某些残基往往被保守,以保持适当的折叠,而不是因为它们是与底物、配体或蛋白质伴侣相互作用的位点的一部分。二级结构元素需要在蛋白质分子表面断裂,才能回到折叠的蛋白质结构域。因此,很常见的是,分离出的高度保守的残基能够使螺旋发生转向或断裂,尤其是甘氨酸或脯氨酸在蛋白质结构表面。

形成半胱氨酸二硫键通常是保守的,其他形成罕见的氨基酸也是如此蛋白质交联.

带电残基通常位于折叠蛋白质的表面。如果你看到一个高度保守的带电残留物(精氨酸、天冬氨酸、谷氨酸、赖氨酸)表面上,它通常参与盐桥盐桥有助于稳定蛋白质折叠,因此涉及的残基通常高度保守。示例:带Arg8的Asp6每季度1次.

记住,您可以用鼠标触摸进化保护Proteopedia中的场景(单位为Jmol),几秒钟后将显示其身份。这在关闭旋转时效果最佳。

中的每个结构蛋白质体有一个要显示的链接Jmol简介。在那里,您可以使用查找对话框输入氨基酸的名称,例如。甘氨酸脯氨酸,并且将突出显示所有指定氨基酸的位置。然后可以在三维结构中可视化它们的分布。当使用中的FirstGlance链接查看通过保存着色的蛋白质时,也可以使用此策略任一ConSurf服务器.

注意事项

ConSurf-DB经常模糊某些功能位点

变形杆菌属进化保护场景使用预先计算的结果ConSurf-DB公司ConSurf-DB设计用于在其多序列比对(MSA)和分析中包含广泛的序列。通常,MSA将包含大量具有不同的功能而不是查询蛋白。(请参见这些说明了解如何了解ConSurf-DB的MSA中使用的蛋白质的功能。)因此,被ConSurf-DB标记为高度保守的氨基酸在许多序列相似的蛋白质中确实高度保守。然而,氨基酸在具有相同功能的蛋白质中高度保守作为查询蛋白可能看起来不保守在ConSurf-DB结果中。找到这些模糊功能位点的一个好方法是进行保守性分析,该分析仅限于具有单一功能的蛋白质。请参见限制ConSurf分析单一功能蛋白质.

比较不同序列的保守性时要小心

此警告仅适用于包含不同序列链的分子。Proteopedia的保护色进化保护场景并不表明不同序列的链具有相同的保守性。这是因为ConSurf-DB公司独立计算每个序列不同链的保守性水平,这些水平与为每个序列相关链构建的多序列比对有关。

例如,考虑1个小时,包含10条链,代表5链分子的两个副本。每个分子包含四条不同序列的链。访问ConSurf数据库正如预期的那样,揭示了不同数量的序列被用于多序列比对(MSA)和这些不同序列链的保守性计算,并且每个MSA具有不同的平均两两差异,衡量MSA内的多样性。因此,例如,在三个ConSurf-DB-有色序列不同链中的每个链中,具有9级保守度(最大保守度)的残基在其自身链中具有最高的保守度,但不具有完全相同的绝对保守度。

1个小时
链条长度MSA中的序列数APD公司
A类2741441.72
B类99751.49
C类8ConSurf长度低于最小值
1292011.35

在Proteopedia中进化保护场景中,分子中的所有链都在同一场景中着色。这提供了一个可能有用的概述,但除非人们意识到这一点,否则可能会产生误导给定的保守性颜色,在两个不同的序列链中,并不意味着完全相同的保守恒水平。与变形菌的形成对比进化保护场景中,ConSurf-DB和ConSurf Server一次只对一个链序列应用保护级别的颜色,从而避免了这种可能的混淆。

保护结果将随时间而变化

随着时间的推移,ConSurf-DB使用的序列数据库中的序列数量增加,保守性模式将发生轻微变化。ConSurf-DB的每次更新都使用一些较大的序列数据库,因此,每条链的MSA将略有不同。此外,ConSurf使用的方法也会定期进行改进。例如,MSA算法最初默认为CLUSTAL-W,然后是MUSCLE,最后是MAFFT。

因此,即使作业参数相同,ConSurf服务器的结果也会随时间略有变化。只有上传相同的MSA,当作业间隔数月或数年运行时,给定链的结果才会相同。

您可能会发现下载ConSurf结果很有用(从任一ConSurf服务器)为了保留特定结果,以便与以后获得的结果进行比较。

其他进化保护服务器

INTREPID公司

"INTREPID公司是一种用于功能位点识别的信息理论方法,它利用了大量不同的多序列比对中的信息。INTREPID使用PSI-BLAST收集序列的同源物,并估计系统发育树。然后,它使用Jensen Shannon散度来测量系统发育遍历中遇到的每个子树节点的序列中每个位置的信息,追踪与感兴趣序列相对应的从根到叶的路径。在整个家族中保守的位置比仅在更密切相关的亚组中保守的得分更高。此树遍历为MSA中的每个位置生成一个系统发育保守性得分。INTREPID仅使用序列中的信息,因此可以在结构知识不可用时使用。“(引自INTREPID网站.)

INTREPID接受蛋白质链序列作为输入。它提供了Jmol中3D蛋白质结构上的保守残基的颜色。3D结构(如果可用)可从蛋白质数据库通过序列比对搜索,用户可以从点击菜单中进行选择。

有证据表明,INTREPID在预测催化残留物方面优于ConSurf。

与ConSurf不同,INTREPID不标识最可变残留物除了最保守的.

xProtCAS公司

xProtCAS公司是一种在AlphaFold2结构模型上识别保守表面的工具。该工具从结构模型中定义自治结构模块,并将这些模块转换为编码剩余拓扑、可访问性和守恒的图。xProtCAS作为开源Python软件和交互式web服务器提供。

“xProtCAS网络服务器代表了一个快速、简单和直观的分析蛋白质表面保护的工具。用于保护可访问表面发现的两个可比较的可用网络工具PatchFinder和FuncPatch网络服务器在出版时已不再起作用。与ConSu的功能有重叠射频服务器。然而,最保守的可访问表面的定义以及与xProtCAS服务器的AlphaFold2模型的集成增加了ConSurf服务器不可用的关键功能。“(引自xProtCAS相关出版物[1].)

站点FiNDER|3D

siteFiNDER|3D执行保守功能群(CFG)分析。“CFG分析是预测目标蛋白质结构中功能重要位点位置的通用方法。与其他可用的结构/序列分析技术一样,CFG分析利用同源蛋白质组之间存在的进化关系来识别可能具有功能意义的区域意义。然而,这种技术在其他方法失败的情况下尤其有用,例如,只有少数或高度相似的同源物可以被识别。“顾名思义,CFG分析试图识别共同代表一个功能位点的保守氨基酸组。在这方面,它超越了大多数其他进化保护服务器,后者只为每个氨基酸指定一个保护值。参见siteFiNDER|3D与ConSurf对细胞色素c的比较.

该站点提供了其他几个预测功能站点的软件包的链接,其中一些在本文中没有进一步讨论。

热修补程序

热修补程序 [2]“在蛋白质表面发现不寻常的斑块,并计算它们的不寻常程度(斑块稀少度),以及每个斑块具有功能重要性的可能性(功能置信度(FC))。统计分析是通过将蛋白质的表面与功能位点已知的大量蛋白质的表面进行比较来完成的。”HotPatch的一个优点是不需要序列同源物。请参阅HotPatch与ConSurf细胞色素c的比较.

进化跟踪查看器

进化跟踪查看器(ETV)。请参阅ETV与ConSurf细胞色素c的比较.

评论人用户:Eric Martz2009年3月:从ETV网站上提供的信息来看,我发现很难理解ETV正在做什么,或者如何使用查看器。对非专业人士进行简单的解释将非常有用。


电动联轴器/电动折叠

EVolutionary Couplings服务器使用统计物理的方法提供进化序列记录中的蛋白质的功能和结构信息。

该站点提供了到其他几个相关服务器和软件包的链接。

另请参见

工具书类

  1. Kotb,H.M.和Davey,N.E。xProtCAS:一个从蛋白质结构中提取保守可访问表面的工具包生物分子33:906(2023)。内政部:10.3390/biom13060906
  2. Pettit FK、Bare E、Tsai A、Bowie JU。HotPatch:一种统计方法,用于发现蛋白质表面的生物学相关特征。分子生物学杂志。2007年6月8日;369(3):863-79. Epub 2007年3月21日。PMID:17451744数字对象标识:http://dx.doi.org/10.1016/j.jmb.2007.03.036

Proteopedia页面贡献者和编辑(这是什么?)

埃里克·马茨,韦恩·迪凯特,埃兰·霍迪斯

内政部:https://dx.doi.org/10.14576/108030.1766168(?)
引用:Martz E,Hodis E,2013,“保护,进化”,蛋白质体,内政部:https://dx.doi.org/10.14576/108030.1766168
个人工具