跳到主要内容
访问密钥 NCBI主页 MyNCBI主页 主要内容 主导航
核酸研究。2006年1月1日;34(数据库问题):D270–D272。
2005年12月28日在线发布。 数字对象标识:10.1093/nar/gkj089
预防性维修识别码:项目经理1347452
PMID:16381862

MEROPS:肽酶数据库

摘要

肽酶(蛋白水解酶)及其天然蛋白质抑制剂与生物学、医学和生物技术有着密切的关系。这个MEROPS公司数据库(http://merops.sanger.ac.uk)旨在满足对这些蛋白质信息集成来源的需求。数据库的组织原则是一种层次分类,其中感兴趣的同源蛋白质组被分组为家族,同源家族被分组为氏族。数据库中最重要的新增内容是为每个肽酶家族新编写的简明文本注释。最近添加的其他形式的信息包括在序列显示和BlastP搜索结果中突出显示活性位点残基(或使某些同源物失去活性的替换物)、动态生成的排列和肽酶或抑制剂水平的树,以及经实验鉴定为活性的人类和小鼠同源物的精选列表。一种新的方法已经被设计出来,可以在比物种更高的分类学层次上显示信息。在文献页面中,参考文献已被标记,以引起人们对特别“热门”主题的关注。

简介

这个MEROPS公司该数据库是蛋白质水解酶(最好称为肽酶)及其蛋白抑制剂的人工信息资源。该数据库自1996年以来一直存在,可在以下网址找到:http://merops.sanger.ac.uk.

SwissProt数据库中18%的序列被注释为正在进行蛋白水解处理,约2%的基因编码各种生物体中的肽酶及其同源物,人类基因组中有550多个活性和假定的肽酶,这说明了肽酶及其抑制剂的重要性。这个MEROPS公司1993年建立的肽酶分类(1)是在蛋白质结构域水平上的分类(我们将有问题的结构域称为肽酶单元),具有层次性。生化上相似的同源物被赋予相同的标识符,并且为每个标识符指定一个全型。具有同源肽酶单位的蛋白质属于一个家族。必须证明家族中的每个成员都与指定的类型示例相关。如果有迹象表明(主要是从第三级结构的相似性来看)有一个共同的祖先,那么家庭就被归为一个氏族。同样的原理也被用于肽酶蛋白抑制剂的分类(2). 抑制剂不像肽酶那样广泛分布,每个细菌或古生菌基因组中只有一个或两个已知。在人类基因组中,有105种已知的抑制剂和176种未知的同源物具有抑制作用。

第7.1版(2005年7月)的统计数据MEROPS公司如所示表1与2003年6月的6.3版相比。虽然被归类为肽酶同源物的序列数量几乎翻了一番,但这些序列大多是对现有家族的补充,自2003年6月以来只发现了八个新的肽酶家族。

表1

肽酶和蛋白抑制剂同源物的标识符、家族和家族计数MEROPS公司数据库

MEROPS 7.1版抑制剂MEROPS 6.3版抑制剂
肽酶类肽酶类
序列30 9093 69018 0762651
标识符2 0535321 711318
家庭1805317248
氏族39323325

显示了的7.1版的计数MEROPS公司数据库(2005年7月)和6.3版(2003年6月)。

家庭总结

我们为所有肽酶家族添加了文本摘要。每个摘要都按以下标题编排,并简要描述其内容:

  1. 家族内容:对催化类型的描述,以及家族中的肽酶是内肽酶还是外肽酶(氨肽酶、羧肽酶等)或混合物。
  2. 历史:家族中肽酶首次发现的时间和其他重要背景信息。
  3. 活性位点:对催化很重要的残基,包括金属肽酶的金属配体,并描述氨基酸在每个位置的变化。
  4. 活性和特异性:反应条件和示例底物。
  5. 抑制剂:主要列出可用于区分家族成员的小分子抑制剂。
  6. 分子结构:如果已经确定了该家族任何成员的三级结构,则描述折叠并与其他成员进行比较。这里还包括结构域的组织和特征的保存,例如二硫键桥和跨膜区域。
  7. 家族分布:当生物体之间的分布异常时,这包括在内,例如C51,它仅存在于感染葡萄球菌的噬菌体中。
  8. 生物功能:已知生理和病理作用的示例。
  9. 药物和生物技术相关性:作为药物靶点或具有工业用途的家族肽酶。

还对蛋白质抑制剂家族进行了总结。标题为家族内容、历史、反应位点、抑制肽酶、分子结构和家族分布。

文献页面中主题的标记

有关肽酶的文献很多MEROPS公司包含20000多个参考文献。为了更容易在文献页面中找到关于特定主题的论文,我们为六个重要主题添加了“标记”。因此,“E”表示论文包含肽酶重组表达的信息我“表明我们发现这篇文章与酶抑制剂的设计有关;”“K”表示论文涉及基因敲除或其他人工基因操作M’表明论文涉及自然突变、等位变异或多态性R’表示文章包含RNA剪接变体的信息S’表示文章涉及3D结构;“V”表示这篇文章是一篇综述。

突出显示顺序显示、家庭页面和爆破结果

由于催化功能的限制,活性位点残基往往高度保守。因此,即使是不相关的肽酶也可能具有类似甚至重叠的活性位点。例如,在胰蛋白酶(S1家族,PA家族)、枯草杆菌素(S8家族,SB家族)和羧肽酶Y(S9家族,SC家族)中发现丝氨酸、组氨酸、天冬氨酸催化三联体,尽管残基的顺序不同,第三折叠完全不同。许多肽酶家族含有不是肽酶的同源物,因为一个或多个活性位点残基已经改变(尽管我们强调,在一些家族中,除了肽酶之外,还有一些酶拥有一组匹配的活性位点残基和/或金属配体,如M20家族中的琥珀酰二氨基二聚物去琥珀酸酶)。在我们的注释族比对中,我们采用了将活性位点残基显示为红色背景上的白色文本、金属配体显示为蓝色背景上的白文本以及将两者替换为黑色背景上的白文本的惯例。现在,我们已经将高亮显示扩展到序列显示、系列摘要和BlastP搜索结果。

在我们以FastA格式显示每个序列时(),我们不仅突出了活性位点残基和金属配体,还以红色突出了肽酶(或抑制剂)单元。我们还显示了肽酶单元何时被不相关的(“nested”)结构域中断(例如明胶酶a中的纤维连接蛋白样重复序列)。现在对残留物进行编号,标题行包括肽酶(或抑制剂)单元的范围和催化残留物的残留物编号。

我们增强了服务,用户可以使用BlastP程序提交序列并搜索我们收集的肽酶序列(4)对BlastP结果进行了新的注释,根据我们的标准惯例显示了活性位点残留。这允许用户一眼就知道查询序列是否可能是肽酶。

强调反应性位点残基不适用于蛋白质抑制剂,因为反应性位点的残基在一个家族中是高度可变的。

在每个族对齐和树的标签文件中,我们现在突出显示全息图以及族类型示例。

肽酶/抑制剂水平的排列和树木

我们一直为每个家庭提供从中衍生的路线和树木MEROPS公司,但我们现在为每个肽酶和蛋白质抑制剂动态生成一个排列和树。家族比对仅显示肽酶或抑制剂单元,但新选项还允许用户选择要比对的完整序列。我们期望分配给相同标识符的每一种肽酶或抑制剂从N末端到C末端具有序列相似性。标识级别的对齐由MUSCLE生成(5); 此对齐用于生成邻接树(6)使用QuickTree(7)它使用欧洲生物信息学研究所的Rodrigo Lopez和Stephen Robinson编写的ClustalTree Java applet显示。

生物体水平的肽酶和抑制剂

生物名称索引现在包括英语通用名称和科学二项式的同义词。这有助于用户找到感兴趣的有机体。

对于已知肽酶的每个生物体,我们列出了一个简短的分类法(超王国、王国、门、亚门、超类、纲、亚纲、超目、目、亚目、超科、科、亚科和属)和所有已知的肽酶同源物。为了帮助检查肽酶在生物体中的分布,我们现在提供了一个工具,在每个生物体页面的分类表中显示所有更高级别的肽酶(或蛋白抑制剂)数据。例如,在咨询恶性疟原虫页面上,用户可能会发现了解这些肽酶在所有肽酶中的分布情况很有用疟原虫物种,点击分类表中的属级别就会显示出来。知道一种病原体中存在一种肽酶,而另一种却不存在,这可能表明该肽酶是否是潜在的药物靶点。

Organism页面变得更具交互性,用户只需单击相应列的顶部即可按族、家族、肽酶或抑制剂或基因名称对数据进行排序。默认情况下,列表按族排序。

用户现在可以通过单击每个organism页面顶部的链接,以FastA格式获取每个有机体的所有肽酶(或抑制剂)单元序列。

人和小鼠肽酶的活性状态

一般来说,当肽酶在生物化学或功能上与家族中的其他成员明确区分时,我们为其创建一个标识符。然而,我们已经为每个人类和小鼠肽酶和抑制剂同源物创建了一个标识符。虽然为黑腹果蝇肽酶立即意味着肽酶是活性的,这不是人类或小鼠肽酶同源物的情况。因此,我们回顾了文献,以寻找每种人类和小鼠肽酶同源物的蛋白水解活性的证据,并在每个肽酶页面上包含了参考文献。我们说明目前我们是否将同源物视为“活性”、“假定”或“非活性”肽酶同源物。如果我们知道一种肽酶在实验上被证明是活性的,我们会给出一个参考;另一方面,如果我们认为它由于一个或多个预期的活性位点残基被替换而处于非活性状态,这是根据上述约定表示的。请参见表2例如。

表2

人类和小鼠肽酶同系物活性状态注释示例

对于非肽酶同系物,保守的活性位点残基在红色背景上显示为白色文本,被替换的残基在黑色背景上显示为由白色文本构成的。

在人类基因组中,有440种肽酶同源物,我们认为它们对肽底物没有活性。

总结

肽酶和蛋白抑制剂序列的收集和分析现已基本实现自动化,因此MEROPS公司过去两年的数据库一直在增加注释,我们打算在未来通过对抑制剂家族、肽酶家族和抑制剂家族的总结来扩展注释。

致谢

支付这篇文章的开放获取出版费用的资金由英国医学研究委员会和Wellcome信托基金提供。

利益冲突声明。未声明。

参考文献

1罗林斯N.D.、巴雷特A.J.肽酶的进化家族。生物化学。J。1993;290:205–218. [PMC免费文章][公共医学][谷歌学者]
2罗林斯N.D.、托勒D.P.、巴雷特A.J.肽酶抑制剂的进化家族。生物化学。J。2004;378:705–716. [PMC免费文章][公共医学][谷歌学者]
三。Pearson W.R.,Lipman D.J.生物序列比较的改进工具。程序。美国国家科学院。科学。美国。1988;85:2444–2448. [PMC免费文章][公共医学][谷歌学者]
4.Altschul S.F.、Gish W.、Miller W.、Myers E.W.、Lipman D.J.基本局部对齐搜索工具。分子生物学杂志。1990;215:403–410.[公共医学][谷歌学者]
5Edgar R.C.MUSCLE:一种减少时间和空间复杂度的多序列比对方法。BMC生物信息学。2004;5:113. [PMC免费文章][公共医学][谷歌学者]
6赛图N.,内M.邻接法:一种重建系统发育树的新方法。分子生物学。进化。1987;4:406–425.[公共医学][谷歌学者]
7Howe K.,Bateman A.,Durbin R.QuickTree:构建蛋白质序列的巨大邻接树。生物信息学。2002;18:1546–1547.[公共医学][谷歌学者]

文章来自核酸研究由以下人员提供牛津大学出版社