跳到主要内容
访问密钥 NCBI主页 MyNCBI主页 主要内容 主导航
数据库(牛津)。2011; 2011年:bar006。
2011年4月15日在线发布。 doi(操作界面):10.1093/数据库/bar006
PMCID公司:项目经理3077825
PMID:21498547

漆酶工程数据库:漆酶及相关多铜氧化酶的分类和分析系统

摘要

漆酶及其同系物构成了多铜氧化酶(MCO)的蛋白质超家族。它们催化许多物质的氧化,特别是酚类物质的氧化,除了在许多细胞活动中发挥重要作用外,在生物技术应用中也很有兴趣。漆酶工程数据库(LccED,http://www.lcced.uni-suttgart.de)旨在作为一种工具,对不同的多铜氧化酶蛋白家族进行基于序列的系统分类和分析。2200多个蛋白质被分为11个超家族和56个同源家族。对于每个家族,LccED提供了多重序列比对、系统发育树和家族特异HMM图谱。14种不同蛋白质的结构整合允许对序列和结构进行全面比较,以获得生化特性。在这些家族中,研究了不同王国的蛋白质分布。该数据库用于通过MCO和漆酶特异性模式进行综合分析。

LccED结合了MCO序列和结构的信息。它作为一种分类工具,将新的蛋白质分配到同源家族,并可用于研究序列-结构-功能关系和指导蛋白质工程。

数据库URL: http://www.lcced.uni-suttgart.de

介绍

多铜氧化酶(MCOs)催化其底物的单电子氧化,同时伴随分子氧的四电子还原为水。MCO由四个酶家族组成:漆酶(酶代码EC1.10.3.2)、抗坏血酸氧化酶(酶代码1.10.3.3)、氧化铁酶(酶号EC1.16.3.1)和铜蓝蛋白(酶号EC 1.16.3.2)。功能研究表明,MCO有两个活性位点:一个蓝色1型(T1)铜位点,底物被氧化;一个三核铜簇[由三个2型(T2)/3型(T3)铜组成],氧被结合、活化和还原(1). 电子通过高度保守的氨基酸从T1位点转移到T2/T3位点,这些氨基酸在PROSITE中已有描述(2,)作为MCO特定图案,又称M2和M4(4,5). 此外,从100个植物和真菌漆酶序列中生成了漆酶特异性特征序列,即L1和L3。L1和L3被认为是漆酶的特异性,并被提议将漆酶与其他MCO区分开来(6). 虽然整体序列相似性很低,但结构和催化机制是保守的(7). 大多数MCO由三个铜氧还蛋白结构域组成,但铜蓝蛋白和一些细菌漆酶除外,它们分别含有六个或两个结构域(8). 根据域的数量,MCO的大小不同,从300到1000个残基,最多包含六个铜离子(4).

漆酶是MCO中最大的亚科,广泛分布于真菌、高等植物中(9,10)、细菌(11)和昆虫(12). 在真菌中,它们被认为参与了木质素的降解(13)、颜料生产(14)和植物发病机制(15). 在植物中,它们的潜在功能是木质素的生物合成(16). 在细菌中,它们被认为在黑色素生成、孢子外壳抗性、形态发生和铜的解毒中发挥作用(17). 尤其是漆酶,它构成了最大的MCO亚类,在纺织、纸浆和造纸工业以及食品应用、生物修复和有机合成中作为通用催化剂也具有很高的生物技术潜力(18,19). 然而,它们的氧化还原电位经常受到限制,并且以相对非特定的方式反应(20). 工程漆酶有望提高酶的活性、特异性和选择性(21). 人们希望了解序列、结构和功能之间的关系将对漆酶的工程化有很大帮助。因此,我们集成了MCO序列和结构的数据,并使用数据仓库系统DWARF建立漆酶工程数据库(LccED)(22). 此前,350名主要负责人被分配到10个超级家族(23):(A)担子菌漆酶、(B)子囊菌漆酶,(C)昆虫漆酶、,(D)真菌色素MCO、(E)真菌氧化铁酶、(F)真菌和植物抗坏血酸氧化酶、(G)植物漆酶样MCO、,(H)铜抗性蛋白(CopA)、(I)胆红素氧化酶和(J)铜外排(CueO)蛋白。对于缺乏第二个结构域的MCO,称为小漆酶(SLAC),根据SLAC从腔色链霉菌(24). 通过序列相似性检索同源MCO序列并将其分配给家族。为了协助综合序列分析,通过自动模式搜索或从GenBank提取的信息生成并注释了可靠的多序列比对(25). 此外,家庭特定HMM配置文件(26)和爆炸(27)提供的接口允许将新序列分配给族。因此,LccED是第一个结合序列、序列比对、注释和MCO结构信息的数据资源。

结构和内容

数据库建设

LccED是在数据仓库系统DWARF中建立的,DWARF为家族特异性蛋白质数据库中序列和结构的集成提供了数据模型,以及从各种数据源提取和加载数据的工具(22). 此前,超过350个MCO序列被分配给10个超家族(23). 从这个数据集中,248个序列(GenBank条目可用)被选为种子序列,并由霍格根据其初始分类进行分配等。这10个超家族是根据其种子序列的起源命名的。为两个结构域漆酶和来自腔色链霉菌被用作该家族的种子序列。随后,对每个种子序列进行BLAST搜索(27)在NCBI的非冗余序列数据库中执行(网址:http://ncbi.nlm.nih.gov)带有E类-的值E类 = 10−10. TheE类-BLAST搜索的值是根据经验确定的。因此,对于更多样的细菌家族E类-的值E类 = 10−5已应用。如果序列一致性高于40%,则将每个BLAST命中分配给相应种子序列的超家族。根据CLUSTAL W计算的多重序列比对和系统发育树,将超家族中的序列划分为同源家族(28). DWARF系统的序列数据加载程序提取了有关源生物、序列注释和序列的信息。物种信息已适应NCBI分类法。表示同一有机体的不同名称在有机体页面上作为同义词列出。来自同一来源生物体的序列和共享>98%的相同残基被表示为单个蛋白质条目。此分配在自动脚本中实现,从而防止来自同一生物体的一个蛋白质在数据库中重复出现,并避免冗余,即使它可能出现在GenBank中。

如果BLAST点击指定蛋白质结构,则从PDB中提取相应结构(29),存储为结构单体,DSSP为每条链生成二级结构信息(30). CLUSTAL W对所有家族进行了多序列比对(28)并手动检查以提高一致性和质量。从数据库中删除了不属于任何超家族且与MCO类不相似的蛋白质。BLAST点击是指比通常MCO更长的蛋白质片段或假定序列,或与MCO序列高度相似的蛋白质,如果它们在活性位点区域中局部对齐,则选择将其包括在内。

LccED使用DWARF系统的自动更新功能提供定期年度更新,该系统应用删除条目的蛋白质“黑名单”,与永久增长的GenBank数据保持同步(25).

目录

LccED包含2828个序列和2297个蛋白质的数据。对于来自10个不同同源家族的21个蛋白质,沉积了晶体结构,共形成82个结构单体。根据种子序列的起源,这些蛋白质被分配到11个超家族,根据系统发育,被分配到56个同源家族(表1). 对于每个超家族和同源家族,一个注释的多序列比对、一个系统发育树和一个家族特异HMM图谱(网址:http://hmmer.janelia.org/)已生成。

表1。

LccED家族、序列和结构

超级家族同源家族蛋白质结构
A(担子菌漆酶)420113
B(子囊菌漆酶)64216
C(昆虫漆酶)81680
D(真菌色素MCO)4550
E(真菌铁氧化酶)61176
F(真菌和植物AO)61378
G(植物漆酶)53330
H(细菌CopA蛋白质)63830
I(细菌胆红素氧化酶)514924
J(细菌CueO蛋白质)531011
K(SLAC同系物)118

Web界面

LccED公开于http://www.LccED.uni-stutgart.de。可以按家庭、有机体或结构浏览。对于每个家族,都提供了预先计算的注释多序列比对、系统发育树和HMM。排列和树中的所有蛋白质条目都链接到其原始NCBI条目。与功能相关的氨基酸是彩色编码的,将鼠标移动到多序列比对中的相应残基上时,会显示更多信息。使用PLOTCON计算路线的保护度(31). 全氟辛烷磺酸(32)所有蛋白质条目的链接都已添加到可用的范围内。此外,通过在各个区域滚动鼠标,可以在多序列比对中访问每个蛋白质的PFAM注释。系统发生树由内部开发的树可视化工具可视化,该可视化工具允许根据同源家族(在超家族树中)、有机体、序列长度和源有机体的王国等属性对每个条目进行着色(图1). 通过本地BLAST接口,可以根据与现有LccED条目的序列相似性对未知MCO序列进行分类。可以下载一份包含所有族、序列、结构、多序列比对、树和剖面信息的目标档案。

保存图片、插图等的外部文件。对象名称为bar006f1.jpg

同源家族I1(胆红素氧化酶)的系统发生树。选择的着色选项是“按王国”。细菌来源的条目显示为蓝色,真菌条目显示为红色,植物蛋白显示为绿色,未指定条目显示为黑色。

生物体分布和模式分析

在这项研究中,基于序列相似性和系统发育分析,将2297个来自广谱源生物的MCO蛋白归入超家族和同源家族。对A–K家族2274个蛋白质的序列相似性、来源生物和形成铜结合位点的模式之间的关系进行了综合分析。已建议建议的模式L1(H-W-H-G-x(9)-D-G-x(5)-Q-C-P-I)和L3(H-P-x-H-L-H-G-H)对漆酶具有特异性,模式M2(G-x-[FYW]-x-[LIVMFYW]-x-[CST]-x-{公关}-{K} -x(2)-{S} -x个-{LFH}-G-MCO的[LM]-x(3)-[LIVMFYW],PROSITE条目PS00079)和M4(H-C-H-x(3(图2). 模式L1包括一个结合T2铜的组氨酸和一个结合T3铜的组氨酸。模式M2包括另外两个T3铜配体。模式L3包括T1、T2和T3铜的配体。在模式M4中,T1中心的四个配体中的三个和一个T3铜配体位于(图2). 为了进行注释和计算,应用了从L1、L3、M2和M4生成的正则表达式。由于其序列长度短且结构域缺失,SLAC家族的蛋白质被排除在家族内模式外观的分析之外(补充表S1)以及假阴性的结果数(补充表S2).

保存图片、插图等的外部文件。对象名为bar006f2.jpg

漆酶的铜结合残基云芝[PDB条目1GYC(39)].铜中心以橙色显示,与定义的图案L1、M2、L3、M4匹配的残留物分别以红色、绿色、蓝色和黄色表示【PyMOL可视化(40)].

A家族(担子菌漆酶)只含有真菌蛋白,91%来自担子菌(同源家族A1–A4),9%来自子囊菌(同源系列A2)。80%在GenBank中被注释为漆酶。23%的蛋白质含有模式L1、22%的M2、14%的L3和46%的M4。百分之十七的条目被注释为假定条目。

B族(子囊菌漆酶)含有36%的子囊菌。它们都属于同源家族B1,其中62%在GenBank中被注释为漆酶。其他蛋白质均来源于细菌(同源家族B2-B6),其中3%在GenBank中标注为漆酶。然而,它们与子囊菌漆酶显示出超过40%的相当大的序列同一性。88%的蛋白质含有模式L1、92%的M2、49%的L3和15%的M4。百分之三十三的条目被注释为假定条目。

C家族(昆虫漆酶)产生78%的昆虫起源蛋白质(同源家族C1–C8)。其余22%由棘球绦虫(同源C1科)、头索动物门和巨蟹目(同源C6科)组成。百分之三十八在GenBank中被注释为漆酶。30%的蛋白质包含模式L1、75%M2、75%L3和3%M4。百分之三十五的条目被注释为假定条目。

D家族(真菌色素MCO)只含有真菌蛋白。在GenBank中,36%的蛋白质被标注为漆酶。90%的蛋白质含有模式L1、78%的M2、82%的L3和11%的M4。58%的条目被标注为假定条目。

E家族(真菌铁氧化酶)只含有真菌蛋白质。17%的蛋白质在GenBank中被注释为漆酶。83%的蛋白质含有模式L1、40%M2、23%L3和3%M4。百分之四十五的条目被注释为推定条目。

F家族(真菌和植物抗坏血酸氧化酶)主要含有植物起源的蛋白质(同源家族F2-F6)。12%为真菌起源,全部聚集在同源家族F1。在GenBank中,2%被注释为漆酶。在这个家族中,88%的蛋白质包含模式L1、56%M2、66%L3和66%M4。62%的条目被注释为假定条目。

G家族(植物漆酶)只含有植物起源的蛋白质,83%在GenBank中被注释为漆酶(同源家族G1–G5)。15%的蛋白质含有模式L1,88%含有模式M2,77%含有模式L3,2%含有模式M4。53%的条目被注释为假定条目。

H家族(细菌CopA蛋白质)包含98%的蛋白质来自细菌(同源家族H1–H6)。在GenBank中,83%被注释为漆酶。50%包含图案L1、50%M2、42%L3和3%M4。6%的条目被注释为假定条目。

家族I(胆红素氧化酶)包含70%的蛋白质来源于细菌(同源家族I1–I5),15%来源于植物(同源家族l3),10%来源于真菌(同源家族I1),5%来源于未知生物体(图1). 3%在GenBank中注释为漆酶。70%包含图案L1、92%M2、91%L3和65%M4。百分之二十到六的条目被注释为假定条目。

J家族(细菌CueO蛋白质)包含90%的蛋白质来自细菌(同源家族J1–J4)和10%的蛋白质来自真核生物(同源家族J5)。12%在GenBank中被注释为漆酶。74%的蛋白质含有模式L1、75%的M2、76%的L3和3%的M4。百分之三十九的条目被注释为假定条目。

K家族(SLAC)只包含“小漆酶家族”的成员,这些成员都是细菌来源的,在GenBank中被注释为MCO,只包含模式L4。6%的条目被注释为假定条目。

除了漆酶和MCO序列模式的微小变化外,几乎所有MCO序列都共享相同的高度保守的铜结合残基(图2). 它们可以通过手动验证每个特定于家族的多序列比对来识别和注释。只有在同源家族F5、F6、H3和J2中才能检测到这些残基。

讨论

如前所述(23)这10个MCO超家族是通过结合主要来源生物的名称和假定的酶功能命名的。源生物在各科中的总体分布与最初的分类基本一致。由于将蛋白质分配到超家族完全基于序列相似性,因此预计会在同一家族中发现来自不同来源生物体,甚至来自不同生命王国的蛋白质。事实上,尽管序列相似性高达40%,但大多数家族都由属于一个王国的大多数蛋白质和来自其他王国的少数蛋白质组成。只有通过序列相似性对所有蛋白质进行系统分类,才能对超家族进行可靠的序列比对,并确定保守的、功能相关的序列模式。然而,对先前描述的MCO和漆酶特异性模式的系统分析(4–6)由少量MCO和漆酶衍生而来,显示出其低灵敏度。这也得到了大量假阴性的支持,这些假阴性是通过手动分析多序列比对的各个区域而检索到的(补充表S2). 只有15%和65%的MCO出现M2和M4型MCO(补充表S1)分别是。9%的MCO同时含有M2和M4。将漆酶与其他MCO区分开来更加困难。如果我们假设序列相似性是功能相似性的指示,那么有四个超家族含有假定的漆酶。然而,对于这些家族,漆酶特异性模式L1和L3分别只在45%和37%的序列中发现(补充表S1). 只有8%的假定漆酶同时包含所有四种模式。这种低百分比的阳性点击可能表明“漆酶超家族”含有没有漆酶活性的MCO,也可能是因为限制性模式太强。作为模式的替代,序列图谱被广泛用于指定功能相关的蛋白质家族(32,33). 因此,对于每个超家族,都提供了一个隐藏的马尔可夫分布,并且在LccED中一致地注释了四个铜结合区域。

为了定义漆酶的识别规则,需要进行更详细的功能研究。新获得的信息,例如氧化还原电位或突变的影响,可以添加到随时准备的表格中,并可以转移到密切相关的蛋白质上。以前已经表明,基于序列相似性和LccED提供的综合分析工具对大蛋白家族进行系统分类是研究酶家族序列-结构-功能关系的可靠框架(34–36)以及用于设计具有改进的生物化学性质的突变体或聚焦突变体文库(37,38).

结论

LccED能够对不同公共来源的MCO序列和结构进行系统分类和分析。将蛋白质数据集成到关系数据库系统中,用于研究生化特性的分子基础,并研究序列-结构-功能关系。LccED提供了一套用于系统发育分析和分类的工具。带注释的多序列比对允许识别铜原子和其他功能相关残基所在的区域。

可利用性

LccED位于http://www.LccED.uni-stutgart.de。通过此web界面,可以访问所有序列、路线和树,并提供所有数据供下载。

补充数据

补充数据可在数据库在线。

基金

感谢德意志联邦统计局(SFB 706)的财政支持,以及开放存取收费资金。

利益冲突。未声明。

致谢

我们感谢Constantin Vogel对DWARF工作台的扩展,以允许结构注释。

工具书类

1Solomon E、Sundaram U、Machonkin T.多铜氧化酶和加氧酶。化学。版次。1996;96:2563–2606.[公共医学][谷歌学者]
2Hulo N、Bairoch A、Bulliard V等。PROSITE的20年。核酸研究。2008;36:D245–D249。 [PMC免费文章][公共医学][谷歌学者]
三。Sigrist CJ、Cerutti L、Hulo N等。PROSITE:使用模式和轮廓作为主题描述符的文档化数据库。简要生物信息。2002;:265–274.[公共医学][谷歌学者]
4Messerschmidt A,Huber R.蓝色氧化酶、抗坏血酸氧化酶、漆酶和铜蓝蛋白。建模和结构关系。欧洲生物化学杂志。1990;187:341–352.[公共医学][谷歌学者]
5Ouzounis C,Sander C.检测远相关蛋白质中I型铜结合域的结构衍生序列模式。FEBS通讯。1991;279:73–78.[公共医学][谷歌学者]
6Kumar SVS、Phale PS、Durani S等。真菌漆酶家族的组合序列和结构分析。生物技术。比昂。2003;83:386–394.[公共医学][谷歌学者]
7Nakamura K,Go N.多铜蓝蛋白的功能和分子进化。单元格。摩尔生命科学。2005;62:2050–2066. [PMC免费文章][公共医学][谷歌学者]
8Murphy ME,Lindley PF,Adman ET。铜氧还蛋白结构域的结构比较:结构域再循环以构建具有新功能的蛋白质。蛋白质科学。1997;6:761–770. [PMC免费文章][公共医学][谷歌学者]
9Messerschmidt A.先生。多铜氧化酶。新加坡:世界科学;1997[谷歌学者]
10Mayer AM,斯台普斯RC。漆酶:旧酶的新功能。植物化学。2002;60:551–565.[公共医学][谷歌学者]
11Alexandre G,Zhulin IB。漆酶在细菌中广泛存在。生物技术趋势。2000;18:41–42.[公共医学][谷歌学者]
12Dittmer NT,Suderman RJ,Jiang H,et al.编码假定漆酶样多铜氧化酶的cDNA的特征及其在烟草角虫Manduca sexta和疟疾蚊子Anopheles gambiae中的发育表达。昆虫。生物化学。分子生物学。2004;34:29–41.[公共医学][谷歌学者]
13.Bourbonais R,Paice MG。非酚类底物的氧化。漆酶在木质素生物降解中的扩展作用。FEBS通讯。1990;267:99–102.[公共医学][谷歌学者]
14克拉特巴克AJ。巢状曲霉黄孢突变体中漆酶缺失。《遗传学微生物学杂志》。1972;70:423–435.[公共医学][谷歌学者]
15.Geiger JP,Nicole M,Nandris D,Rio B.巴西橡胶树的根际病害。1.寄主攻击的生理生化方面。《欧洲森林病理学杂志》。1986;16:22–37. [谷歌学者]
16O'Malley DM,Whetten R,Bao W,等。漆酶在木质化中的作用。工厂J。1993;4:751–757. [谷歌学者]
17Sharma P、Goel R、Capalash N.细菌漆酶。世界微生物学杂志。生物技术。2007;23:823–832. [谷歌学者]
18Rodriguez Couto S,Toca Herrera JL。漆酶的工业和生物技术应用:综述。生物技术。副词。2006;24:500–513.[公共医学][谷歌学者]
19Riva S.漆酶:用于绿色化学的蓝色酶。生物技术趋势。2006;24:219–226.[公共医学][谷歌学者]
20伯顿SG。氧化酶作为生物催化剂。生物技术趋势。2003;21:543–549.[公共医学][谷歌学者]
21Kunamneni A、Camarero S、Garcia-Burgos C等。真菌漆酶在有机合成中的工程与应用。微量。单元格事实。2008;7:32. [PMC免费文章][公共医学][谷歌学者]
22.Fischer M、Thai QK、Grieb M等。DWARF–用于分析蛋白质家族的数据仓库系统。BMC生物信息学。2006;7:495. [PMC免费文章][公共医学][谷歌学者]
23Hoegger PJ、Kilaru S、James TY等。漆酶和相关多铜氧化酶蛋白序列的系统发育比较和分类。FEBS J公司。2006;273:2308–2326.[公共医学][谷歌学者]
24Machczynski MC,Vijgenboom E,Samyn B,et al.SLAC的表征:一种来自天色链霉菌的具有前所未有活性的小漆酶。蛋白质科学。2004;13:2388–2397. [PMC免费文章][公共医学][谷歌学者]
25Benson DA、Karsch-Mizrachi I、Lipman DJ等。GenBank。核酸研究。2008;36:D25–D30。 [PMC免费文章][公共医学][谷歌学者]
26Durbin R、Eddy S、Krogh A、Mitchison G。生物序列分析。英国剑桥:剑桥大学出版社;1998[谷歌学者]
27.Altschul SF、Madden TL、Schäffer AA等。缺口BLAST和PSI-BLAST:新一代蛋白质数据库搜索程序。核酸研究。1997;25:3389–3402. [PMC免费文章][公共医学][谷歌学者]
28Thompson JD、Higgins DG、Gibson TJ。CLUSTAL W:通过序列加权、特定位置间隙惩罚和权重矩阵选择提高渐进式多序列比对的敏感性。核酸研究。1994;22:4673–4680. [PMC免费文章][公共医学][谷歌学者]
29Berman HM、Battistuz T、Bhat TN等,《蛋白质数据库》。《水晶学报》。D生物结晶仪。2002;58:899–907.[公共医学][谷歌学者]
30Kabsch W,Sander C.蛋白质二级结构词典:氢键和几何特征的模式识别。生物聚合物。1983;22:2577–2637.[公共医学][谷歌学者]
31Rice P、Longden I、Bleasby A.EMBOSS:欧洲分子生物学开放软件套件。趋势Genet。2000;16:276–277.[公共医学][谷歌学者]
32Finn RD、Tate J、Mistry J等。Pfam蛋白质家族数据库。核酸研究。2008;36:D281–D288。 [PMC免费文章][公共医学][谷歌学者]
33Servant F、Bru C、Carrere S等。ProDom:同源域的自动聚类。简要生物信息。2002;:246–251.[公共医学][谷歌学者]
34Fischer M,Pleiss J.脂肪酶工程数据库:蛋白质家族的导航和分析工具。核酸研究。2003;31:319–321. [PMC免费文章][公共医学][谷歌学者]
35Knoll M,Hamm TM,Wagner F,Martinez V,Pleiss J.PHA解聚酶工程数据库:一种用于多羟基脂肪酸(PHA)解聚酶不同家族的系统分析工具。BMC生物信息学。2009;10:89. [PMC免费文章][公共医学][谷歌学者]
36Sirim D,Wagner F,Lisitsa A,Pleiss J.细胞色素P450工程数据库:生物化学特性的整合。BMC生物化学。2009;10:27. [PMC免费文章][公共医学][谷歌学者]
37Seifert A,Pleiss J.细胞色素P450单加氧酶中选择性决定残基的鉴定:底物识别位点5的系统分析。蛋白质。2009;74:1028–1035.[公共医学][谷歌学者]
38Seifert A、Vomund S、Grohmann K等。合理设计最小且高度富集的CYP102A1突变库,提高区域、立体和化学选择性。化学生物化学。2009;10:853–861.[公共医学][谷歌学者]
39Piontek K,Antorini M,Choinowski T。真菌杂色曲霉漆酶的晶体结构,分辨率为1.90-a,含有全量铜。生物学杂志。化学。2002;277:37663–37669.[公共医学][谷歌学者]
40德拉诺WL。美国加利福尼亚州圣卡洛斯:DeLano Scientific;2002年,PyMOL分子图形系统。[谷歌学者]

文章来自数据库:《生物数据库与治疗杂志》由提供牛津大学出版社