跳到主要内容
访问密钥 NCBI主页 MyNCBI主页 主要内容 主导航
核酸研究。2006年1月1日;34(数据库问题):D192–D194。
2005年12月28日在线发布。 数字对象标识:10.1093/nar/gkj005年10月10日
预防性维修识别码:项目经理1347368
PMID:16381843

CyBase:环状蛋白质序列和结构数据库

摘要

CyBase是一个针对树干环化蛋白质的精选数据库和信息源。该数据库包含天然存在的环状蛋白质以及合成衍生物、接枝类似物和无环渗透剂。该数据库提供了一个关于循环蛋白生物学所有方面的信息的集中存储库,并解决了与拓扑循环序列的管理和搜索相关的问题。数据库可在以下网址免费获取:http://research.imb.uq.edu.au/cybase.

简介与动机

近年来,许多蛋白质被发现含有由肽键的连续循环组成的大环骨架。这种大环蛋白在十年前还不为人所知,但现在已在细菌、植物和动物中发现(1). 与由肽合成酶构建的细菌聚酮和小环肽(如环孢素)不同(2)这些新的环状蛋白是核糖体产生的基因产物,骨架环化作为翻译后修饰发生。这种新型蛋白质引起了人们的兴趣,因为环状蛋白质比传统蛋白质具有一系列优势(,4). 至少有一类环状蛋白质,即环核苷酸,已被证明对蛋白质水解和各种不利的热和化学条件具有抵抗力(5,6). 此外,由于传统蛋白质的末端通常是柔性的,并且由于环化可以降低柔性的程度,熵因子可以提高环状蛋白质相对于相应非环状蛋白质的受体结合亲和力(7,8).

五类天然存在的蛋白质包含循环示例。这些包括周期性的性毛(9)和三种细菌素(1012)来源于细菌,来源于葵花籽的胰蛋白酶抑制剂(SFTI-1)(7,8)还有南瓜南美白苦瓜(MCoTI-II)(13)猕猴的θ-防御素(14)以及堇菜科和茜草科植物中的环核苷酸(1517). 环核苷酸是迄今为止最大的环状蛋白质家族,迄今为止已报道了约60个环核苷酸序列。筛选程序表明,序列的数量可能很快会达到数千个(18,19). 除了这种自然多样性外,还报道了大量环状蛋白的合成突变体、接枝类似物和无环置换物,并对几种生物学意义上的蛋白质进行了人工环化(2022). 信息的增长需要对序列/结构/功能数据进行整理,并制定统一的命名法,以防止重复研究和多重命名方案。此外,环状蛋白质的序列搜索增加了额外的复杂性,大多数序列搜索工具都假设氨基酸的线性序列。由于骨架环化是一种“无缝”的翻译后修饰,因此仅从成熟序列中无法确定N和C末端的位置。因此,在搜索循环序列时,数据库中序列的开始和结束点通常是任意的,可能会混淆传统的搜索技术。处理环状序列所需的特殊考虑以及关于其结构和功能的快速扩展数据导致我们开发了一个名为CyBase的环状蛋白质的精选数据库和网络信息源。

应用和讨论

CyBase包含一个MySQL数据库,其中包含有关氨基酸和核酸序列、环状蛋白质结构和活性的信息库。数据库的布局如所示图1数据库的核心是蛋白质表,该表包含关于表征的每个环状蛋白质的信息。与每个蛋白质表条目相关的是包含核酸序列、结构、活性和文献参考信息的表。基于web的界面提供了对信息的访问,允许对所有数据字段进行基于文本的搜索,并按类、源、活动或其他属性筛选结果。为了说明序列的循环性质,任何序列搜索都使用序列线性表示的两个副本的串联来模拟循环蛋白质。每个蛋白质都有一个动态生成的序列卡,它提供与数据库中包含的活性、核酸序列和结构信息的交联。由于该数据库旨在补充现有的生物数据库,因此每个条目都可以链接到UniProt知识库、Genbank和PDB,并链接到KNOTTIN网站(23)已规划。还提供了许多其他工具,包括彩色比对和计算选定序列的氨基酸频率。

保存图片、插图等的外部文件。对象名为gkj005f1.jpg

CyBase底层关系数据库的示意图。

一般来说,天然存在的环状蛋白质很小,其中最大的含有78个氨基酸。这种小尺寸使得质谱法(用于获取序列信息)和核磁共振(NMR)(用于确定3D结构)相结合成为表征这些蛋白质的理想方法。因此,为了便于新发现蛋白质的快速表征,可以查询摩尔质量数据库,对于环核苷酸,可以搜索与特定半胱氨酸环之间相对应的片段质量,利用半胱氨酸残基的还原/烷基化和串联质谱法促进序列测定(24,25).

NMR衍生数据的分析,如化学位移和NOE连接模式,可以提供蛋白质结构的早期指示。为了促进新发现的环状蛋白质的快速结构表征,数据库中包括NMR衍生结构的化学位移和抑制数据以及二面角信息。根据这些数据,计算包含定义的二级结构的距离和区域,并将其存储在数据库中。这些数据可以直观地呈现,用于分析短程和远程NOE模式、主干二面角和化学位移模式。虽然核磁共振是分析这些蛋白质最常用的技术,但X射线结构也被纳入数据库和为比较目的计算的原子间距离集。如同蛋白质和核酸条目一样,每个结构都有一张信息卡,其中包含与蛋白质和核酸条目的交联。

数据库的更新通过一系列PERL和PHP脚本来实现。这些功能可使用BLAST自动搜索序列数据库,以提供新的环状蛋白质示例,并通过防止序列数据重复和已表征序列的重命名来确保质量控制,这是环肽家族的一个特别重要的考虑因素,它可能包含许多不同物种中可能出现的序列。这些脚本还提供了新的cyclotide结构中的残基编号的标准化。尽管进行了这些自动化操作,但新条目的添加是手动执行的,以确保数据库条目的最高质量。

我们计划通过利用日益增多的旋回结构来扩展数据库,以基于一级序列提供旋回二级结构的预测,并开发基于所选原子间距离和NOE连通性之间的相似性在数据库中搜索结构的方法。我们还计划通过包括氢键和其他结构信息以及尚未进行结构表征的环核苷酸序列的同源模型来改进数据库的信息内容。CyBase位于http://research.imb.uq.edu.au/cybase/鉴于人们对主链环化的兴趣越来越大,希望CyBase将被证明是结构生物学领域的有用资源。建议应提交给华盛顿特区。

致谢

CyBase的开发得到了澳大利亚研究委员会的资助。支付这篇文章的开放存取出版费用的资金由D.Craik提供。

利益冲突声明。未声明。

参考文献

1Trabi M.,Craik D.环状蛋白质:看不到尽头。生物化学趋势。科学。2002;27:132–138.[公共医学][谷歌学者]
2Kohli R.,Walsh C.天然产物生物合成中酰基链大环化的酶学。化学。Commun公司。(外倾角)2003;:297–307.[公共医学][谷歌学者]
三。周H。环、连接、环、连环烷、笼和拥挤:基于熵的蛋白质稳定策略。Acc.Chem.化学。物件。2004;37:123–130.[公共医学][谷歌学者]
4Felizmenio Quimio M.,Daly N.,Craik D.植物中的环状蛋白一种新型大环胰蛋白酶抑制剂的溶液结构罗汉果.生物学杂志。化学。2001;276:22875–22882.[公共医学][谷歌学者]
5Gran L.、Sandberg F.、Sletten K.Oldenlandia affinis(R&S)DC。非洲传统医药中使用的含有子宫活性肽的植物。J.乙烯利。2000;70:197–203.[公共医学][谷歌学者]
6Colgrave M.,Craik D.环肽卡拉塔B1的热、化学和酶稳定性:环胱氨酸结的重要性。生物化学。2004;43:5965–5975.[公共医学][谷歌学者]
7Luckett S.、Garcia R.、Barker J.、Konarev A.、Shewry P.、Clarke A.、Brady R.葵花籽中一种有效的环状蛋白酶抑制剂的高分辨率结构。分子生物学杂志。1999;290:525–533.[公共医学][谷歌学者]
8Korsinczky M.、Schirra H.、Rosengren K.、West J.、Condie B.、Otvos L.、Anderson M.、Craik D.通过1H NMR对来自葵花籽和无环永生化物的新型环状胰蛋白酶抑制剂SFTI-1的溶液结构进行研究。分子生物学杂志。2001;311:579–591.[公共医学][谷歌学者]
9Eisenbrandt R.、Kalkum M.、Lai E.、Lurz R.、Kado C.、Lanka E.IncP质粒的结合菌毛和Ti质粒T菌毛由环状亚基组成。生物学杂志。化学。1999;274:22548–22555.[公共医学][谷歌学者]
10Kawai Y.,Saito T.,Toba T.,Samant S.,Itoh T.从加塞乳杆菌拉丁美洲39。Biosci公司。生物技术。生物化学。1994;58:1218–1221.[公共医学][谷歌学者]
11Kemperman R.、Kuipers A.、Karsens H.、Nauta A.、Kuipers-O.、Kok J.两种新型梭状芽孢杆菌属细菌素循环素A和closticen 574的鉴定和表征。申请。环境。微生物。2003;69:1589–1597. [PMC免费文章][公共医学][谷歌学者]
12Maqueda M.、Galvez A.、Bueno M.、Sanchez-Barrena M.、Gonzalez C.、Albert A.、Rico M.和Valdivia E.肽AS-48:一类新型环状细菌素的原型。货币。蛋白质。佩普特。科学。2004;5:399–416.[公共医学][谷歌学者]
13.Hernandez J.、Gagnon J.、Chiche L.、Nguyen T.、Andrieu J.、Heitz A.、Hong T.T.、Pham T.、Nugyen D.L.南瓜胰蛋白酶抑制剂罗汉果表现出非典型的大环结构。生物化学。2000;39:5722–5730.[公共医学][谷歌学者]
14Tang Y.,Yuan J.,Osapay G.,Osa pay K.,Tran D.,Miller C.,Ouellette A.,Selsted M.通过结扎两个截短的θ-防御素在灵长类白细胞中产生的环状抗菌肽。科学。1999;286:498–502.[公共医学][谷歌学者]
15Craik D.,Daly N.,Bond T.,Waine C.植物环核苷酸:一个独特的环状和结蛋白家族,定义了环状胱氨酸结结构基序。分子生物学杂志。1999;294:1327–1336.[公共医学][谷歌学者]
16Jennings C.、West J.、Waine C.、Craik D.、Anderson M.植物环核苷酸的生物合成和杀虫特性:来自仿射奥尔登兰虫.程序。美国国家科学院。科学。美国。2001;98:10614–10619. [PMC免费文章][公共医学][谷歌学者]
17Goransson U.,Svangard E.,Claeson P.,Bohlin L.分离和表征环核苷酸的新策略:在堇菜科中发现具有生物活性的大环植物多肽。货币。蛋白质肽。科学。2004;5:317–329.[公共医学][谷歌学者]
18Craik D.、Daly N.、Mulvenna J.、Plan M.、Trabi M.环核苷酸的发现、结构和生物活性。货币。蛋白质肽。科学。2004;5:297–315.[公共医学][谷歌学者]
19Gustafson K.、McKee T.、Bokesch H.抗-HIV环核苷酸。货币。蛋白质肽。科学。2004;5:331–340.[公共医学][谷歌学者]
20Daly N.,Craik D.天然环状蛋白质的非环状渗透体。大环多肽卡拉塔B1中胱氨酸结和β-片形成的特征。生物学杂志。化学。2000;275:19068–19075.[公共医学][谷歌学者]
21Deechongkit S.,Kelly J.主链环化对β-片展开热力学的影响:PIN WW域的稳定性优化。美国化学杂志。Soc公司。2002;124:4980–4986.[公共医学][谷歌学者]
22Williams N.、Prosselkov P.、Liepinsh E.、Line I.、Sharipo A.、Littler D.、Curmi P.、Otting G.、Dixon N。体内循环置换促进蛋白质环化聚胞藻属.PCC6803 DnaB微型钢。生物学杂志。化学。2002;277:7790–7798.[公共医学][谷歌学者]
23Gelly J.、Gracy J.、Kaas Q.、Le-Nguyen D.、Heitz A.、Chiche L.KNOTTIN网站和数据库:一个专门用于打结脚手架的新信息系统。核酸研究。2004;32:D156–D159。 [PMC免费文章][公共医学][谷歌学者]
24.Goransson U.,Craik D.卡拉塔B1环核苷酸的二硫化物绘图。囊性胱氨酸结基序的化学证据。生物学杂志。化学。2003;278:48188–48196.[公共医学][谷歌学者]
25.Mulvenna J.、Sando L.、Craik D.加工22kDa前体蛋白以产生环状蛋白三环a。结构。2005;13:691–701.[公共医学][谷歌学者]

文章来自核酸研究由以下人员提供牛津大学出版社