跳到主要内容
访问密钥 NCBI主页 MyNCBI主页 主要内容 主导航
核酸研究。2008年1月;36(数据库问题):D240–D244。
2007年10月25日在线发布。 数字对象标识:10.1093/nar/gkm772
预防性维修识别码:PMC2238828型
PMID:17962309

磷化氢。ELM:磷酸化位点数据库——2008年更新

摘要

磷化氢。ELM是一个人工策划的真核细胞磷酸化位点数据库。该资源包括从已发表文献以及高通量数据集收集的数据。

磷化氢的当前释放。ELM(7.0版,2007年7月)包含4078个磷酸蛋白序列,涵盖12025个磷酸-胺、2362个磷酸-三氢嘌呤和2083个磷酸-酪氨酸位点。这些条目提供了有关磷酸化蛋白和已知磷酸化实例的确切位置、负责修饰的激酶(如果已知)以及参考文献链接的信息。数据库条目具有超链接,可以轻松访问UniProt、PubMed、SMART、ELM、MSD的更多信息,以及与蛋白质相互作用数据库MINT和STRING的链接。

一种新的BLAST搜索工具是对通过关键字和UniProt登录号进行检索的补充,它允许用户提交一个蛋白质查询(通过序列或UniProt登录),以针对磷酸化肽的精选数据集进行搜索。

磷化氢。ELM在线提供:http://phospho.elm.eu.org

简介

蛋白质磷酸化是研究最多的翻译后修饰之一:据估计,多达三分之一的蛋白质可能被蛋白激酶修饰(1). 这种普遍存在的调节机制控制着许多生物过程,包括细胞生长、分化和DNA修复(2).

了解蛋白质中的磷酸化残基对于理解蛋白质参与的各种信号事件至关重要;因此,人们投入了大量的精力来识别和表征磷酸化位点。传统的蛋白质磷酸化测定方法,如磷酸肽的突变分析和Edman降解化学,存在耗时费力、需要大量纯化蛋白质的缺点。另一方面,基于质谱的方法由于具有更高的灵敏度、选择性和速度,已成为分析翻译后修饰的强大工具。在过去几年中,MS与磷酸化蛋白质的富集策略相结合,例如同位素编码亲和标签(ICAT)()细胞培养中的稳定同位素氨基酸(SILAC)(4)和等压试剂iTRAQ(5)已越来越多地用于识别新的磷酸化位点。磷酸化研究中这种变化的一个后果是,生物信息学资源需要进行调整和扩展,以适应新的数据。

对于由磷酸蛋白质组MS鉴定的数千个磷酸化位点,关于激酶磷酸化它们的信息,以及它们作用的途径,仍然缺失。为了改善实验确定的磷酸化位点和蛋白激酶之间的联系,Linding和合作者(6)最近使用了磷化氢。用于开发和训练方法的ELM数据集,NetworKIN(网址:http://networkin.info/)它将预测哪组激酶可能磷酸化给定位点的计算方法与信号通路和蛋白质相互作用数据的信息相结合。

MS对蛋白质磷酸化的分析将明确证明是理解细胞信号的宝贵信息来源。因此,我们认为创建和维护公开可用的磷酸化蛋白数据库越来越重要,其中已知磷酸化位点的数量呈指数级增长(7–12)研究社区可以很容易地访问。

材料和方法

磷化氢。ELM数据库

磷化氢的内容和格式。ELM在Diela中已有描述等。(13). 虽然数据库的一般格式基本上保持不变,但已进行了一些添加,以改进数据检索和表示。更新版本还包含大量的磷酸化位点(参见图1),一个基于序列比较和Web服务界面的新搜索工具。

保存图片、插图等的外部文件。对象名称为gkm772f1.jpg

图中显示了磷化氢的生长。2003年12月从1.0版开始的ELM数据集(面板A)。5.0版中磷酸化实例的指数增长主要是由于合并了高通量数据集。还显示了从低吞吐量(LTP)和高吞吐量(HTP)实验导出的实例的重叠(面板B)。

用户可以通过蛋白质名称、UniProt登录号/标识符、激酶名称或结合基序查询数据库,以获得特定蛋白质中所有已知磷酸化位点(实例)的列表。主结果页面总结了有关底物蛋白质的信息(例如,蛋白质的简要描述、蛋白质类型、UniProt蛋白质识别号)、其中包含的磷酸化位点及其周围氨基酸(+/−10)。每个实例的注释包括(如果可用)PubMed引用、磷酸化给定位点的激酶、磷酸化肽结合域和到ELM服务器的链接(14)检索有关激酶的更多信息。在可能的情况下,还提供了到含有磷酸化残基的蛋白质结构的超链接(15). 最近,Zanzoni和合作者(16)已经开发了磷酸化位点三维结构数据库Phospho3D,该数据库存储了来自磷酸化位点的数据。ELM数据库,重点是在残留物级别注释结构信息。

每个蛋白激酶底物的附加信息包括亚细胞隔室[用基因本体术语注释(17)]来自MINT的组织分布和交互伙伴列表(18)和STRING数据库(19). STRING交互器显示在弹出窗口中打开的摘要图形(网络)中。网络视图提供到STRING数据库的链接,其中详细描述了与交互器相关的信息。

数据集

磷化氢的当前释放。ELM数据集(7.0版,2007年7月)包含4078个磷酸蛋白序列,涵盖12 025个磷酸-氨基酸、2362个磷酸-三氢嘌呤和2083个磷酸-酪氨酸位点,共有16 470个位点。数据集目前仅限于后生动物物种。这部分是由于我们的注释能力,部分是因为激酶和命名法在其他谱系中如此不同,所以应该将它们放置在单独的数据库中。尽管没有任何动物物种被故意排除在数据之外,但目前人类(11 197个磷酸盐)和小鼠(2073个磷酸盐)是最具代表性的物种,因为它们在生物研究中普遍用作模型生物,例如,磷蛋白组学MS分析主要在人/小鼠细胞系/组织上进行。

对于每种磷酸化体,我们报告了磷酸化证据是否已通过小规模分析(低通量;LTP)或主要应用MS技术的大规模实验(高通量;HTP)确定,这些小规模分析通常一次只关注一个或几个蛋白质。值得注意的是,在我们的数据集中,LTP和HTP实验确定的实例之间有一点重叠(图1). 这意味着大部分人类磷酸蛋白质组还有待发现。图1还表明,蛋白质上额外磷酸化位点的识别速度比新磷酸化蛋白质的识别速度快得多(例如,参见srmm2蛋白质,UniProt登录问题9UQ35). 虽然揭示了比先前已知的更多的蛋白质被严重磷酸化,但值得调查的是,这些数据是否也意味着MS实验中检索到的蛋白质存在强烈的偏差。

负责磷酸化的激酶已知约21%的磷酸。ELM实例。目前,数据库中注释了250多种激酶(有关激酶的详细列表,请参阅Phospho.ELM主页上的相关信息)。

PhosphoBLAST搜索工具

已实施BLAST搜索,它是对通过关键字或UniProt登录/标识符检索的补充。该工具识别查询序列中包含的与phospho中存储的磷酸肽相匹配的磷酸肽。ELM公司(图2). 它包括两个步骤:BLAST(20)搜索和BLAST输出的解析。BLAST程序针对磷化氢执行序列相似性搜索。肽的ELM数据集(16 471),已通过实验证明其含有磷残基。它返回查询序列肽和磷酸肽之间的一组局部间隙对齐。在解析阶段,选择那些序列相似度超过70%并且将磷酸残基保留在与相应磷酸肽相同位置的匹配。最后的输出显示了所选匹配项的列表,以及它们与数据库记录的对齐和链接。

保存图片、插图等的外部文件。对象名为gkm772f2.jpg

使用作为查询的PhosphoBLAST搜索的输出示例达尼奥雷里奥极光A激酶序列。摘要图显示了查询序列的phospho-hits和SMART的功能。有关匹配项的详细信息显示在下面的结果表中。单击“主题名”,用户可以检索有关匹配磷化氢的其他信息。ELM磷酸化位点,包括侧翼序列、PubMed参考、负责磷酸化的激酶(如已知)以及与底物和其他相关数据库的附加信息的链接。

PhosphoBLAST工具的目的不是预测查询蛋白中的磷酸化基序,它主要用于检索相关蛋白(无论是同源还是副同源)中保守的磷酸化位点。然而,不相关的查询蛋白偶尔会在磷蛋白中产生匹配的磷酸化位点。同样有趣的ELM:用户将仔细考虑与这些匹配相关的可能的生物学意义(例如共享激酶和/或磷酸肽结合结构域特异性)。

Web服务

为了便于远程工具集成,使用Web服务访问phospho。ELM数据库已以编程方式实现,可从以下网址获得:http://phospho.elm.eu.org/webservice/phosphoELMdb.wsdl.

WSDL(Web服务描述语言)(21)文件与WS-I兼容。WS-Interoperability基本配置文件(22)提出了一组规则来实现不同平台之间web服务的互操作性。WSDL文件实现了XML包装的文档/文字样式(23). 后端代码是用Java实现的,并在Axis2上运行(24)在Tomcat servlet容器内(25).

Web服务提供的功能包括当前的界面功能和一些附加的过滤器。Web服务中实现的额外选项是按PubMed ID搜索,并检索分配了PDB条目的所有实例。

数据库访问

磷化氢。ELM是用开源软件开发和部署的(26). 软件是用Python开发的,包括来自BioPythons项目的一些模块(27)从UniProt和PubMed检索信息。web界面软件使用CGI模型框架(28).

该数据集可供学术用户公开使用。磷化氢。ELM可以在Apache2支持的公共网站上访问:http://phospho.elm.eu.org.

总结

自2004年成立以来。ELM数据集已用于许多生物信息学工具和管道,例如蛋白激酶特异性预测服务器GPS(基于组的磷酸化评分方法)(29)RLIMS-P是一个基于规则的文本挖掘程序,旨在从摘要中提取磷酸化位点的信息(30),PhosphoregDB,哺乳动物蛋白激酶和磷酸酶组织和亚细胞分布数据库(31)和NetworKin,一种结合一致序列基序和上下文数据预测哪些激酶磷酸化实验确定的磷酸化位点的计算方法(6).

同时预计磷化氢的大小。ELM数据集将不断增长,我们认为就要合并的数据类别而言,资源应该保持相对精简。另一方面,与外部资源的联系正在定期审查中,可能会不时增加。例如,KEGG等资源(32)和Reactome(33)注释细胞信号网络正在增加其路径覆盖范围,提供与此类资源的链接显然将变得至关重要。在不久的将来,我们打算装备磷化氢。ELM与来自NetworKIN数据库的预测激酶-底物关系的链接(R.Linding,等。,已提交以供发布)。

致谢

我们想感谢所有的磷化氢。ELM用户通过报告丢失的站点或向我们发送他们的数据集,为改进数据库做出了贡献。我们感谢欧盟EMBRACE拨款(LHSG-CT-2004-512092)的资助。非常感谢Ivica Letunic和Arnaud Ceol的技术支持。我们感谢拉尔斯·朱尔·延森(Lars Juhl-Jensen)和鲁恩·林丁(Rune Linding)提出的富有洞察力的意见和建议。我们感谢尼尔·哈斯拉姆对手稿的批判性阅读。EMBL提供资金支付本文的开放存取出版费用。

利益冲突声明。未声明。

参考文献

1Johnson SA,Hunter T.Kinomics:解读激肽组的方法。自然方法。2005;2:17–25.[公共医学][谷歌学者]
2Hunter T.Signaling–2000年及以后。单元格。2000;100:113–127.[公共医学][谷歌学者]
三。Gygi SP、Rist B、Gerber SA、Turecek F、Gelb MH、Aebersold R。使用同位素编码亲和标记对复杂蛋白质混合物进行定量分析。自然生物技术。1999;17:994–999.[公共医学][谷歌学者]
4Ong SE,Blagoev B,Kratchmarova I,Kristensen DB,Steen H,Pandey A,Mann M.细胞培养中氨基酸的稳定同位素标记,SILAC,作为一种简单而准确的表达蛋白质组学方法。分子细胞蛋白质组学。2002;1:376–386.[公共医学][谷歌学者]
5Ross PL、Huang YN、Marchese JN、Williamson B、Parker K、Hattan S、Khainovski N、Pillai S、Dey S等。使用胺反应等压标记试剂对酿酒酵母中的多重蛋白质进行定量。分子细胞蛋白质组学。2004;:1154–1169.[公共医学][谷歌学者]
6Linding R、Jensen LJ、Otheimer GJ、van Vugt MA、Jorgensen C、Miron IM、Diela F、Colwill K、Taylor L等。体内磷酸化网络的系统发现。单元格。2007;129:1415–1426. [PMC免费文章][公共医学][谷歌学者]
7Beausoleil SA、Jedrychowski M、Schwartz D、Elias JE、Villen J、Li J、Cohn MA、Cantley LC、Gygi SP。HeLa细胞核磷蛋白的大规模表征。程序。美国国家科学院。科学。美国。2004;101:12130–12135. [PMC免费文章][公共医学][谷歌学者]
8Brill LM、Salomon AR、Ficarro SB、Mukherji M、Stettler-Gill M、Peters EC。使用固定化金属亲和色谱法和串联质谱法对人类T细胞酪氨酸磷酸化位点进行稳健的磷酸蛋白质组分析。分析。化学。2004;76:2763–2772.[公共医学][谷歌学者]
9Nousiainen M,Sillje HH,Sauer G,Nigg EA,Korner R.人类有丝分裂纺锤体磷蛋白组分析。程序。美国国家科学院。科学。美国。2006;103:5391–5396. [PMC免费文章][公共医学][谷歌学者]
10Olsen JV、Blagoev B、Gnad F、Macek B、Kumar C、Mortensen P、Mann M.Global、体内和信号网络中的位点特异性磷酸化动力学。单元格。2006;127:635–648.[公共医学][谷歌学者]
11Rush J,Moritz A,Lee KA,Guo A,Goss VL,Spek EJ,Zhang H,Zha XM,Polakiewicz RD,et al.癌细胞酪氨酸磷酸化的免疫亲和性分析。自然生物技术。2005;23:94–101.[公共医学][谷歌学者]
12Villen J、Beausoleil SA、Gerber SA、Gygi SP。小鼠肝脏的大规模磷酸化分析。程序。美国国家科学院。科学。美国。2007;104:1488–1493. [PMC免费文章][公共医学][谷歌学者]
13Diela F、Cameron S、Gemund C、Linding R、Via A、Kuster B、Sicheritz-Ponten T、Blom N、Gibson TJ、Phospho。ELM:实验验证的真核蛋白质磷酸化位点数据库。BMC生物信息学。2004;5:79。 [PMC免费文章][公共医学][谷歌学者]
14Puntervoll P、Linding R、Gemund C、Chabani-Davidson S、Mattingsdal M、Cameron S、Martin DM、Ausiello G、Brannetti B等。ELM服务器:研究模块化真核蛋白中短功能位点的新资源。核酸研究。2003;31:3625–3630. [PMC免费文章][公共医学][谷歌学者]
15Boutselakis H、Dimitropoulos D、Fillon J、Golovin A、Henrick K、Hussain A、Ionides J、John M、Keller PA、Krissinel E等。E-MSD:欧洲生物信息研究所大分子结构数据库。核酸研究。2003;31:458–462. [PMC免费文章][公共医学][谷歌学者]
16Zanzoni A、Ausiello G、Via A、Gheradini PF、Helmer-Citterich M.Phospho3D:蛋白质磷酸化位点三维结构数据库。核酸研究。2007;35:D229–D231。 [PMC免费文章][公共医学][谷歌学者]
17Harris MA、Clark J、Ireland A、Lomax J、Ashburner M、Foulger R、Eilbeck K、Lewis S、Marshall B等。基因本体(GO)数据库和信息资源。核酸研究。2004;32:D258–D261。 [PMC免费文章][公共医学][谷歌学者]
18Chatr-aryamontri A、Ceol A、Palazzi LM、Nardelli G、Schneider MV、Castagnoli L、Cesareni G.MINT:分子内切酶数据库。核酸研究。2007;35:D572–D574。 [PMC免费文章][公共医学][谷歌学者]
19von Mering C、Jensen LJ、Kuhn M、Chaffron S、Doerks T、Kruger B、Snel B、Bork P.STRING 7–蛋白质相互作用整合和预测的最新进展。核酸研究。2007;35:D358–D362。 [PMC免费文章][公共医学][谷歌学者]
20Karlin S,Altschul旧金山。使用通用评分方案评估分子序列特征统计显著性的方法。程序。美国国家科学院。科学。美国。1990;87:2264–2268. [PMC免费文章][公共医学][谷歌学者]
21Web服务描述语言。http://www.w3.org/TR/wsdl(2007年8月30日,上次访问日期)。
22Web Services互操作性基本配置文件1.0版。http://www.ws-i.org/Profiles/BasicProfile-1.0-2004-04-16.html(2007年8月30日,上次访问日期)。
23文档/文字包装样式。http://www-128.ibm.com/developerworks/webservices/library/ws-whichwsdl/(2007年8月30日,上次访问日期)。
24轴2。http://ws.apache.org/axis2(2007年8月30日,上次访问日期)。
25汤姆卡特。http://tomcat.apache.org/(2007年8月30日,上次访问日期)。
26PostgreSQL。网址:http://www.postgresql.org(2007年8月30日,上次访问日期)。
27生物巨蟒。http://BioPython.org(2007年8月30日,上次访问日期)。
28Ramu C,Gemund C,Gibson TJ。用Python对生物数据库进行面向对象的解析。生物信息学。2000;16:628–638。[公共医学][谷歌学者]
29周福凤,薛毅,陈国良,姚欣。GPS:一种新的基于群体的磷酸化预测和评分方法。生物化学。生物物理学。Res.Commun公司。2004;325:1443–1448.[公共医学][谷歌学者]
30Hu ZZ,Narayanaswamy M,Ravikumar KE,Vijay-Shanker K,Wu CH.使用基于规则的系统进行蛋白质磷酸化的文献挖掘和数据库注释。生物信息学。2005;21:2759–2765.[公共医学][谷歌学者]
31Forrest AR、Taylor DF、Fink JL、Gongora MM、Flegg C、Teasdale RD、Suzuki H、Kanamori M、Kai C等。磷数据库:哺乳动物蛋白激酶和磷酸酶的组织和亚细胞分布。BMC生物信息学。2006;7:82. [PMC免费文章][公共医学][谷歌学者]
32Kanehisa M、Goto S、Hattori M、Aoki-Kinoshita KF、Itoh M、Kawashima S、Katayama T、Araki M、Hirakawa M。从基因组学到化学基因组学:KEGG的新发展。核酸研究。2006;34:D354–D357。 [PMC免费文章][公共医学][谷歌学者]
33Vastrik I、D’Eustachio P、Schmidt E、Joshi Tope G、Gopinath G、Croft D、de Bono B、Gillespie M、Jassal B等。反应组:生物途径和过程的知识库。基因组生物学。2007;8:R39。 [PMC免费文章][公共医学][谷歌学者]

文章来自核酸研究由以下人员提供牛津大学出版社