泛素和泛素样修饰物(Ubls)的翻译后修饰1如SUMO在大多数(如果不是全部的话)细胞过程中发挥着重要作用(1–6). Ubls与其靶点的结合涉及修饰剂的羧基和靶点内赖氨酸残基的ε-氨基之间的异肽键。Ubls与特定靶点的连接涉及酶级联反应。首先对Ubls进行处理,以暴露其C末端二甘氨酸基序。然后,成熟的Ubl通过E1(激活)、E2(结合)和E3(连接酶)酶级联转移到目标。SUMO的结合系统由一种异二聚体激活酶Aos1/Uba2组成;一种结合酶,Ubc9;和E3连接酶,如RanBP2或PIAS家族成员。结合状态会发生永久性变化,并由一小类SUMO蛋白酶控制,这些蛋白酶水解SUMO与其靶点之间的异肽键(7,8). 尽管在低等真核生物中只存在一种SUMO,但脊椎动物表达至少三种不同的SUMO旁系:SUMO1、SUMO2和SUMO3。成熟的SUMO2和SUMO3(称为SUMO2/3)具有97%的相同性,但与SUMO1有很大的不同(~50%的相同性)。
尽管已知SUMO底物的列表正在迅速增长,但我们对其中许多目标的功能后果的理解却滞后。在分子水平上,SUMO共轭的功能后果可以用与其他大分子相互作用的增加或减少来解释(三,4). 还描述了SUMO依赖的分子内构象变化(9,10). 因此,为了了解SUMO在特定底物调控中的作用,识别SUMO结合的受体位点至关重要。
到目前为止,SUMO受体位点的鉴定在很大程度上依赖于SUMO共有位点的突变,该共有位点由序列ψK的短基序组成X(X)E(ψ代表大量疏水残留物,以及X(X)代表任何氨基酸)。如果以扩展构象呈现,则Ubc9可识别该基序(11–13). 然而,越来越多的蛋白质,如PCNA、E2-25K、Daxx和USP25,被证明在不符合SUMO共识位点的赖氨酸残基上进行了酰化(14–17). 对于这类蛋白质以及包含大量SUMO共有位点的蛋白质,识别受体赖氨酸是一项繁重的任务,经常涉及到依次突变底物中的每个赖氨酸残基。
MS是目前最先进的技术之一,可以以无偏见和敏感的方式识别蛋白质因子及其翻译后修饰。一些研究小组表明,使用过表达标记的SUMO,MS可以有效地用于识别SUMO结合的内源性底物(18–20). 然而,使用质谱鉴定SUMO受体赖氨酸仍然是一项更具挑战性的任务(18,21,23,24). 到目前为止,使用标记的SUMO,仅在酿酒酵母(18). 胰蛋白酶消化后产生的大的结合SUMO肽阻碍了高等真核生物底物的鉴定(人类SUMO1大于2154 Da,人类SUMO2/3大于3568 Da,而Smt3大于484 Da)酿酒酵母). 除了共轭肽的质量外,这种大片段还会阻碍其在MS中的凝胶内消化、提取、检测和测序。为了克服其中的一些局限性,已经开发了几种不同的策略:1)突变SUMO的胰蛋白酶片段,产生较小的胰蛋白酶碎片(23),2)开发自动识别模式工具(SUMmOn)(24)以及3)使用在体外到体内方法(21). 尽管这些方法已成功应用于识别SUMO共轭物在体外和体内,无偏识别SUMO共轭体内在高等真核生物中尚未实现。鉴定SUMO结合物的另一个障碍是,理论上,由于胰蛋白酶误切,在给定蛋白质中仅一个SUMO连接赖氨酸就可能产生各种质量。因此,SUMO受体位点的明确鉴定需要高精度地测量携带缀合SUMO(片段)的修饰肽的质量,并且最重要的是,需要对修饰肽进行序列分析。因为现有的蛋白质组学搜索引擎不可能搜索MSMS谱以进行更大的修改,例如我们开发了一种新颖、简单、直观的数据库搜索工具(“ChopNSpice”),与当前的蛋白质组学搜索引擎(如MASCOT)相结合(25)或SEQUEST(26)),允许人们明确地识别SUMO1和SUMO2/3受体位点。我们确认了这一战略在体外并通过鉴定HeLa细胞几个内源性靶点内的受体赖氨酸来证明该技术的威力。
讨论
在这项研究中,我们提出了一种免费可用的计算方法,通过质谱来识别翻译后修饰,而使用常见搜索引擎(如SEQUEST和/或MASCOT)无法轻松探索这些修饰。我们证明,我们的方法在基于MS的分析和随后的数据库搜索中具有价值,可用于识别已被酰化的蛋白质中的SUMO结合位点在体外或体内.
特别是,哺乳动物sumoylated蛋白和肽在基于MS的检测中面临挑战。与酵母相比(酿酒酵母)其中,在对sumoylated蛋白质进行消化后,只有一个EQIGG肽(484 Da)与其相应的SUMO受体结合,哺乳动物SUMO1(2154 Da)和SUMO2/3(3568 Da)的大胰蛋白酶片段在MS中不容易识别。这些困难部分是由于长肽结合物的存在,类似于交联肽(但不含交联剂)。因此,MS和MSMS导致碎片离子光谱过于复杂,无法手动解释。为了避免这些问题,人们提出了一种突变方法,以产生较小的SUMO胰蛋白酶片段,从而简化了质谱法对SUMO受体位点的鉴定(23,42). 虽然该方法已被证明能有效地从sumoylated蛋白中识别SUMO受体位点在体外,定制的SUMO蛋白的偶联/解偶联效率可能较低体内另一种用于识别SUMO受体位点的基于MS的方法是一种软件工具(SUMmOn),该软件工具设计用于解释复杂的碎片离子模式,该模式允许人们使用低精度质谱仪(24). 同样在本研究中,相对简单在体外研究了共轭混合物,而来自体内实验预计会给SUMO受体位点的明确识别带来问题。我们还使用SUMmOn模式识别软件来识别SUMO受体位点在体外和体内事实上,与ChopNSpice相比,使用SUMmOn对我们的原始数据进行分析,并结合基于MASCOT的数据库搜索(请参阅补充表S5). 此外,还有另一个软件工具(Ubl finder)可用,但它的缺点是只能搜索泛素和SUMO(T95R)突变体(23). 通过使用高精度和高分辨率的MS技术,Matic等。使用了在体外到体内方法(21).体外在Orbitrap质谱仪中分析了SUMO-化蛋白的SUMO受体位点,随后得到了证实体内.
我们采用了不同的方法,将高端MS与常用的数据库搜索相结合,并进行了轻微修改。检测翻译后修饰的前提条件就其本身而言质谱是对肽内修饰位点的明确鉴定。这反过来需要使用搜索引擎对MSMS序列进行分析,并随后进行数据库搜索,以比较米/z(z)实验数据值(即。MSMS碎片光谱)米/z(z)生成的值生物信息学通过这种方式,还可以通过添加到数据库中所有相应氨基酸的额外修饰量来识别附加到任何氨基酸的(翻译后)修饰。以类似的方式,胰蛋白酶消化后的假定泛素化位点(GG二氨基酸与其受体位点结合)可以通过可用的搜索引擎进行识别。尽管如此,如果只考虑修改的确切质量,即使是高度准确的MS分析也可能导致假阳性识别。例如,最近有报道称碘乙酰胺诱导的伪影模拟了质谱中的泛素化(22). 因此,不仅要从底物肽中获得序列信息,还要从修饰物中获得序列数据,这一点至关重要,尤其是在处理较长的共轭物时。然而,尽管搜索引擎能够获取实验参数(例如考虑到使用的蛋白酶和修饰),它们仅依赖包含假定蛋白质序列的数据库进行识别,在修饰的情况下,还依赖添加到特定氨基酸的额外质量。使用MS的蛋白质组学研究人员通常使用MASCOT和/或SEQUEST等搜索引擎,这些搜索引擎的输出格式(包括其评分系统)在社区中被广泛接受。为此,我们开发了一个软件工具,利用这些搜索引擎,将新的修改后的蛋白质序列(sumoylated sequences)添加到标准数据库中,然后标准MS搜索引擎可以与之进行比较,并免费提供新工具。
识别SUMO受体位点的程序ChopNSpice具有独特的能力,允许用户(i)以线性方式组合两个蛋白质序列,(ii)生成任何修改的线性蛋白质序列,该序列在新融合序列的N末端包含任何修改,(iii)在两个蛋白质序列中的任一序列中引入定义的额外质量,以便在胰蛋白酶消化交联蛋白质后也可以搜索和识别肽-肽交联(使用交联试剂),以及(iv)生成一个米/z(z)所有线性融合肽的列表。当用户无法访问例如Orbitrap质谱仪,但希望通过MALDI MS使用简单的肽质量指纹图谱分析推测的酰化蛋白质。此外,该列表在LC-MSMS分析中用作包含列表,以便预测修改(例如选择磺酰化肽在质谱仪内进行裂解。
结合蛋白质-蛋白质交联质谱数据的分析,讨论了产生串联肽(蛋白质)的类似策略(33),但到目前为止,还没有公开的软件可用于生成所需的FASTA库文件,并且Maiolica等。(33)没有描述用户应该如何生成包含串联肽的专用数据库。在这种背景下,我们的方法首次为广泛的社区提供了生成每种类型的FASTA序列的可能性,包括各种修改,如果需要,可以在高通量方法中使用通用搜索引擎进行数据库搜索。对于后者,整个数据库(例如Swiss-Prot human)可以使用ChopNSpice进行修改以生成例如每个条目中的sumoylated蛋白质。除此功能外,许多修改过的数据库(例如sumoylated Swiss-Prot human)可通过ChopNSpice网站获得,以增加便利性。
我们进一步表明,MSMS片段光谱(值)的数据库搜索,包括修改的线性序列,具有高度的特异性。重要的是,当修饰序列颠倒并连接到胰蛋白酶肽的C末端时,没有获得MASCOT或SEQUEST的点击(数据未显示)。此外,对ChopNSpice用SUMO1和SUMO2/3修饰所有蛋白质的人类Swiss-Prot数据库进行搜索时,对不同的sumoylated蛋白质的搜索结果与仅用ChopNSpice修饰感兴趣的蛋白质序列并提交给Swiss-Prod数据库的搜索结果相同(数据未显示)。由于我们的目标是通过这种方法达到广泛的蛋白质组学社区,我们在诱饵数据库搜索中确定了假阳性率,发现它≤0.33%(参见补充表S6)从而证明我们的方法可以应用于鸟枪蛋白质组学项目。重要的是,由于应用了蛋白质组学工作流程,假阳性率仍然很低(见“结果”),尽管在某些情况下,我们主要观察到SUMO肽的产物离子,而较少观察到受体肽的产物阳离子(见补充数据S3).
总之,我们提出了一种通过质谱快速、灵敏地识别内源性蛋白质中SUMO受体位点的方法,并描述了其成功应用的示例。我们认为,这种方法具有广泛应用的潜力,主要是因为(i)提供了生成修改蛋白质序列(ChopNSpice)所需的软件,(ii)它使用已建立的搜索引擎进行蛋白质鉴定,以及(iii)它有助于在大型免疫沉淀研究和鸟枪法中识别修饰位点。重要的是,生成新的修改序列的思想不仅限于泛素修饰语或Ubls,而且可以应用于任何类型的(用户定义的)修改。