测量蛋白质表达差异的能力已成为理解生物现象的关键(1,2). 由于成本、速度和可获得性,转录组分析经常被用作蛋白质组的替代物(三,4). 也就是说,mRNA是一种遗传中介体,不能为无数翻译后调控过程提供信息(5–7). 在过去十年中,人们在成熟的蛋白质组技术上投入了大量精力,以与转录组技术相当的速度和成本提供信息。
历史上,酵母具有6600个开放阅读框,一直是首选的蛋白质组技术试验台(8). 2003年,Weissmann及其同事使用GFP或TAP标签测量了每个酵母基因的近似表达水平(9). 这项开创性的工作确定了约4500个蛋白质在对数期酵母生长期间表达。随后的基于质谱的研究证实了这一早期估计(9–12). 根据这一知识,我们将综合蛋白质组分析定义为检测约90%的表达蛋白质组(酵母≥4000个蛋白质)的实验。注意,其他人为此使用了“几乎完成”一词;我们假设综合具有相同的含义(即包括许多、大多数或所有事物)(13).
利用多种分离和质谱技术,对酵母进行了基于质谱的蛋白质组学初步分析,每种分析可鉴定多达数百种蛋白质(14–16). Yates及其同事于2001年报告了第一次大规模酵母蛋白质组研究,在~68小时的质谱分析后鉴定出1483个蛋白质,即每分钟鉴定0.4个蛋白质(17). 他们的方法-二维色谱结合串联质谱-为过去十年的大规模蛋白质分析提供了模板(18–20). 通过将离线第一维度的分离与更广泛的分馏(80对15) 吉吉等。2003年扩大了这项工作(21). 也就是说,鉴定出的蛋白质(1504)的适度增加需要135小时的分析,将每分钟的蛋白质计数降至0.2。2006年,曼恩及其同事利用一种能够准确测量质量的快速混合质谱仪,在48小时内(0.7蛋白质/分钟)检测出2003种酵母蛋白质(22).
从这三项开创性的研究中,我们开始看到质谱仪采集速度对蛋白质组分析深度和速度的影响。然而,这项技术在酵母蛋白质组中的最新应用,曼恩的工作使用了一种混合线性离子阱离子回旋共振傅里叶变换仪器(LTQ-FT),该仪器可以传递MS2以~650 ms的速度扫描(23). 早期的研究,即Yates和Gygi依赖于相当慢的扫描速度(1–3s/扫描)三维离子阱技术。2008年,利用新型Orbitrap混合质谱仪,Mann及其同事首次对酵母蛋白质组进行了全面分析,鉴定了近4000种蛋白质(10). 广泛分馏(24)每一组分的三份分析使研究在~144个分析小时(0.5个蛋白质/分钟)时花费了大量时间。2010年,我们的团队使用分馏和多种蛋白酶实现了类似的综合分析,但提高了序列覆盖率(24). 然而,这项工作需要更长的分析时间(0.2蛋白质/min)。
这是三年前最先进的技术。毫无疑问,我们蛋白质组学界已经实现了一个重要的目标——全面覆盖酵母蛋白质组。尽管如此,获得这个深度并不是例行的,因为它需要数天的MS分析和大量的专家劳动。2012年,利用新的、更快的扫描速度、四极油轨道技术(Q-OT、Q-Exactive),Mann和同事提出了分馏概念,提高了样品制备质量,并强调了更高质量的在线分离(25). 通过他们的流线型方法,他们在四个小时的MS分析后检测到了略多于3900种酵母蛋白。更令人印象深刻的是,该策略转化为每分钟识别16.3个蛋白质,比下一个最佳综合研究提高了33倍。这一成功是一项了不起的成就,说明全面的蛋白质组技术确实可以以一种高效的方式执行。
当然,飞行时间混合系统可以提供非常高的MS2采集速率,在某些报告中高达100 Hz。2011年,Muddiman及其同事报告了使用四极杆-TOF系统进行酵母蛋白质组分析(即三重TOF)以低得多的速率(20 Hz)MS运行2扫描速率(26). 即使在这种降低的速度下,只有16%的光谱被映射到独特的序列,并鉴定出1112种独特的蛋白质。由于MS降低2光谱质量(即低信噪比(S/N),在高MS下实现的独特肽识别更少2收购率。其他使用TOF技术的研究报告了类似的结果(27,28). 对于最大的蛋白质组深度,我们得出结论,扫描速度的提高决不能以光谱质量的降低为代价。最近,介绍了一种新型Orbitrap混合质谱仪,该质谱仪具有一个质量过滤器、一个碰撞池、一个高场Orbitrat分析仪,以及一个双池线性离子阱分析仪(Q-OT-qIT,OrbitrapFusion)(29,30). 该系统提供高MS220赫兹的采集速度是曼恩及其同事使用的Q-OT系统的两倍。我们假设,这个新鲜的系统具有快速的扫描速度,可以在记录时间内提供全面的蛋白质组分析。为了最大限度地提高性能,我们开发了一种优化的细胞裂解方法,采用胰蛋白酶消化,并使用二甲基亚砜(DMSO,5%)作为LC添加剂,以增加酸性肽的丰度并统一电荷状态(31,32). 使用该新系统,我们报告了在1.3小时的nLC-MS后对酵母蛋白质组(4002和1%FDR)的综合分析2分析(70分钟梯度)。这些实验每分钟提供了非凡的67种蛋白质,并证明酵母蛋白质组的完整分析可以在大约一小时内完成。
讨论
上述数据提供了对酵母蛋白质组的深入了解。同样重要的是,这一深度是在前所未有的时间尺度内实现的。为了了解这些增益是如何实现的,我们绘制了每秒已识别肽序列的数量作为洗脱时间的函数(A类)用于Q-OT-qIT(红色)和上一代qIT-OT(黑色)杂交。值得注意的是,该图显示Q-OT-qIT杂交(Orbitrap Fusion)每秒常规识别约8个肽,在单个1s窗口中检测到多达19个肽序列。这些惊人的指标大约是qIT-OT(Orbitrap Elite)的两倍。此外,Q-OT-qIT的速度允许更深的MS2MS取样1Q-OT-qIT采样的平均前兆深度为349第个最丰富的米/z(z)MS中的峰值1扫描,而qIT-OT系统的平均深度仅为202(B类). Q-OT-qIT频繁采样米/z(z)强度等级为800或更低的峰值。
使用Q-OT-qIT(Fusion)与qIT-OT(Orbitrap Elite)和Q-OT杂种进行酵母蛋白质组分析的分析指标。Q-OT-qIT(面板A、,红色)实现了每秒多达19个肽的鉴定,相比之下,qIT OT系统实现了每秒多达10个肽的鉴定(A类,黑色)。由于MS速度更快,峰值深度也更高2Q-OT-qIT系统的扫描速度(B类).C类,绘制了三种仪器的独特酵母肽识别速度。在一小时的分析中,Q-OT-qIT发布的独特肽鉴定数量几乎是qIT-OT的两倍。除了独特的蛋白质外,类似的数据显示在天.
为了进一步研究Q-OT-qIT扫描速度的影响,我们绘制了独特肽序列识别的累积数量与保留时间的函数关系(C类,消除I/L歧义)。Q-OT-qIT(固体红)在70分钟梯度和洗涤期内以比qIT-OT(固体黑)-8.3快得多的速度积累独特的肽识别,几乎呈线性对每秒4.3个唯一序列(线性拟合在10到80分钟之间)。在同一系统上使用四小时梯度略微降低了斜率(每秒3.7个唯一序列,10到200分钟之间的线性拟合,红色点),但允许进行相当深入的分析,并再次超过了qIT OT系统(每秒2.3个唯一序列,黑色点)。作为参考,我们绘制了2012年曼恩等。使用Q-OT杂交(Q-Exactive,点蓝色)进行研究。与Q-OT-qIT(Orbitrap Fusion)相比,该系统在相同的分析时间内发布最浅的斜率(每秒1.7个唯一序列)和大约一半的唯一肽序列。请注意,Mann在这项工作中使用了Lys-C摘要比较相同数据集的独特蛋白质识别率。同样,Q-OT-qIT系统是表现最好的,即使将一小时的分析(红色实线)与其他系统(黑色和蓝色虚线)上的四小时实验进行比较。
在这里,我们描述了新的质谱仪技术,该技术能够在前所未有的时间范围内实现酵母蛋白质组的全面覆盖。毫无疑问,在过去十年中,样品制备、色谱和MS硬件的许多改进都有助于实现这一目标。其中,我们认为质谱扫描速度的提高是蛋白质组分析速度和深度加快的主要原因。说明了几项大规模酵母蛋白质组分析的蛋白质鉴定速度,作为质谱仪MS的功能2扫描速率。注意蛋白质鉴定率的快速上升与MS的增加相关2扫描速率。
在过去十年中,选定的大规模酵母蛋白质组分析的蛋白质鉴定率与质谱扫描率的函数关系。每个数据点都标有年份、对应作者、所用MS系统类型和参考号。
中描述的相关性我们感到有些惊讶,因为我们预计,随着组成整个蛋白质组的复杂肽混合物在较短梯度上分离,低丰度肽的电离抑制将变得越来越重要-即从四个小时到一个小时(46,47). 换句话说,随着在线色谱的分离时间缩短,必须增加共洗脱。随着共同洗脱的增加,人们可能会预计,无论MS的速度或灵敏度如何,电离抑制都会阻止相当一部分肽变成气相离子,这是MS检测的必要条件。此处显示的结果驳斥了这一假设,并证实MS灵敏度和速度的进一步提高将继续缩短整个蛋白质组分析时间,对于相对简单的蛋白质组,如酵母,最有可能不到一小时。
最后,我们得出结论,在几个小时内对哺乳动物蛋白质组进行全面分析现在已经在我们的技术范围内。考虑到最近的估计表明,在任何给定的时间,在培养的人类细胞中都会表达10000到12000个蛋白质(48–50). 这大约是酵母蛋白质组复杂性的三到四倍。因此,我们目前的努力旨在在短短几个小时的分析内实现对哺乳动物系统的全面覆盖。展望未来,MS再翻一番2收购率,即从20到40赫兹,有潜力在一到两小时内检测整个人类蛋白质组。而且,考虑到MS创新的历史和速度,这种能力可能只有几年的时间了。