细胞通过各种信号机制对细胞外环境中的元素作出反应,这些信号机制可能是对环境线索、电刺激或化学信使作出反应而产生的。大多数信号是通过增加翻译后修饰(PTM)来改变预先存在的蛋白质来传播的1以改变其结构和活性。然后这些信号被传递和放大,直到它们最终在蛋白质表达中表现出来。越来越清楚的是,PTM的错误调节是疾病的主要基础,无论是在癌症中引起异常信号传导,还是在神经退行性疾病中引起细胞毒蛋白聚集。因此,研究蛋白质翻译后修饰对理解生物调控至关重要(1).
基于质谱的蛋白质组学彻底改变了蛋白质PTM的表征,因为它创建了第一个无偏见的策略来确定哪些蛋白质正在被修饰,用什么类型的修饰,以及在哪些特定残基上进行修饰。在使用的许多类型的PTM中,蛋白质磷酸化理所当然地受到了最大的关注(2,三). 然而,还有许多其他的监管修改,如丝氨酸和苏氨酸哦-GlcNA酰化(4)、赖氨酸或精氨酸甲基化(5)赖氨酸侧链的乙酰化(6)或赖氨酸泛素化(7)这些都是暂时的,需要研究和理解。细胞使用的许多其他PTM,无论是暂时的还是稳定的,都会影响蛋白质的活性。事实上,不同的PTM并不是相互独立运行的,因此只研究一种修饰类型就不可能去卷积它们对信号机制和细胞反应的贡献(8,9).
所有这些修饰的大规模分析都遵循类似的策略,在富集步骤(抗体亲和力、金属亲和力、凝集素亲和力)之后,对所得混合物进行串联质谱分析(10). 在这些研究中可能可靠地鉴定出数千种修饰肽,但确定这些肽中修饰位点的定位这一挑战尚未得到很好的解决。
MS/MS光谱通过在光谱中存在一个或多个明确指定离子类型的离子来实现修饰位点定位,这些离子来源于可进行修饰的肽中两个氨基酸之间的裂解。当这种离子不存在时,或者离子不能很容易地与噪声区分时,修饰就不能确定地定位于任一位置。当肽中只有一个氨基酸可以进行修饰时,在定位方面不会有歧义。说明了磷酸肽的两个光谱;一种是场地分配明确,另一种是没有证据区分两个潜在场地。
在MS/MS光谱中,通过存在一个或多个明确指定的离子类型的离子,可以实现位置修饰,这些离子来源于可进行修饰的肽中两个氨基酸之间的片段。
A类,y5和y6离子使磷酸盐定位于Ser-3而非Thr-5。B类,Ser-1和Ser-2之间没有碎裂阻止了磷酸盐的定位,然而y13++离子表明没有定位到Ser-3。在肽序列中,红色正斜杠表示观察到y离子,蓝色反斜杠表示观察到b离子,品红色竖条表示观察到b和y离子。
上述规则使得站点定位可靠性的评估看起来很简单,实际上对于某些光谱来说也是如此,但通过确定什么是真正的峰值,什么是噪声,这可能会变得复杂;峰值是否暗示改造地点(例如峰值可能对应于改良碎片的磷酸盐损失或未改良碎片的水分损失:前者更常见),应给予任何权重;以及决定肽中的哪些残基应被视为具有给定修饰的潜在残基;例如对于甲基化,是否也考虑了可能导致相同质量变化的氨基酸替代。
对于肽鉴定,通常确定结果的可靠性的两个统计指标。第一种是对单个肽鉴定的可靠性的测量,通常是对偶然获得给定匹配质量的可能性的测量;即这个数字(概率或期望值)越小,识别越可靠。第二个可靠性度量是错误发现率(FDR),它位于数据集级别,估计报告的错误结果总数。FDR通常由目标-诱饵数据库搜索策略计算,其中假设与正常数据库和诱饵数据库的匹配频率相同(11). 不幸的是,没有等效的可靠性度量;即错误定位率(FLR)可以很容易地计算出修改位置的定位结果,尽管已经采用了估算方法,并在后面的章节中进行了讨论。唯一可以测量真实FLR的情况是已知正确的修改位置。这种情况下最明显的情况是通过使用合成肽(12),但另一种已被采用的策略是评估每个肽中只有一个丝氨酸、苏氨酸或酪氨酸的磷酸肽子集中诱饵残基的位置(13).
虽然所有搜索引擎都有一个分数来衡量肽识别的确定性,但目前只有少数搜索引擎集成了一个额外的分数来衡量修饰位点定位的可靠性(13–16). 与此同时,出现了各种不同的后搜索引擎工具来解决修改站点本地化问题(12,17–23). 在站点本地化评分程序可用之前,评估所报告站点本地化的唯一选项是“手动验证”;即研究人员依次查看每个光谱,并判断他们是否认为站点定位可靠。这显然是一个主观的过程,严重依赖于研究人员的专业知识(以及他们彻底评估多达1000个光谱的耐心)。事实上,在期刊出版指南迫使研究人员评估网站本地化的可靠性之前(24)有许多PTM研究发表时甚至没有解决这个问题;即他们报告了相关搜索引擎返回的结果,没有进一步的分析。这样做的结果是列出了一些现场本地化,在对数据进行更仔细的检查后,这些本地化本不应报告。这本身就够糟糕的了,但PTM数据库已经提取了这些结果来填充其资源,并且从这些数据库中无法立即看出哪些站点本地化是根据这些通常不太严格的标准确定的。这将在本手稿的后面部分进行更详细的讨论。
2010年,生物分子资源设施协会(ABRF)蛋白质组信息学研究小组(iPRG)进行了一项关于识别磷酸肽和定位磷酸化位点的研究,22名试图评估修改站点本地化的参与者报告说,他们使用了9个指定的软件和另外6个自定义或内部工具。(25)尽管部署了一系列工具,但大多数都会实施两种基本策略之一。这两种主要的站点定位可靠性评分策略要么尝试评估允许站点确定随机匹配的给定峰值的可能性,要么计算具有不同站点定位的肽标识之间的搜索引擎评分差异。采用前一种策略的工具是A-Score(17),PTM得分(MaxQuant/Andromeda)(18)、Inspect中的磷酸化定位得分(PLS)(15)、SLoMo(20),磷化氢(26),磷RS(22)后一种策略的例子包括马斯科特三角得分(12),蛋白质浏览中的SLIP分数(13)以及Spectrum Mill[Agilent]中的变量修改本地化(VML)得分。PepArML公司(27)使用与后一种策略相关的方法在其结果中提供实验站点本地化得分,其中,通过将肽识别的置信分数相加,并通过与肽相关的总PepArML置信度进行归一化,计算在肽上观察到的每个翻译后修饰的位点定位分数(类似于PTM分数如何将其概率估计转换为位点分数)(N。爱德华兹,个人沟通)。总结了其中一些工具的特点,本文的其余部分将对比这些不同的站点定位策略,比较它们的性能,并讨论它们对低分辨率离子阱中获取的磷酸化数据以外的数据类型的适用性,这是迄今为止使用这些工具评估的主要数据类型。
表一
一些领先的改造现场本地化评分工具的比较
软件 | 峰值选取 | 评分:峰值概率(PP)或差异得分(DS) | 分数使用高质量精度? | 分数对高质量精度数据具有相同的含义? | 表示歧义 |
---|
A-分数 | n个峰值/100 Th | 聚丙烯 | N个 | Y(Y) | 报告最佳得分地点;不表示次佳替代方案 |
PTM得分Andromeda | 每100 Th有n个峰值 | 聚丙烯 | N个 | Y(Y) | 报告所有站点的概率分数 |
吉祥物Delta得分 | 每110 Th有n个峰值 | DS公司 | N个 | 给定的分数对于更高质量精度的数据更可靠 | 报告最佳得分地点;不表示次佳替代方案 |
SLIP评分蛋白质浏览 | 观察到的m/z范围每一半有20个最强烈的峰值 | DS公司 | Y(Y) | 类似 | 列出得分阈值内的所有潜在站点 |
VML分数谱磨机 | 去除同位素、前体和噪声后信号/噪声最高的25个峰 | DS公司 | Y(Y) | 类似 | 列出得分阈值内的所有潜在站点 |
峰值选取
在肽鉴定和修饰位点定位中,一个经常被低估的关键步骤是决定使用峰列表文件中的哪些质量进行分析。在峰值列表中,将有一个混合质量,即来自感兴趣肽的碎片离子,以及由化学或电气噪声产生的其他质量。由于噪声峰值的强度通常较低,因此通常根据强度决定使用哪个峰值。大多数工具都使用强度阈值,其中只考虑高于该阈值的峰值,尽管也使用了类似于搜索引擎Sequest所使用的基于强度的互相关方法(19). 阈值工具使用不同的方法。最简单的方法是在整个光谱中使用通用强度阈值。然而,并非所有碎片离子峰编码的信息量都相同。序列离子(对于CID、b和y离子)比内部离子或无机离子信息更丰富,并且在靠近肽中间的片段中形成的离子信息更为丰富,因为它们定义了较长氨基酸的质量。由于这些原因,一种峰值阈值策略可以确保在宽范围内的峰值表示米/z范围可以提高肽鉴定和位点定位的灵敏度。Protein Prospector中的Batch-Tag将观察到的米/z范围为一半,以创建一个峰值列表,用于搜索在每一半中列出的相同数量的峰值米/z范围(通常为每一半20个最强烈的峰值,以产生40米/z峰值列表)。第三个策略是将频谱划分为米/z箱子,然后使用每个箱子中的“n”个最强烈的峰值进行搜索。这是A-Score(100 Th垃圾桶)、PTM Score(100Th垃圾箱)和吉祥物(110Th垃圾罐)采用的策略。这种策略保证了m/z范围内的峰值表示,但会导致在频谱的“安静”部分使用低强度峰值。这在中得到了例证绘制了使用20+20和4/100Th策略生成的磷酸肽RGT(磷酸)VEGSVQEVQEEK光谱的峰列表。在每个策略中,列表中的峰值数量相似(40个峰值与分别为42个峰值)。然而,每种方法都有几个独特的峰,包括一些对应于正确肽鉴定的b和y离子的峰。在该实施例中,每个峰列表包含一个可用于将磷酸化定位到苏氨酸残基的峰,尽管在每个实施例中它是不同的峰;b4离子20+20峰列表和y10在4/100峰列表中。
不同峰值列表生成方法的比较。比较了用20+20方法生成的磷酸肽RGT(磷酸)VEGSVQEVQEEK光谱的峰列表和每100 Th 4个峰。用蓝色和红色表示的峰是仅包含在一个峰列表或另一个峰中的b和y离子。在20+20峰列表中,改性b4离子定位了改性位点;在每100 Th峰的4个峰列表中,修饰的y10离子(与未修饰的y7离子结合)定位了修饰位点。
在相同的数据集上,将蛋白质浏览者峰值列表创建策略与100 Th装箱策略进行了比较(13). 与每100 Th策略4个峰值相比,差异不大,但20+20峰值列表导致了稍微更正确的站点定位,而错误的站点定位则稍微少一些,从而在较低的FLR下返回了更正确的结果。考虑到更多的峰(每100 Th 5个峰)产生了可测量的更高FLR,主要是因为报告了光谱的不正确位置定位,其中使用其他峰列表生成策略,位置定位被认为是模糊的。
站点定位评分:随机峰值匹配的概率
前两个重要的站点本地化评分工具A-Score和PTM Score使用类似的方法对作业进行评分。在这两种情况下,开发了用于评估低质量准确度离子阱CID数据中磷酸化位点识别的工具。这两种工具都将观察到的峰值视为整数质量,因为这类数据通常使用米/z精度约为±0.5 Th并不是不合理的步骤。然后他们假设,如果每个峰值质量都是随机观测到的,那么如果例如每100Th考虑四个峰值,随机匹配其中一个峰值的概率为4/100。在计算出概率后,他们将数值转换为-10log10(p) 分数。
A-Score和PTM Score之间的差异在于,PTM Scope使用这种方法计算肽鉴定的概率分数,作为一个整体,包括每个可能的位点定位,然后将这些分数转换为每个潜在位点定位的概率,方法是使所有分数的总和等于100%的概率(因为肽肯定在某个地方被修饰了),并在这个标准化的概率尺度上为肽中的每个位点分配概率(18).
相反,A-Score仅基于匹配的潜在“决定位置”b和y离子计算其概率分数;即忽略所有站点本地化都相同的峰值。它不报告所有站点的站点本地化得分,而只报告最佳站点本地化的得分,这是此站点本地化与次佳可能性之间的差异得分(17). 在AScore的原始出版物中,作者建议使用19分的阈值,这在数学上与概率P(~0.01)或站点本地化的99%确定性相对应(17). 后来作者实验室的磷蛋白组学论文通常使用更自由的阈值(第页<0.05,AScore>13)(28). 如果对AScore概率方程中的一系列值进行测试,很明显,如果得分大于13,则最好的定位需要至少有两个以上的位点决定离子在MS/MS光谱中匹配,而不考虑分隔两个候选定位位点的氨基酸数量。
通过这些方法计算的概率的准确性取决于用于将MS/MS数据拟合到二项式概率模型中的假设。一个不切实际的假设是,所有质量都有可能被随机观测到。氨基酸使用的元素范围有限,其中几个元素之间只有一个甲基不同,因此实际上,一些物质比其他物质更容易被观察到。例如,质量201处的峰可能是氨基酸EA、LS、IS或TV结合形成的b2离子。另一方面,m/z 206处的峰不能由任何氨基酸组合形成。然而,由于在每种情况下,他们都会与其他站点本地化得分进行比较或标准化,这可能会缓解这个问题。尽管如此,与其将这些基于概率的分数视为网站规模确定性的准确度量,不如将其视为仅受用户确定的阈值限制的分数,以适应个人确定性目标。
相比之下,PhosphoRS中的评分试图通过替换核心概率计算来克服光谱质量范围内的峰值分布问题N个每100 Th的峰值(N个xd日)/w个,其中N个是提取峰的总数,d日是规定的碎片离子质量容限,以及w个是MS/MS光谱的全部质量范围(22). 这种概率调整不仅允许MS/MS光谱的不同区域包含不同数量的峰,不同的最佳峰深对不同的米/z窗口,但也直接允许使用适合于高分辨率仪器上生成的数据的窄质量公差。
网站本地化评分:搜索引擎差异评分
数据库搜索引擎在进行肽识别时会考虑肽中所有潜在的位点定位。因此,搜索结果中的信息可以通过提取不同位点定位的肽识别得分/期望值的差异来提供位点定位可靠性的度量。这是吉祥物Delta Score采用的原则(12),蛋白质浏览中的SLIP评分(13)和频谱轧机中的变量修改本地化评分(16). 前两个都报告了概率或期望值得分的差异(这两个测量值的差异将相同),并记录在日志中10规模;即期望值相差一个数量级将得10分;两个数量级的人可以得到20分。在Spectrum Mill中,识别分数不是概率性的,而是基于匹配峰的数量、它们的离子类型分配以及不匹配峰的相对高度。自信网站本地化的得分阈值(前两个本地化之间的得分差异>1.1)对应于位于两个候选位点之间的至少1个b或y离子,其峰高>最高碎片离子的10%(前体和相关离子的磷酸盐中性损失不包括在相对高度计算中)。这些工具之间有两个显著差异。Batch Tag(SLIP评分)和Spectrum Mill大多使用相同数量的峰/谱(Batch Tag中通常为40个峰,Spectrum Mill中通常为去除同位素和噪声后信号/噪声最高的25个峰),而Mascot使用的峰数量(Mascot Delta评分)不同光谱之间的变化(通常低于Batch-Tag使用的数字),因为搜索引擎会改变此值以获得肽识别的最佳置信度。其次,SLIP评分与Spectrum Mill中的变量修改本地化评分一样,直接集成到Batch-Tag搜索中,而Mascot Delta评分则由单独的软件使用Mascot.dat结果文件作为输入进行计算。除了在Protein Prospector和Spectrum Mill中自动报告分数的便利性之外,这意味着网站本地化将针对搜索引擎的所有结果进行评估,而对于其他搜索结果软件,将结果传输到第二个程序进行额外分析所需的额外努力意味着站点本地化的可靠性将不会定期进行评估。大多数搜索引擎需要稍作调整才能计算出所有结果的站点本地化差异分数。吉祥物会存储每个光谱的前十个搜索结果。然而,有时具有不同位点定位的同一肽不会在前十名结果中得分;例如如果观察到一长串y离子,它们只与一个位点定位相匹配。在这种情况下,无法报告站点本地化得分。因此,Batch-Tag和Spectrum Mill进行了更改,以便始终存储次佳站点本地化的分数,以便报告所有站点本地化的得分。
当前本地化评分工具的性能
2010年,ABRF-iPRG进行了一项LC-MS/MS数据分析合作研究,重点是评估蛋白质组实验室在识别磷酸肽和定位磷酸化位点方面的能力(25). 向35名参与者提供了相同的磷酸蛋白质组LC-MS/MS数据集,该数据集是在强阳离子交换(SCX)和固定化金属亲和色谱(IMAC)磷酸肽富集后,从人类K562细胞裂解液的胰蛋白酶消化物生成的。在SCX梯度收集的12个分数中,研究数据集仅包含分数3、4和12。参与者被要求以≤1%的错误发现率(FDR)鉴定样品中存在的磷酸肽,并评估将磷酸化位点定位到特定氨基酸残基时的确定性或模糊性。由于FDR的传统目标经济措施(11)这项研究的鉴定部分可以保持在一个公平的竞争环境中。然而,由于缺乏虚假定位率(FLR)的标准衡量标准,参与者无法获得关于定位确定性阈值测量的具体指导。相反,他们被要求对每个肽谱匹配做出是/否定位决策,并描述其评分机制和阈值。随后,基于对本地化的共识,对评估站点本地化的22名参与者的结果进行了评估。A类,B类显示79%的时间参与者一致同意本地化网站(3136个PSM中的2487个)。这只反映了可能存在歧义的情况(即STY数量>检测到的磷酸化数量),其中至少有两名参与者愿意宣布鉴定结果可信(即~1%FDR)。在其余21%的情况下,如所示C类d,分歧并不限于单个或少数参与者。相反,据观察,最有可能做出本地化决策(而不是声明模糊性)的参与者更有可能不同意共识观点(最左边的参与者)。因此,与共识的分歧很大程度上可归因于过度自由的阈值,决策基于MS/MS谱中存在的边际定位证据。示例见虽然79%的一致同意非常有希望,但这也突出了制定更通用报告标准的必要性。
2010年ABRF-iPRG关于识别磷酸肽和定位磷酸化位点的研究中SCX IMAC组分4的磷脂酶定位协议。
A类,对于3932个光谱,≥2/22名参与者将鉴定结果确定。其中,3136个光谱在被指定为确定的位置定位中可能存在歧义;457个光谱没有位点定位模糊的可能性(#磷酸位点等于肽中#苯乙烯残基);119个光谱一致认为定位不明确;在220个光谱中,只有1名参与者确定了网站的定位。B类对于3136个光谱,其中>2/22个参与者愿意指定定位为确定的,他们一致同意79%的光谱中磷酸化位点的定位。C类在剩下的21%的案例(649个光谱)中,未发现分歧仅限于单个或少数参与者。D类,最有可能做出本地化决策(而不是声明模糊性)的参与者更有可能不同意共识。这个x的轴(C类)和(D类)按#localized/#identified的降序排序。
在2010年ABRF iPRG研究14/21中,参与者明智地将磷酸位点定位指定为该肽谱匹配的不明确。在7名过分攻击性的参与者中,本地化被分割,Ser-8为4名(上面的)Thr-10三个(降低). 光谱中只有低强度离子米/z1055.4和m/z 879处的离子,根据磷酸盐对Ser-8或Thr-10的定位,可指定为不同的碎片离子类型。
错误定位率(FLR)
目前,最广泛的方法是对不同软件工具的肽识别结果进行比较,方法是将每个工具都置于错误发现率的通用度量标准(FDR)下,该度量标准使用目标经济数据库搜索策略进行计算。由于目标肽和诱饵肽的随机匹配频率相同,因此正确构造的诱饵将使所有工具处于公平的竞争环境中(11). Nesvizhskii最近的一篇综述中提供了有关肽和蛋白质鉴定可靠性测量的更多详细信息(29). 不幸的是,对于改造现场的本地化,没有等效的可靠性措施;即FLR,目前可以轻松计算。部分原因是具有错误位点定位的肽识别不是随机匹配;它们与正确答案非常相似,因此诱饵序列不提供错误估计。目前领先的候选FLR方法都涉及到计算,允许修改生物上无法忍受修改的氨基酸残基(13). 理想情况下,诱饵位点定位步骤应独立于诱饵肽鉴定进行,因为包含额外的可修饰残基将影响肽鉴定步骤,产生更多的假阳性或假阴性(取决于接受阈值的得出位置)(13). 为了使基于诱饵定位的FLR准确,诱饵残留物的频率需要与目标相同,并且诱饵残渣与正确位置定位的接近程度也必须遵循与目标残留物相似的模式:残留物越靠近正确的修饰位置,越有可能被错误地解释为修改位置。
虽然生物可磷酸化残基S、T和Y的组合密码子频率为~20%,但在UniProt人类序列数据库中,当需要长度为8–40个残基且不允许缺失裂解的胰蛋白酶肽时,它们的频率为17.2%。通过允许E、V和N(17.1%)或D、E和I(16.5%)的诱饵残留组合,可以实现UniProt人类数据库中的类似残留频率。然而,对于单个胰蛋白酶肽,使用这种不断选择的诱饵残基很少能匹配相对频率。可以在以下位置计算多个数据库的AA频率http://proteomics.broadinstitute.org/millhtml/faindexframe.htm选择Calculate statistics实用程序。
除了在UniProt人类数据库中与丝氨酸和苏氨酸(14.5%)的组合频率相似(14.1%)外,脯氨酸(P)和谷氨酸(E)也是诱饵氨基酸定位评分的有趣候选对象,因为它们都存在于许多激酶的一致模体中(与其他丝氨酸和苏氨酸一样)。因此,可以期望它们提供最佳的接近正确的磷酸化位点。在一项研究中,两种残留物用作诱饵时产生了相似的FLR结果(13). 如果同时测试目标和诱饵残留物(即任何S、T、Y、P、E残基允许在单个肽谱匹配中进行磷酸化),那么这必然会导致数据集中出现更多模糊的定位决策,因为可修饰残基的数量增加了大约三分之二(从3种残基类型增加到5种残基类型)。一次只考虑一种诱饵残留物类型,但执行多次搜索,将减少此问题。然而,这些类型的FLR测量可能会高估实际FLR。另一种方法是分别在特定肽谱匹配的目标残基和诱饵残基之间进行位点定位,然后比较前两个得分。
虽然频率和邻近性问题可能会妨碍对单个肽谱匹配的错误定位状态进行准确评估,但计算整个数据集中诱饵残基定位的数量可能会产生近似的全局FLR,即使不准确,可以足以用作算法性能差异的通用度量,并且允许将与特定算法一起使用的个体得分阈值分类为比其他算法更自由或更保守。缺乏公认的FLR指标可能会导致开发的每种定位算法对优越性的持续混淆和虚假声称,以及高通量LC-MS/MS PTM报告中声称的定位可靠性的持续不确定性。
努诺·班德拉(Nuno Bandeira)及其同事提出了一种更复杂的方法,试图为观察特定地点确定的重要性分配权重(个人交流;手稿准备中)。通过测定同一肽未经修饰的光谱中等效主链断裂离子的强度,人们可以更清楚地了解是否应该观察到给定的位点决定离子。这种方法的一个潜在局限性是需要观察未经修饰的肽,如果在样品分析之前采用修饰富集步骤,这种情况不太可能发生。然而,随着公共频谱库的迅速增加(30)如果将等效碎片数据存储在这些资源中,则可以使用这些数据提取峰值强度信息。将此与诱饵残留物搜索相结合可以提供更准确的FLR测量。
在FLR度量计算领域进行更多研究对该领域至关重要。
从文献中获取基于MS/MS的修改本地化
近年来,出现了一些知识库网站,这些网站收集了LC-MS/MS推动的磷酸蛋白质组研究同行评审期刊文章补充表中列出的数千个修饰位点定位。这些网站中发展最完善的包括PhosphoSitePlus(网址:www.phosphosite.org) (31)和磷化氢。ELM(phospho.ELM.eu.org)(32). 这些网站目前依靠收录论文的作者来获得正确的本地化。因此,网站用户依靠多篇论文中的现场观察结果进行确证,或完全排除高通量数据,从而过滤结果的能力有限。菲律宾(网址:www.phosida.com)传播马蒂亚斯·曼恩实验室研究中发现的出版物中确定的和本地化的改性位点(33). 因此,通过通用软件平台分析了所有有助于确定位点的MS/MS光谱,并遵循一致的评分阈值。由于LC-MS/MS生成的已发表的修饰定位是由知识库获取的,并且潜在的错误阻碍了其他研究人员对信息的下游使用,如果产生和分析LC-MS/MS数据的研究人员在设置识别/定位阈值时偏于保守,那么社区会更好。因此,对特定肽谱匹配进行模糊的修改定位决策比弄错更可取。随着更多来自PTM研究的原始LC-MS/MS数据通过期刊要求或作者的自愿行动存储在公共领域,知识库越来越有可能采用最新的算法和评分指标重新处理数据,并对其传播的信息实施统一的质量标准。
现场评分工具的标杆管理和比较
如前所述,对站点本地化软件性能进行基准测试的唯一可靠方法是通过分析已知答案的数据集。这样的数据集是通过分析180个合成磷酸肽创建的,其中每个肽都获得了许多MS/MS光谱,以创建一个大的光谱数据集(12). 在本研究中,他们将马斯科特δ评分与A-评分进行了比较,以分析Q-TOF微型质谱仪获得的数据,该质谱仪产生低质量精度(±0.4 Da)的四极型CID数据。在随后的研究中,蛋白质浏览者的SLIP评分也在同一数据集上进行了评估(13). 比较表明,A-Score在给位点定位评分方面最为保守(它报告了73%的肽ID的位点定位评分,而马斯科特δ评分为85%,SLIP评分为88%)。然而,在报告的站点中,SLIP评分的FLR最低(6.3%,相比之下,使用A评分的FLR为8.7%,使用Mascot delta评分的FLR为10.9%)。
应该注意的是,这些值代表任何分数的结果,而在实践中,研究人员通常会为每种工具使用一个分数阈值,因此结果的可靠性将高于这些值(报告有位点定位的肽的百分比将更低)。然而,这些数字可能代表了这些工具相对性能的趋势。A-score(和PTM-score)仅考虑b和y离子,假设碎片上存在修饰。SLIP评分和马斯科特·德尔塔评分也可考虑其他离子类型(取决于指定的仪器类型);例如SLIP评分和马斯科特·德尔塔评分将对水或磷酸盐损失峰值给予一定的权重。这可能解释了为什么马斯科特·德尔塔评分和SLIP评分在比较中报告了磷酸肽谱百分比高于a-score的位点定位。令人放心的是,至少在SLIP评分的情况下,这些额外峰值的使用似乎不会对站点定位的总体可靠性产生不利影响。
在最近的一篇论文中,作者描述了磷光体遥感的发展,并将其与其他磷灰石定位程序进行了比较,试图将不同的程序放在同一个赛场上,以检查各种解离方法(包括CID、HCD和ETD)生成的数据(22). 使用179个合成磷酸肽生成的数据集来确定达到特定FLR值所需的评分阈值。然后将这些得分阈值应用于更大的数据集(数千个肽),这些数据集来源于HeLa细胞裂解物的胰蛋白酶消化的磷酸肽富集,以表明PhosphorRS通过定位多至7%的磷酸位点而优于其他程序。尽管有人可能会批评这种比较,认为合成肽数据集可能太小,可能无法充分代表生物模型系统中序列的多样性,在没有一个广泛接受的指标来计算每个实验数据集的FLR的情况下,这些作者显然试图以合理的方式进行公平的比较。此外,在阅读描述新评分算法的论文时,如果没有与现有算法进行某种比较,则很难进行评估。
高质量精度数据的性能
识别修饰位点需要比肽识别所需更高质量的光谱。提高数据质量的一种方法是以更高的质量精度测量碎片质量。更高的质量精度允许更好地区分真实峰值和噪声峰值;即噪声峰被指定为碎片离子的可能性较小。它还允许电荷状态确定,这进一步减少了假阳性峰值匹配。
显然,A-score和PTM-score的单位质量分辨率模型不太适合这种数据类型。可以增加100 Th料仓内的质量料仓数量,并相应调整概率。这就是磷化器的基本功能(26). 然而,随着质量箱尺寸的缩小,可以观察到所有质量箱的假设变得越来越有缺陷。如果箱子的粒度增加,则给定分数的重要性对于高分辨率数据也将发生显著变化(相同数量的峰值将产生更高的分数)。如果假设单位质量分辨率的模型没有改变,那么分数可能具有相同的含义,但对于站点定位来说,您将放弃质量精度的所有好处。
搜索引擎差异评分的影响更难预测,因为搜索引擎可能会在评分中隐式使用质量准确性。如果他们在评分中完美地使用质量准确性,那么e值差异应该对所有数据类型具有相同的可靠性度量。通过将HCD搜索值与±0.5Da和±0.02Da进行比较,对该主题的Mascot Delta评分进行了部分评估(12). 研究发现,较低的Mascot Delta评分阈值可以用于更高质量精度的搜索(并且可以可靠地识别更多站点)。我们自己发现,对于较高和较低的质量精度数据,SLIP评分阈值与马斯科特三角评分结果更为相似;较高的质量精度数据通常会导致较大的SLIP分数,因为在较高的质量精确度下匹配给定的峰值具有更大的统计意义,但给定分数的可靠性似乎相对相似。
需要注意的一点是,对于质量精度较高的数据,使用较低的阈值/较大的峰值列表进行搜索可能更安全,因为噪声峰值不太可能成为假阳性峰值匹配的问题。
不同PTM的性能
站点定位软件所应用的大多数结果都是磷酸肽数据集。分析其他PTM时,这些软件的性能是否可能存在差异?由于分数是基于观察到的区分不同位点的峰数,因此答案取决于修饰是否会产生额外的离子类型。如果评分系统对例如当用于不产生损失离子的改性时,磷损失峰值,则分数可能具有稍微不同的含义。不幸的是,很难测试这一点,因为目前除了磷酸化之外,还没有具有PTM的合成肽的大型数据集。
如前所述,创建已知修饰位点数据集的另一种策略是将PTM数据集过滤为只包含一个可修饰残基的肽,然后执行搜索以修改诱饵残基。这是在内部对哦-GlcNAc修改数据集,其中识别出6000多个修改光谱(描述该数据集的手稿正在审查中)。然而,当仅提取包含单个可修饰残基(丝氨酸或苏氨酸)的光谱时,只有170个光谱,其中六个报告的诱饵残基与SLIP评分相匹配,这显然不足以从中得出任何有意义的统计数据。这个问题的一个重要因素是哦-GlcNA酰化。尽管O-GlcNAc转移酶没有明确定义的基序,但在修饰位点两侧发现的最常见的氨基酸是其他丝氨酸和苏氨酸。(34)该数据集中只有3.1%的GlcNAc修饰肽包含单个可修饰残基,而当该策略用于磷酸肽数据集时,7.5%的磷酸肽序列包含单个丝氨酸、苏氨酸或酪氨酸(13). 这突出表明,修饰的序列基序可以对精确定位修饰位点的能力产生重大影响。
那么,哪些类型的修改带来了最大的挑战?当站点定位信息通常最少时的修改是:(1)质谱仪中非常不稳定的修改,通常为O-连接修改,如糖基化和硫酸化(尽管这些在ECD和ETD数据中不是问题);(2) 许多常见氨基酸可能发生的修饰;例如磷酸化;(3) 肽末端和氨基酸侧链都可能发生的修饰;例如乙酰化可以发生在蛋白质和肽N末端以及赖氨酸侧链上:由于缺少低质量区域,这些在离子阱CID裂解光谱中尤其有问题。关于这些修饰定位工具,需要强调的一点是,用户指出哪些氨基酸类型可以进行特定修饰,因此如果修饰是在未指明可能的残基上进行的;例如如果用户正在寻找赖氨酸甲基化,但没有考虑精氨酸、天冬氨酸或谷氨酸甲基化的情况,那么结果可能不可靠。
表示歧义
对于某些光谱,不可能可靠地确定修改位置,并且使用不同的策略来报告这种类型的结果。在PTM得分和磷化氢遥感的情况下,报告每个潜在站点的置信度,由用户决定他们希望接受的可靠性阈值。在SLIP评分的情况下,列出了所有在评分阈值范围内可接受的潜在现场本地化,但未指明其中哪一个更可能比其他更可能。在A-score或Mascot Delta评分的情况中,最可能的本地化标记为低分,没有指出下一个最佳的站点本地化是什么。
Protein Prospector输出的一个独特特征是,对于位点定位不明确的光谱,如果用户单击肽序列,它会自动将不同的位点定位绘制到同一光谱上,从而可以对结果进行视觉比较,并突出显示任何区别性峰(参见). 这使得对模糊光谱的评估变得容易,尽管如果允许用户干预作为验收标准的一部分,则会为报告结果引入不一致的可靠性度量。
目视比较改造现场本地化方案。Protein Prospector自动显示所用SLIP评分阈值内所有潜在位点定位的注释。在该视图中,指示了不同位点定位之间的鉴别峰值。两种解释都解释了用红色标记的峰,但离子定位只显示了鉴别峰。在这个例子中,磷酸化到丝氨酸残基12或苏氨酸14的定位都解释了光谱中40个峰值质量中的26个。由于y7离子对应于光谱中的两种解释,这可能是两个不同位点上修饰的肽的混合光谱。