跳到主页内容
美国国旗

美国政府的官方网站

Dot政府

政府意味着它是官方的。
联邦政府网站通常以.gov或.mil结尾。之前分享敏感信息,确保你在联邦政府网站。

Https公司

网站是安全的。
这个https(https)://确保您连接到官方网站,并且您提供的任何信息都是加密的并安全传输。

访问密钥 NCBI主页 MyNCBI主页 主要内容 主导航
.2014年12月;13(12):3663-73.
doi:10.1074/mcp。O114.039586号。 Epub 2014年9月8日。

JUMP:一种基于标签的数据库搜索工具,用于高灵敏度和准确性的肽鉴定

附属公司

JUMP:一种基于标签的数据库搜索工具,用于高灵敏度和准确性的肽鉴定

王旭升等。 分子细胞蛋白质组学. 2014年12月.

摘要

数据库搜索程序是鸟枪蛋白质组学中通过质谱(MS)鉴定肽的基本工具。在数据库搜索过程中同时实现高灵敏度和高特异性对于提高蛋白质组覆盖率至关重要。这里我们介绍了JUMP,这是一个新的混合数据库搜索程序,它可以生成氨基酸标签,并根据标签和模式匹配的综合得分对肽谱匹配(PSM)进行排序。在典型的液相色谱与高分辨率串联质谱联用过程中,95%以上的MS/MS光谱可以产生至少一个标记,而其余的光谱通常太差,无法得到真正的PSM。为了提高搜索灵敏度,JUMP程序允许使用短至一个氨基酸的标签。使用目标恢复策略,我们在分析多个数据集时将JUMP与其他程序(例如SEQUEST、Mascot、PEAKS DB和InsPecT)进行了比较,发现JUMP的性能优于这些先前存在的程序。JUMP还允许分析“混合物光谱”中的多个共碎片肽,以进一步增加PSM。此外,JUMP衍生标签允许部分从头测序,并有助于明确指定修饰残基。总之,JUMP是一种有效的数据库搜索算法,是对当前搜索程序的补充。

PubMed免责声明

数字

图1。
图1。
JUMP算法。 A类,JUMP算法概述。JUMP从原始数据文件或mzXML文件开始,然后对每个光谱执行MS1和MS2预处理。MS1前体离子质量和来自MS2光谱的序列标签均用于筛选数据库中的肽序列。模式匹配后,JUMP生成一个最终得分,即J得分,对所有识别的肽进行排序。B类,举例说明JUMP算法中理论肽的两步过滤:(i)在质量容限范围内由前体质量1402.651 Da过滤(例如10 ppm);(ii)由序列标签过滤。C类JUMP输出示例。J评分是通过整合标签E评分和肽E评分生成的。
图2。
图2。
从高质量的MS/MS光谱推断的标记(A类)和低质量(B类).顶部面板显示原始MS/MS光谱,中间面板显示经过峰值滤波和强度归一化处理的预处理光谱,底部面板显示前六个标签。JUMP程序以两种读取顺序组装标签,对应于可能的b条离子系列。
图3。
图3。
由JUMP派生的标记。 A类,第一个数据集中单个MS/MS光谱的标签号分布。B类,伪接收机操作特性曲线,用于比较三种标签评分方法:Wilcoxon秩和检验(“秩”)、超几何检验(“hyper”)和组合方法(“comb”)。C类,受数据库搜索所选顶级标记数影响的预期真实PSM数。
图4。
图4。
标签长度对肽鉴定的影响。 A类、不同标签长度的识别目标和诱饵PSM数量分布。B类,不同标签长度的目标和诱饵PSM的J分数分布。
图5。
图5。
JUMP、SEQUEST和吉祥物的性能比较。 A类JUMP在伪接收机工作特性图上显示了最佳结果。B–D类,目标和诱饵PSM沿着JUMP(J分数)、Mascot(E值)和SEQUEST(Xcorr)的匹配分数的分布。E类、目标和诱饵PSM在J分数中的分布——dJ公司n个绘图。F类JUMP的δ相关分数分布(dJ公司n个)和SEQUEST(数据中心n个)以1%FDR接受的PSM。
图6。
图6。
在混合串联质谱中鉴定多个前体离子。 A类,一个示例显示隔离窗口中的两个共同隔离的离子。计算隔离窗口内所有前体的前体强度百分比(PPI)。B类同一MS/MS光谱中包含多个前体比仅选择一个前体可以进行更多的识别。截止值设定为1%FDR。C类D类、目标和诱饵PSM的分布,以及顶级前体和剩余前体的匹配分数。
图7。
图7。
JUMP派生的标签便于分配修改位置。 A类,标记中的修改站点。B类,标记中可修改的站点,但未修改。C类,标记中不包含的可修改站点。标签两侧的质量为站点分配提供了限制。
图8。
图8。
从头开始一种新肽的测序。 A类,一个含有14个氨基酸的标签是从一个高质量的光谱中获得的,但在数据库搜索过程中没有发现可靠的肽。B类在数据库中搜索标签时,在新标签中发现了氨基酸变化(N13S)。C类,核苷酸变化(aG;rs1045288)从全基因组测序和RNA测序证实了新的标签序列。
图9。
图9。
使用大规模数据集对五个程序进行性能比较。LC/LC-MS/MS分析的人类数据集包含约170万个MS/MS光谱。显示了1%FDR下可接受的PSM和肽。

类似文章

引用人

工具书类

    1. Aebersold R.,Mann M.(2003)基于质谱的蛋白质组学。自然422198–207-公共医学
    1. Sadygov R.G.、Cociorva D.、Yates J.R.,第3期(2004年),使用串联质谱进行大尺度数据库搜索:在书的背面查找答案。自然方法1195-202-公共医学
    1. Nesvizhskii A.I.,Vitek O.,Aebersold R.(2007)串联质谱法产生的蛋白质组数据的分析和验证。自然方法4787–797-公共医学
    1. Eng J.K.、Searle B.C.、Clauser K.R.、Tabb D.L.(2011)《人群中的面孔:通过数据库搜索识别肽》。分子细胞。蛋白质组学10,R111.009522。-项目管理咨询公司-公共医学
    1. Noble W.S.、MacCoss M.J.(2012)蛋白质质谱数据的计算和统计分析。公共科学图书馆计算。生物学8,e1002296。-项目管理咨询公司-公共医学

出版物类型