跳到主页内容
美国国旗

美国政府的官方网站

点政府

gov意味着它是官方的。
联邦政府网站通常以.gov或.mil结尾。之前分享敏感信息,确保你在联邦政府政府网站。

Https系统

该站点是安全的。
这个https(https)://确保您连接到官方网站,并且您提供的任何信息都是加密的并安全传输。

访问密钥 NCBI主页 MyNCBI主页 主要内容 主导航
.2010年12月;9(12):2840-52.
doi:10.1074/mcp。M10.003731。 Epub 2010年9月9日。

CID、ETD和CID/ETD串联质谱对的生成函数:在数据库搜索中的应用

附属公司

CID、ETD和CID/ETD串联质谱对的生成函数:在数据库搜索中的应用

桑塔·金等。 分子细胞蛋白质组学. 2010年12月.

摘要

最近出现的新质谱技术(例如,电子转移离解,ETD)和高通量实验中用于蛋白质消化的额外蛋白酶(例如Lys-N)的可用性提高,提出了设计新算法来解释产生的新型串联质谱(MS/MS)的挑战。传统的MS/MS数据库搜索算法,如SEQUEST和Mascot,最初是为胰蛋白酶肽的碰撞诱导解离(CID)而设计的,并且主要基于关于胰蛋白酶肽片段化的专家知识(而不是机器学习技术)来设计CID特异性评分函数。因此,这些算法的性能对于新的质谱技术或非传统肽来说是次优的。我们最近提出了胰蛋白酶肽CID光谱的生成函数方法(MS-GF)。在本研究中,我们扩展了MS-GF,从任何类型的注释MS/MS光谱(例如CID、ETD等)自动导出评分参数,并提出了一种基于MS-GF的新数据库搜索工具MS-GFDB。我们表明,MS-GFDA在ETD光谱或Lys-N消化的肽方面优于Mascot。例如,在ETD谱的情况下,与吉祥物相比,MS-GFDB鉴定的胰蛋白酶和Lys-N肽的数量增加了2.7倍和2.6倍。此外,即使在吉祥物经过十年的发展来分析胰蛋白酶肽的CID光谱之后,MS-GFDB(不是专门针对CID光谱或胰蛋白酶肽而设计的)仍然使肽识别数量比吉祥物增加了28%。最后,我们提出了一个统计框架,用于分析来自同一前体的多个光谱(例如CID/ETD光谱对),并将p值分配给肽谱匹配。

PubMed免责声明

数字

图1。
图1。
计算第页单个光谱的MS-GF值。给定串联质谱,MS-GF将光谱转换为PRM光谱(串联质谱的评分版本)。质量条件下PRM光谱的分数表示导出光谱的肽包含质量前缀的对数似然比。PRM谱中的负峰值代表质量,更可能代表不正确的前缀质量,而不是正确的前缀。PRM光谱中的此类负峰通常对应于实验光谱中的低强度或缺失峰。PRM谱用于计算任何肽相对于谱的MS-GF分数。然后,MS-GF使用生成函数方法计算所有肽相对于光谱的MS-GF分数直方图。最后,MS-GF计算第页作为直方图下面积的肽值,其MS-GF得分等于或大于肽的MS-GF分数。
图2。
图2。
计算第页CID/ETD对的MS-GF值。给定CID/ETD对,MS-GFDB将每个光谱转换为一个PRM光谱,并通过对具有相同质量的峰的分数求和来合并两个PRM谱。这个“求和”的PRM光谱用于生成所有肽和第页使用直方图计算值。
图3。
图3。
经鉴定的含有吉祥物和MS-GFDB的多肽数量()CID-Tryp和ETD-Tryp中的电荷2光谱(b条)CID-LysN和ETD-LysN中的电荷2光谱(c(c))CID-Tryp和ETD-Tryp中的电荷3光谱(d日)CID-LysN和ETD-LysN中的电荷3光谱(e(电子))CID-Tryp和ETD-Tryp中电荷大于等于4的光谱,以及((f))CID-LysN和ETD-LysN中电荷大于等于4的光谱。根据相应的肽水平FDR绘制肽识别数量。实心曲线代表MS-GFDB,虚线曲线代表吉祥物。绿色曲线表示CID,蓝色曲线表示ETD。吉祥物离子分数和MS-GFDB第页这些值用于计算FDR。分别计算前体电荷2、前体电荷3和前体电荷4及更大的光谱的FDR。在所有考虑的案例中,MS-GFDB表现优于吉祥物。
图4。
图4。
四种离子类型的各种离子的概率()电荷2光谱和(b条)电荷3光谱(类似分析见(32))。使用CID-Tryp-Confident、ETD-Tryp-Confident,CID-LysN-Confidente和ETD-LysN-Confilent中的光谱。对所有光谱进行过滤,以去除噪音峰,如下所示:给定质量峰M(M),如果峰值在大小为100Da的窗口内的前六个峰值中,则我们保留该峰值M(M)前体离子(或电荷感应前体离子)及其衍生物也被过滤掉。彩色条表示概率(轴)某类离子(x个轴)存在于滤波光谱中。每个数据集都有颜色编码。例如,由长度为10的肽生成的CID-Tryp-Confident中的电荷2光谱预计具有10–1(潜在裂解位点的数量)×0.76(y离子的概率)=6.8 y离子,而ETD-Tryp-Confident的电荷2谱预计只有9×0.26=2.3 y离子。在MS-GFDB中,概率超过0.15的所有离子类型都用于评分(参见补充1详细信息)。
图5。
图5。
不同数据集的不同离子类型的秩分布:,CID-尝试-自信;b条,CID-LysN-Confidential;c(c),ETD-Tryp-Confident;d日,ETD-LysN-信心。只考虑了电荷二光谱,并过滤了所有光谱以去除前体离子(或电荷还原前体离子)及其衍生物。对于每个数据集,选择了10种概率最高的不同离子类型,以及给定等级的峰值概率(x个轴)是某种离子类型(彩色编码),绘制了秩为1到100的峰。黑色曲线(标记为未解释)表示10种选定离子类型中任何一种都无法解释的峰值。例如,对于CID-Tryp-Confident电荷2,排名最高的峰值代表概率为0.7的单电荷y离子、概率为0.1的双电荷y离子(y2)、概率为0.04的单电荷b离子等。概率为0.1,仍无法解释。
图6。
图6。
图的模拟。5用于电荷3光谱。
图7。
图7。
维恩图()根据IPI-Human数据库在肽水平FDR 1%和(b条)根据诱饵数据库识别光谱对第页对应于肽水平FDR 1%或更低的值。显示了肽的数量(括号中的光谱对数量)。灰色数字对应CID和ETD标识不一致的光谱对的数量(括号中的百分比)。
图8。
图8。
具有MS-GFDB CID/ETD的已识别肽的数量()CID-Tryp和ETD-Tryp中的电荷2光谱对(b条)CID-LysN和ETD-LysN中的电荷2光谱对(c(c))在CID-Tryp和ETD-Tryp中充电3个光谱对(d日)CID-LysN和ETD-LysN中的电荷3光谱对(e(电子))CID-Tryp和ETD-Tryp中大于等于4的电荷谱对,以及((f))CID-LysN和ETD-LysN中大于等于4的电荷谱对。还显示了带有MS-GFDB的已识别肽的数量,以供参考。根据相应的肽水平FDR绘制肽识别数量。分别计算前体电荷2、前体电荷3和前体电荷4及更大的光谱的FDR。红色曲线表示MS-GFDB CID/ETD,绿色曲线表示MS-GFDB CID,蓝色曲线表示MS-FFDB ETD。在所有考虑的案例中,MS-GFDB都优于MS-GFDB-CID和MS-GFDBETD。

类似文章

引用人

工具书类

    1. Zubarev R.、Kelleher N.、McLafferty F.(1998)多电荷蛋白质阳离子的电子捕获解离。非反复过程。美国化学杂志。Soc.1203265-3266号
    1. Cooper H.J.、Hákansson K.、Marshall A.G.(2005)《电子捕获解离在生物分子分析中的作用》。质谱。第24版,201–222-公共医学
    1. Syka J.E.、Coon J.J.、Schroeder M.J.和Shabanowitz J.、Hunt D.F.(2004)《电子转移解离质谱法肽和蛋白质序列分析》。程序。国家。阿卡德。科学。美国101、9528–9533-项目管理咨询公司-公共医学
    1. Taverna S.D.、Ueberheide B.M.、Liu Y.、Tackett A.J.、Diaz R.L.、Shabanowitz J.、Chait B.T.、Hunt D.F.、Allis C.D.(2007)组蛋白h3n末端甲基化和乙酰化之间的长距离组合链接。程序。国家。阿卡德。科学。美国1042086–2091-项目管理咨询公司-公共医学
    1. Khidekel N.、Ficarro S.B.、Clark P.M.、Bryan M.C.、Swaney D.L.、Rexach J.E.、Sun Y.E.、Coon J.、Peters E.C.、Xieh-Wilson L.C.(2007年)使用定量蛋白质组学探索大脑中o-glcnac糖基化的动力学。自然化学。生物3,339–348-公共医学

出版物类型