跳到主要内容
访问密钥 NCBI主页 MyNCBI主页 主要内容 主导航
自然方法。作者手稿;PMC 2016年6月1日提供。
以最终编辑形式发布为:
预防性维修识别码:项目经理4857761
NIHMSID公司:NIHMS782758
PMID:26550773

MSPLIT-DIA:用于数据独立采集的敏感肽鉴定

关联数据

补充材料

到编辑器

最近开发的用于质谱数据采集的数据相关采集(DIA)方法在蛋白质组学领域获得了越来越多的关注。我们提出了MSPLIT-DIA(使用已识别串联质谱库的混合光谱分割)作为光谱匹配工具,用于在DIA数据中识别非目标和敏感肽(http://proteomics.ucsd.edu).

尽管它对现代质谱仪很敏感,但数据依赖性采集(DDA)的半随机性导致每次分析样品时都要对不同的肽子集进行采样,从而导致缺失肽识别并降低多次运行的再现性。DIA策略旨在通过仅基于m/z而非强度的系统隔离和破碎离子来缓解这个问题。DIA策略通常将可用m/z范围分割为宽隔离窗口(例如SWATH中的25Da窗口1),生成了用DDA工具无法轻易识别的多肽的复杂光谱。相反,DIA数据分析工具大多基于使用SRM启发的策略有针对性地提取定量信息1,尽管最近的方法在自然方法,其中之一与本文件同时进行审查,提取伪质谱,然后使用DDA数据库搜索工具进行搜索2,然而,仍然需要计算工具来探索在多重光谱中识别肽的替代策略。

我们介绍了MSPLIT-DIA(使用已鉴定串联质谱库进行混合光谱划分),这是一种用于DIA数据中非靶向肽鉴定的光谱匹配工具(图1a;补充方法). 由于在每个多重光谱中可能存在来自共洗脱肽的许多峰,MSPLIT-DIA使用光谱投影将库光谱与每个DIA光谱匹配,然后使用归一化点积评估光谱光谱匹配(SSM)相似性。由于在整个洗脱过程中都会获得肽并对其进行分析,因此MSPLIT-DIA还评估了多个连续DIA光谱中库光谱和多重光谱之间匹配峰的相似性。最后,使用目标-经济方法以1%肽级错误发现率(FDR)评估SSM匹配的统计显著性。对于每个复用频谱,FDR≤1%的所有SSM都作为匹配返回。MSPLIT-DIA有效地在每个光谱中鉴定了多达10个肽,复杂样品(如人类裂解物)产生了包含一个以上肽的光谱优势(图1b;补充图1).

保存图片、插图等的外部文件。对象名为nihms782758f1.jpg
多肽、蛋白质和蛋白质相互作用的MSPLIT-DIA鉴定

(a)MSPLIT-DIA识别过程概述(另请参阅补充说明详细信息)。(b)由MSPLIT-DIA在DIA的多重光谱中确定的肽多重性具有不同的复杂性。(c)人裂解物自身(左)和加标48蛋白混合物(UPS1,右)进行分析;显示了使用六种不同的数据分析方法识别的独特肽的数量。MSPLIT-DIA分析使用来自相同样本成对数据相关采集(DDA)运行的库(绿色)或大型通用SWATH-Atlas库(紫色)。(d)通过四次运行(顶部面板)检测到的肽数量,以及与肽丰度(x轴)相关的MSPLIT-DIA和MSGFDB-DDA(底部面板)的再现性分析。(e)比较MSGFDB-DDA和MSPLIT-DIA方法在半定量方法中的应用,以检测来自两种诱饵蛋白(EIF4A2,MEPCE)和一种阴性对照(GFP)的亲和纯化样品的蛋白-蛋白质相互作用。(f)使用MSPLIT-DIA的DIA分析工作流程避免了使用额外的DDA运行、尖峰肽或手动管理来生成样本特异性分析库的需要。(g)PeakView和MSPLIT-DIA肽定量结果,有或无保留时间比对,有或没有MSPLIT-生成的分析库。

由于DDA是目前敏感肽鉴定的标准,我们将MSPLIT-DIA与MSGFBD进行了比较4DDA数据分析(图1c,补充图2-4). 虽然使用相同样本生成的光谱库时性能相当,但使用SWATH Atlas的MSPLIT-DIA5光谱库鉴定出的人类肽比相应的DDA分析多26-31%。MSPLIT-DIA还鉴定出比DIA-Ampire多66-89%的人类肽2比PeakView高81–88%和86–107%6和Skyline分别位于同一DIA管路中。与DDA相比,MSPLIT-DIA在4次运行中进一步实现了更具重现性的观测(补充图5; 70%对50%(1%FDR)。60%低丰度人类肽的再现性增益最为显著(图1d,补充图5; 59%的收益)。这对于比较研究很重要,因为在比较研究中,生物结论是通过检测和不检测样本中的低到中等丰度肽和蛋白质得出的。

我们以MSPLIT-DIA为基准,通过重新分析DDA和DIA数据,将诱饵EIF4A2和MEPCE的生物三倍性与阴性对照GFP进行比较,以分析蛋白质相互作用(比较蛋白质组学的一个主要应用)6(补充图6、7). 由于以非目标方式使用MSPLIT-DIA会产生光谱计数(图1d)它们不像DDA动态排除协议中那样受到前体离子选择的影响,我们将其用作丰度的粗略测量。光谱计数的大幅增加约3–4倍与再现性的提高相结合,为依赖光谱计数的方法(如SAINT)提供更好的信噪比7。对于MEPCE和EIF4A2,这导致对33%以上相互作用蛋白的可靠检测(图1e)与诱饵蛋白的生物学功能相一致(补充表1,2;补充图7). 因此,即使仅与粗略丰度测量相结合,使用MSPLIT-DIA获得的灵敏度、再现性和光谱计数也会增加,从而提高相互作用检测的灵敏度。由于通用SWATH-Atlas库5甚至比特定于样本的库更擅长检测交互器(补充图6、7; 比DIA-Ampire更敏感2对于这些样品上的蛋白质鉴定),我们的结果还表明,随着更多光谱库公开可用,定制库的耗时生成或添加外部保留时间(RT)校准标准可能变得多余。

虽然我们将上述靶向提取工具与MSPLIT-DIA的敏感性进行了对比,但这些实际上是互补的方法(图1f,补充图8). 尽管目标提取工具在成对DDA样品生成的文库上表现相对较好(复杂度、仪器参数和色谱分辨率匹配;补充图2),大型通用SWATH-Atlas库不是这样的5(图1g;补充图9). 首先,我们表明,MSPLIT-DIA通过协助RT比对而无需添加标准物,极大地促进了靶向提取,因为在DIA序列中,MSPLET-DIA识别的肽作为比对标记物(“MSPLIT-DIA辅助RT比对”图1g补充图9). 第二,将目标量化搜索空间限制为仅MSPLIT-DIA识别的肽产生了更小的分析库,可以启用(Skyline)或系统改进(PeakView6、OpenSWATH1)目标提取结果(中的“MSPLIT-DIA库”补充图9). 总之,这些过程大大简化了高达88%由MSPLIT-DIA鉴定的肽的定量数据的目标提取,而不影响这些新鉴定的肽定量的再现性(补充图10). 目标提取工具的分析库由MSPLIT-DIA自动生成,以便于将敏感鉴定与DIA数据的准确量化相结合。

补充材料

补充数字

单击此处查看。(130万,pdf)

补充说明和表格

单击此处查看。(160万,pdf)

致谢

我们分别感谢B.MacLean、H.Röst和C.-C.Tsou以及A.Nesvizhskii在运行Skyline、OpenSWATH和DIA-Unimpire方面的帮助。这项工作得到了美国国立卫生研究院拨款2 P41 GM103484-06A1的支持,该拨款来自国家普通医学科学研究所(发给N.B.,J.W.),加拿大政府通过加拿大基因组和安大略省基因组研究所(送给A.-C.G.)以及加拿大卫生研究院(发给A.-C.G的基金会拨款)。N.B.是Alfred P.Sloan研究员。A.-C.G.是功能蛋白质组学加拿大研究主席和癌症蛋白质组学Lea Reichmann主席。J.-P.L得到了CIHR博士后奖学金和Lunenfeld-Tanenbaum研究所TD Bank健康研究奖学金的支持。

缩写

质谱/质谱串联质谱法
迪亚数据独立采集
DDA公司数据相关采集
MSPLIT公司利用已识别串联质谱库进行混合谱划分
PSM公司肽谱匹配
SSM公司光谱-光谱匹配
财务总监错误发现率
SRM公司选定反应监测

脚注

竞争性金融利益

S.T.是SCIEX的员工。N.B.拥有Digital Proteomics,LLC的股权,该公司可能会从研究结果中受益;Digital Proteomics LLC并未参与本研究的任何方面。加州大学圣地亚哥分校已根据其利益冲突政策审查并批准了该协议的条款。

作者贡献

J.W.和N.B.开发了MSPLIT-DIA;J.W.实现了该软件;B.L.和M.T.获得的质谱数据;J.D.R.K.、B.L.、S.T.和J.-P.L.帮助进行数据分析;N.B.和A.-C.G.监督该项目;J.W.、A.-C.G.和N.B.根据所有作者的意见撰写了手稿。

工具书类

1Rost HL等人。OpenSWATH支持对数据相关采集MS数据进行自动化、有针对性的分析。国家生物技术。2014;32:219–223.[公共医学][谷歌学者]
2Tsou CC,et al.DIA-Unimpire:数据相关获取蛋白质组学的综合计算框架。自然方法。2015;12:258–264.264之后为257页。[PMC免费文章][公共医学][谷歌学者]
三。李毅,等。Group-DIA:分析多个数据相关采集质谱数据文件。自然方法。2015[公共医学][谷歌学者]
4Kim S,等。CID、ETD和CID/ETD串联质谱对的生成函数:在数据库搜索中的应用。分子细胞蛋白质组学。2010;9:2840–2852. [PMC免费文章][公共医学][谷歌学者]
5Rosenberger G等人。通过SWATH-MS量化10000人类蛋白质的分析库。科学数据。2014;1:140031. [PMC免费文章][公共医学][谷歌学者]
6Lambert JP等人通过亲和纯化结合数据独立质谱采集绘制差异相互作用体。自然方法。2013;10:1239–1245. [PMC免费文章][公共医学][谷歌学者]
7Teo G,et al.SAINTexpress:INTeractome软件重要性分析的改进和附加功能。蛋白质组学杂志。2014;100:37–43. [PMC免费文章][公共医学][谷歌学者]