方法详细信息
MS样品制备
对U2OS细胞进行0、20、40、60和90分钟(n=3)的时程实验,并对含有1μM阿达沃沙提布的单时间点数据集进行0或90分钟(n=4)的处理。治疗后,根据Kulak等人,2014年),通过刮取和处理细胞。简单地说,使用100μL裂解缓冲液(6 M盐酸胍、10 mM TCEP、40 mM CAA、50 mM HEPES pH8.5)对收集的细胞进行裂解。样品在95°C下煮沸5 min,然后在4℃的Biorruptor超声波水浴(Diagenode)中进行5 x 30秒的高超声处理o个C.使用Pierce™Rapid Gold BCA蛋白质检测试剂盒(Thermo Fisher)测定蛋白质浓度后,取出200 ug进行消化。样品用10%乙腈按1:3稀释,50 mM HEPES pH 8.5,以1:50(酶蛋白比)的比例添加LysC(MS级,Wako),样品在37o个C持续4小时。用10%乙腈将样品进一步稀释至1:10,50 mM HEPES pH 8.5,以1:100(酶蛋白比)的比例添加胰蛋白酶(MS级,Promega),并在37o个C.通过添加2%的三氟乙酸(TFA)到最终浓度1%来抑制酶活性。在TMT标记之前,使用SOLAμ™SPE板(Thermo Fisher)对肽进行脱盐。吸附剂由40μl 100%甲醇(HPLC级,Sigma)、40μl 80%乙腈和0.1%甲酸活化。随后用40μL的1%TFA和3%乙腈使板平衡2x,然后加载样品。然后用200μL 0.1%甲酸清洗平板2次,用40%乙腈和0.1%甲酸将结合肽洗脱到干净的500μL Eppendorf管中。将洗脱的肽浓缩在Eppendorf-Speedvac中,并在50mM HEPES(pH8.5)中重新构成,用于TMT标记。根据制造商的说明使用TMTPro 16plex(赛默飞世尔)。标记以相同比例汇集的肽后,使用200μL Ti-IMAC HP(ReSyn Bioscience)富集磷酸肽。Ti-IMAC颗粒与200 L 70%乙醇平衡5分钟,然后与200μL 1%NaNH平衡三溶液10分钟。然后用200μL 80%乙腈、1M乙醇酸和5%TFA洗涤颗粒三次。将用80%乙腈、1M乙醇酸和5%TFA以1:1稀释的混合肽加载到颗粒上,并轻轻搅拌培养30分钟。然后除去上清液并作为蛋白质组样品保存。用400μL的80%乙腈、1%的TFA洗涤两次粒子2分钟,再用两次400μL 10%的乙腈0.1%的TFA清洗两次粒子。然后通过添加100μL 1%NaNH分三轮洗脱磷酸肽三溶液20分钟。然后用40μL TFA酸化洗脱的磷酸肽溶液,并稀释超抗原蛋白质组样品,以将乙腈浓度降至5%。然后使用SOLAμ™SPE板对肽溶液进行脱盐,然后将肽浓缩在Eppendorf Speedvac中。浓缩肽储存在-80o个C、。
在质谱分析之前,使用离线的ThermoFisher Ultimate3000液相色谱系统,在5μl/min流速下,使用高pH分馏(5mM碳酸氢铵,pH 10)对肽进行分馏。在120 min梯度(5%至35%乙腈)上分离30μg肽,每120秒收集一次组分。将所得60个组分合并成30个最终组分,用1%TFA酸化至pH<2,并根据制造商的方案装载到EvoSep阶段。对于富集的磷酸肽,将组分的数量调整为可用磷酸肽的总量,以确保每个组分的收集量为~500ng。
MS数据采集
TMT标记的样品
在EvoSep One仪器上,使用预设的“每天30个样本”或“每天15个样本”方法对每个组分的肽进行分析。在44-min梯度上洗脱全球蛋白质组肽,并使用DD-MS2方法运行的Q-Exactive Exploris 480仪器(Thermo Fisher Scientific)进行分析。以120000的分辨率采集了完整的MS光谱,AGC靶为3×106或最大注入时间为50 MS,扫描范围为350–1500 m/z。MS2光谱以45000的分辨率获得,AGC目标值为1×105或最大注射时间为86 MS,归一化碰撞能量为32,强度阈值为1e5。第一个质量设置为110 m/z,以确保捕获TMT报告离子。动态排除设置为60秒,排除电荷状态<2、>6和未知的离子。对于磷酸化肽,梯度长度加倍至88分钟。通过运行复合细胞裂解物质量控制标准验证MS性能的一致性,并监测色谱以检查再现性。
TMT定量蛋白质组学分析
使用Proteome Discoverer 2.4分析原始文件。在处理和共识步骤中启用TMT报告离子定量,并将光谱与UniProt获得的9606人类数据库进行匹配。蛋白质N端的动态修饰设置为氧化(M)、脱酰胺(N,Q)和乙酰。半胱氨酸氨基甲酰(C残基)和TMTPro(肽N末端和K残基)被设置为静态修饰。将所有结果过滤至1%FDR,使用内置报告离子量化器进行蛋白质定量,并使用内置t检验进行统计显著性测试。
无标签量化
用于无标签定量的样品按上述方法处理。在EvoSep One仪器上使用“每天20个样本”的方法分析磷酸蛋白质组和蛋白质组肽,并在运行高分辨率MS1数据相关采集方法的Q-Exactive Exploris 480仪器(Thermo Fisher Scientific)上分析。在120 000下收集全质谱,AGC目标为3x10ˆ6或最大注入时间为50 MS。扫描范围为400-1000 m/z。MS2光谱是以60000分辨率获得的,AGC目标为10e5。使用75个8 m/z的窗口,每200 m/z进行一次MS1扫描。原始文件是使用Spectronaut 16软件进行的分析。
数据规范化和统计测试
蛋白质组丰度用于蛋白质组和磷酸蛋白质组的磷酸肽丰度。数据规范化分两步进行。首先,通过将丰度乘以样本特定比例因子来调整样本装载量:
在哪里?是样本的比例因子我,
是所有样本的平均丰度总和,以及是样品的丰度i、。随后,为每个复制生成人工内部参考标准物的蛋白质/肽特定比例因子,并用于归一化,以减少由于生物复制处理引起的变化:
在哪里?是蛋白质/肽的人工参考标准j个在生物复制中我和n个是生物复制中独特条件(时间点)的数量。然后计算生物复制比例因子,类似于用方程式3和4.在哪里是整个数据集的人工参考标准,其中米是生物复制的数量是鳞片因子蛋白质/肽j个在生物复制中i、。最后,蛋白质/肽丰度得到校正乘以比例因子,根据方程式5使用limma统计软件包鉴定出显著改变的磷酸肽。69
激酶活性推断
根据通过Omnipath下载的PhosphoSitePlus和SIGNOR数据库,首先用激酶注释检测到的磷酸化,计算相对激酶活性。25磷灰石丰度是按肽顺序缩放的,以防止通过推断推断出整体位置丰度。通过将数值与Stouffer相结合来计算相对激酶活性Z轴每个样本的评分方法:
哪里,RKA公司是相对激酶k个活动,S公司是特定激酶的磷酸肽的标度丰度k个和n个是与激酶对应的磷脂酶数量k个在数据集中。使用以下形式的线性模型计算每个样本的平均RKA得分对于每个时间点,假设RKA分数遵循正态分布。其中y是一个包含特定激酶RKA分数的向量,S是表示哪个分数属于哪个样本的设计矩阵,以及包含每个条件的拟合平均RKA得分的向量。
蛋白质磷酸化动态分析
为了识别磷酸化的模式,使用了动态模糊c-均值聚类。70在聚类之前,丰度是按肽方向进行缩放的。使用软件包中的内置函数计算最佳参数。用参数n=8和c=2进行聚类。Michaelis-Menten方程用于对集群7和集群8进行建模。
y–是WEE1抑制后的标度磷酸肽强度和x-时间。使用非线性最小二乘法拟合V(V)米和英国。
基序分析的二项式概率模型
二项式概率模型31用于生成特定位置的评分矩阵(PSSM),并使用“ggseqlogo”包可视化序列基序。71通过计算过重或欠重概率之比的对数优势来评估特定位置的残差分数:
是氨基酸一残留物在图案中的特定位置刻痕,N个–是该位置的所有残基的总数(或所用氨基酸序列的总数),K–是观察到的残留物计数一在特定位置,对–是残基的背景氨基酸频率一各概率计算如下:
背景氨基酸频率计算
蛋白质无序区中的磷酸化位点,为了避免用频率高度依赖于蛋白质无序的残基丰富我们的基序,我们计算了UniProt获得的人类蛋白质组中所有蛋白质氨基酸序列的无序分数,72通过“idpr”R包使用IUPred2A算法(McFadden和Yanowitz,未审查)。仅使用紊乱分数高于0.4的残基计算背景氨基酸频率,如下所示:
A类我是氨基酸的计数我,T是总氨基酸的计数。这两个值均经过无序倾向过滤。
位置特定的评分矩阵构造
我们通过为已知磷酸化位点两侧的氨基酸序列构建位置特异性评分矩阵(PSSM)来预测未知磷酸化位点的激酶。我们通过Omnipath从磷脂酶簇和SIGNOR数据库中提取磷酸化位点。只考虑了具有2个以上促凝作用的位点,而PSSM仅针对过滤后至少具有20个磷酸化位点的激酶生成。然后从UniProt数据库下载的全长蛋白质氨基酸序列中提取磷酸化位点(+/-10)周围的氨基酸序列。然后使用二项式概率模型计算生成21x20矩阵的所有可能位置的每个氨基酸的得分。然后使用以下等式对每个激酶的磷酸化位点进行评分:
在哪里?S公司是给定激酶PSSM的磷酸化位点得分RS系列是氨基酸的二项式概率模型得分一在位置b。为了确保激酶之间的可比性,使用逻辑回归来校准激酶评分。然后将已知的磷酸化位点(无需筛选)分离为80%的训练数据集和20%的测试数据集。由于使用了一些测试数据集示例来生成PSSM,因此精度特性将有良好的偏差,但测试集对逻辑回归步骤进行了良好的健全性检查。由于逻辑回归对不平衡数据集很敏感,我们使用下采样,以匹配用于逻辑回归的正负实例数。使用广义线性建模将logistic回归函数与logit链接函数拟合:
CDK1、CDK2和CDK5的预测精度是通过使用“pROC”软件包的受试者工作特性分析进行的分析。73
CDK底物磷酸化动力学的比较
直接比较“慢”和“快”CDK底物之间磷酸化位点氨基酸频率两侧氨基酸残基的偏好。为了在比较中获得不确定性度量,我们使用了自举方法。将带有侧翼氨基酸序列的磷酸化位点从簇中进行100次采样,以生成不同成分的重采样数据集。然后计算每个数据集的氨基酸频率,并从“快”中减去“慢”簇频率。然后计算每个氨基酸在所有可能位置的频率差的平均值和标准偏差。在零假设下,频率差应该是0,为了验证这一点,我们计算了从由平均值0和氨基酸位置特异性标准差参数化的正态分布观察到计算的频率差的概率。
正则表达–[R/K]-x-[L/V/I]用于识别全长蛋白质氨基酸序列中的所有潜在Cy基序。在修饰的左侧和右侧提取与检测到的磷酸化位点紧密相连的Cy基序。通过将距离归入直方图或生成累积质量函数来可视化距离。使用Kolmogorov-Smirnov检验检验统计显著性。
基因集过度表达分析
使用ClusterProfiler R软件包进行基因集过度表达分析。74检测到的磷酸蛋白用作表征分析的背景。生物途径(BP)和细胞分区(CC)基因集的富集测试。由于这些基因集不能解释PTM,所以使用了简单的蛋白质加入条目来代替修饰。
基于定量图像的细胞术
在96孔微孔板(Greiner BIO)上生长的细胞用不同的药物和基因毒性剂组合处理不同的时间间隔。经过适当的处理后,迅速去除培养基,将细胞培养在预提取缓冲液(25 mM HEPES、pH 7.5、50 mM NaCl、1 mM EDTA、3 mM MgCl2、300 mM蔗糖和0.5%Triton X-100)中,放在冰上培养2分钟,并在室温下立即固定在4%甲醛(VWR)中10分钟。为了分析有丝分裂细胞数量,省略了预提取步骤。初级抗体(γH2AX 1:300;细胞信号技术,RPA 1:200;Sigma-Aldrich和53BP1 1:1000,Novus Biotechnology)在含有10%FBS和5%牛血清白蛋白(BSA;Sigma)的过滤DMEM中稀释。在RT下用一级抗体孵育1小时。用0.05%PBS-Tween20清洗微板三次,并在含有次级荧光标记抗体(Alexa荧光染料(1:1000;Thermo Fisher Scientific)和DAPI(0.5 mg/mL;Sigma-Aldrich)的DMEM/FBS/BSA中培养1小时。图像由ScanR采集软件自动采集,该软件控制着一台电动奥林巴斯IX-83宽视野显微镜。奥林巴斯通用计划Super Apo 10x目标用于所有QIBC数据。然而,使用40倍物镜获得了53BP1病灶图像。使用ScanR图像分析软件对DAPI(任意单位:A.U.)的总核像素强度和γH2AX、染色质结合RPA和53BP1病灶的平均核强度(总像素强度除以核面积)进行图像处理和量化。然后使用R统计软件进行进一步分析。通过比较信号强度分布,采用Kolmogorov-Smirnov检验确定统计显著性。
免疫印迹法
细胞在含有EDTA游离蛋白酶抑制剂混合物(Roche)和2mM DTT的RIPA(Sigma)缓冲液中进行裂解。用生物破坏者超声装置对裂解液进行10个周期的超声处理,每次30秒,每次30 s。将裂解液在20 000 RFC下4C离心15分钟。然后用Bradford分析法测量蛋白质浓度,并相应调整,以确保负载相等。将裂解液与4x LSB混合,并在95°C下煮沸10 min。根据制造商说明,在NuPAGE Bis-Tris 4-12%凝胶上运行样品。然后将蛋白质转移到硝化纤维素膜上,并用PBS+0.1%吐温+5%奶粉+0.01%NaN封闭三并在4℃与初级抗体一起孵育过夜o个C.然后在PBS+0.1%吐温中清洗膜3 x 6 min,并在室温下与二级HRP结合抗体孵育1 h。再次用PBS+0.1%吐温清洗膜3x6分钟,并用Classico/Crescendo Western HRP底物培养3分钟。在Amersham Hyperfilm/AGFA Curix Ortho薄膜上观察到蛋白质条带。
数据分析
使用tidyverse环境在统计R软件中进行数据分析75除非另有说明。用于数据分析的所有自定义代码都已保存到存储库中。