跳到主要内容

整合数千个PTEN变异活性和丰度测量结果,揭示了癌症中的变异亚群和新的显性阴性

摘要

背景

PTEN是一种调节细胞生长、免疫信号、神经元功能和基因组稳定性的多功能抑癌蛋白。实验表征有助于指导在患者中观察到的数千种种种系或体细胞PTEN变体的临床解释。最近公布了两个大规模突变数据集,一个是PTEN变异细胞内丰度的4112个错义变异,另一个是脂质磷酸酶活性的7244个变异。这些数据集的综合信息可以揭示各种临床表现背后的差异特异性表型,但这尚未得到全面检查,尤其是在癌症中观察到的体细胞PTEN变体。

方法

在这里,我们通过测量764个新PTEN变异体的细胞内丰度,并对3351个先前研究的变异体进行丰度测量,从而增加了这些努力。我们使用这个扩展和完善的PTEN丰度数据集来探索控制PTEN细胞内丰度的突变模式,然后结合磷酸酶活性数据将PTEN变体细分为四个功能不同的组。

结果

该分析揭示了一组高度丰富但脂质磷酸酶缺陷的变体,这些变体可以以显性阴性的方式抑制PTEN活性。事实上,其中两个变体能够在含有WT-PTEN等位基因的细胞中失调Akt信号。在多个乳腺或子宫肿瘤中观察到这两种变体,证明了这些高丰度、非活性变体与疾病的相关性。

结论

我们表明,多维、大规模变异功能数据与公共癌症基因组数据集和后续分析相结合,可以提高对非特征化癌症相关变异的理解,并更好地了解它们如何促进肿瘤发生。

背景

基因组和外显子组测序显示,个体共同拥有数百万种系和体细胞蛋白编码变体[1,2]. 解释每个观察到的变异的功能结果是个性化基因组医学的一个主要瓶颈。错义变体的解释尤其困难,因为目前报道的所有种系错义变体中只有约2%具有临床解释[]对绝大多数种系和体细胞错义变异体的致病潜力缺乏决定性的认识[4]. 计算方法很有用,但缺乏在临床环境中自信地解释给定蛋白质变体的影响所需的高精度。因此,模型系统中蛋白质变体的实验表征为解释人类变体的影响提供了强有力的方法。

传统的实验性分析一次测量一个变体的影响,但缺乏描述每种疾病相关蛋白中可能存在的数千个错义变体所需的吞吐量。变体效应的多重分析(MAVEs),如深度突变扫描(DMS),通过同时测量数千个变体对特定功能或细胞特性的影响来解决这个瓶颈[5]. 不幸的是,许多疾病相关蛋白具有多种功能,一般来说,没有一个大规模的变异效应数据集能够捕获所有这些功能。因此,可能需要多个不同的大规模变异效应数据集来准确地确定此类蛋白质中的表型变异。

例如,PTEN是一种多功能的、与疾病相关的蛋白质,在这种蛋白质中,单个分析无法充分捕获其编码变异的影响[6]. 这个PTEN公司该基因编码一个403氨基酸抑癌蛋白,其脂质磷酸酶活性催化生长型磷脂PtdIns(3,4,5)P的转化PtdIns(4,5)P的替代形式2PTEN在基因组维护、DNA修复和细胞形态方面也具有蛋白磷酸酶依赖性和独立性作用[6]. 因此,生殖系PTEN公司-编码变异与一系列发育异常有关,包括Cowden综合征(MIM:158350),属于总括术语PTEN公司错构瘤肿瘤综合征(PHTS)。PTEN公司种系变异也与巨头自闭症谱系障碍(MIM:605309)有关,其多效性效应可导致其他表型,如免疫功能障碍。体内变异PTEN公司常见于多种癌症[7]. 尽管进行了深入的研究,但PTEN每种功能的改变影响其各种作用并导致每种疾病的机制仍不清楚[8].

一对最新的MAVE分别测量PTEN的一个单独属性,根据每个属性对大量PTEN变体进行分类。我们通过大规模平行测序(VAMP-seq)使用变异丰度来测量4112个PTEN错义变体在培养的人源性细胞系中过度表达时的稳态丰度[9]. 同时,另一个小组测量了7244个PTEN错义变异体在酵母中过度表达时的脂质磷酸酶活性[10]. 这两项研究都描述了他们测量的PTEN属性的扰动如何与疾病相关,并且这两个功能数据集都对变量分类有影响,通过将数据与计算变量效应预测结果进行比较来找出差异[11]或利用这些数据开发更好的PTEN特异性变异致病性预测因子[12].

在这里,我们使用VAMP-seq来测量764个之前未测量的额外变体丰度得分,并将额外数据添加到3351个之前测量的变体中。我们使用这个更全面的PTEN丰度数据集来探索控制PTEN细胞内丰度的突变模式,然后结合磷酸酶评分将PTEN变体细分为四个功能不同的组。这项分析揭示了一组高度丰富但有脂质磷酸酶缺陷的变体,它们可以以显性负向方式抑制PTEN活性。我们验证了其中两个变体确实能够在含有WT-PTEN等位基因的细胞中失调Akt信号。在癌症基因组数据库中编目的多个乳腺或子宫肿瘤中观察到这两种变异,证明了高丰度、非活性变异子集的疾病相关性,这些变异可通过分析成对的大规模活动和丰度数据进行识别。因此,我们表明,当多维、大规模的变异功能数据与公共癌症基因组数据集和后续分析相结合时,可以提高对非特征化癌症相关变异的理解,并更好地了解其促进肿瘤发生的特征。

方法

质粒

pCAG-NLS-HA-Bxb1(Addgene#51271)质粒是Pawel Pelczar博士(瑞士苏黎世大学)赠送的。含有PTEN cDNA序列(NCBI登录号NM_000314.8)的attB-PTEN-HA-IRES-mCherry质粒通过反向PCR和Gibson组装进行了修饰[13]创建用于phospho-Akt1 Western blotting测试的各种变体(附加文件1:表S1)。

辅助PTEN库生成

我们之前确定,原始丰度数据集稀疏的最大原因是文库生成过程中蛋白质变体的丢失[9]. 因此,我们试图创建一个二级补充库,能够提供原始库中缺少的变体。我们从原始PTEN位点饱和突变文库中鉴定了20个可能的蛋白编码密码子中的5个或更少的密码子,并重新扩增了最稀疏的192个位置。我们使用了一组更宽松的扩增参数和更高的循环数来优化这些弱表示密码子的覆盖范围。在每个密码子的单独试管中,135 pg attB-EGFP-PTEN-IRES-mCherry-562bgl质粒用于10μL Kapa-HiFi反应,最终浓度为0.5μM正向和反向引物,最终浓度5%二甲基亚砜(DMSO)。这些反应在95°C下变性3分钟,在98°C下循环25次20秒,52°C下15秒,72°C下3分钟,最后在72°C延长3分钟。我们在含有SYBR Safe的1%琼脂糖凝胶上,在130V电压下,每10μL反应2μL,持续30分钟。ImageJ用于量化每个密码子的正确大小的扩增子数量。ImageJ数量用于使所有密码子扩增子均匀混合。

使用DNA Clean&Concentrator-5试剂盒(Zymo Research)对混合物进行清洗和浓缩。然后使用T4 PNK(NEB)将清洁后的产物磷酸化,然后使用T4-连接酶(NEB。使用DpnI(NEB)消化野生型质粒模板。再次清洁并浓缩最终结扎产物,并使用10-βelectromax细胞(NEB)进行转化。取最后50 mL培养物的小样本(在可能发生加倍之前),并进行电镀,以评估转化的大致大小。我们选择建立一个包含约17500个转化子的库。为了去除小的背景质粒,我们使用限制性内切酶XbaI和EcoRI-HF(NEB)将文库移到编码卡那霉素抗性的最终attB-EGFP-PTEN-IRES-mCherry-562bgl-KanR载体中。按照之前的操作添加条形码[9],使用IDT订购的底漆组,并使用Klenow(-exo)(NEB)填充。使用SacII和EcoRI-HF(NEB)插入条形码引物。通过使用SacII和XbaI(NEB)消化ORF和相关条形码,为PacBio测序准备最终文库,并使用PacBio模板制备试剂盒1.0(Pacific Biosciences)进行处理。

文库质粒的Illumina测序

如前所述,质粒库的条形码测序也已生成[9]. 简单地说,在50μL Kapa HiFi反应(Roche)中扩增50 ng最终midi-preped(Sigma-Aldrich)质粒,并在技术副本中添加适配器。这些反应在95°C下变性3分钟,在98°C下循环5次20秒,在60°C下进行15秒,在72°C下最后延长3分钟。使用AMPure XP珠(Beckman-Coulter)清洁适配器反应。在50μL Kapa Robust反应(Roche)中添加单个指数和Illumina聚类生成序列。这些反应在95℃下变性3分钟,在95℃循环25次15秒,60℃循环15秒,72℃循环15秒钟,最后在72℃下延长3分钟。将技术副本按体积混合,在1%琼脂糖凝胶上与SYBR Safe混合,并使用冷冻挤压柱(Bio-Read)提取凝胶。使用Kapa Illumina定量试剂盒(Roche)对产品进行定量,并使用NextSeq 500/550高输出v2 75循环试剂盒(Illumana)在NextSeq 500上进行测序。序列读取被解复用,并用bcl2fastq转换为FASTQ格式。使用ea-utils包中的fastq-join工具连接条形码配对测序读取[14]使用默认参数。将这些技术复制扩增和测序运行的FASTQ文件串联起来,用于与Enrich2的分析[15]. Illumina测序显示,该文库中约有33274个独特的条形码。

变量表达式和排序

除非另有说明,否则所有细胞培养试剂均从赛默飞世尔科技公司购买。HEK 293T LLP-iCasp9-Blast克隆12细胞系[16]用于所有细胞培养实验。这些细胞在添加有10%胎牛血清、100 U/mL青霉素和0.1 mg/mL链霉素的Dulbecco改良Eagle's培养基中培养。为了从Tet-诱导型启动子诱导表达,在培养基中添加2μg/mL多西环素(Sigma)。用0.25%胰蛋白酶-乙二胺四乙酸分离细胞进行常规传代。

在文库实验中,通过四个6孔板转染了总计600万个HEK 293T LLP-iCasp9-Blast克隆12细胞。每个6孔接种250000 293T细胞,并在无强力霉素培养基中与1500 ng pCAG-NLS-Bxb1、1500 ng attB-EGFP-PTEN-IRES-mCherry-562bgl Fill-in文库质粒和6μL Fugene 6(Promega)混合。转染后两天,将培养基切换为含有Dox的培养基。第二天,将AP1903/Rimiducid(MedChemExpress)添加到10nM的最终浓度。第二天交换培养基以去除濒死的细胞。存活的细胞被汇集到T175板中,并通过大约1周的时间,然后将部分选定的细胞冷冻保存。对剩余的细胞进行增殖和处理,以进行荧光激活细胞分选。

图书馆分类实验如前所述进行[9]. 简单地说,用Versene溶液(PBS中0.48 mM EDTA)将重组细胞从平板上取下,以尽量减少胰蛋白酶消化过程中的结块。细胞以300倍的速度造粒3分钟后,再次悬浮在分选缓冲液中(1X PBS+1%热灭活FBS、1 mM EDTA和25 mM HEPES,pH值7.0),并通过35μm尼龙网过滤。细胞在BD FACSAria III机器上使用85μm喷嘴进行分类,并配备FACSDiva软件。用405-nm激光激发mTagBFP2荧光,并通过450/50nm带通滤波器检测。EGFP荧光用488-nm激光激发,通过505-nm长通和530/30-nm带通滤波器后检测。mCherry荧光用561-nm激光激发,通过600-nm长通和610/20带通滤波器后检测。所有事件都必须通过FSC-a和SSC-a活细胞门,然后通过FSC-a和FSC-H门来识别单倍体。通过门控mTagBFP2阴性、mCherry阳性细胞分离重组细胞。通过这些门的单元格最终被传递到BD FACSDIVA软件中的FITC:PE–Texas Red比率参数中,在该参数中,门被绘制出来,以根据其比率将单元格分为均匀填充的四分位。进行了三次复制整合,并对重组子进行了分类(附加文件1:表S2)。

分类细胞的Illumina测序

如前所述,还对基因组集成文库中的条形码进行了扩增和测序[9]. 在第一个培养步骤中,使用Qiagen DNeasy柱并添加RNAse-A(ThermoFisher Scientific)从细胞中分离包括重组质粒的基因组DNA。首先使用Bxb1重组位点的一个引物5′和条形码的适配引物3′扩增基因组DNA,以确保未重组质粒不会被扩增。这些是Kapa Hifi(Roche)中50μL的技术重复反应,理想情况下含有但不超过2.5μg的基因组DNA。这些反应在95°C下变性3分钟,在98°C下循环5次20秒,65°C下15秒,72°C下2分钟,最后在72°C延长3分钟。使用AMPure XP珠(Beckman-Coulter)清洁适配器反应。在BioRad MiniOpticon上使用SYBR Green I在50μL Kapa Robust反应(Roche)中添加单个指数和Illumina簇生成序列。这些反应在95℃下变性3分钟,在95℃循环20次15秒,60℃循环15秒,72℃循环15秒钟,最后在72℃下延长3分钟。基于相对荧光单位混合索引扩增子,在1%琼脂糖凝胶上用SYBR Safe运行,并使用冷冻和挤压柱(Bio-Rad)提取凝胶。使用Kapa Illumina定量试剂盒(罗氏)对产品进行定量。

复制筛选器

我们测试了一个复制过滤器(代码位于https://github.com/MatreyekLab/PTEN_composite网站) [17]其中,必须在最少数量的重复中观察到变体才能通过过滤器。为了确定此复制过滤器应该使用的理想值,我们执行了一个测试,在该测试中我们依次测试了复制过滤器的所有可能值(0到15)。只有在复制筛选值或以上观察到的变体被认为通过了筛选,并且在少于筛选值的复制中观察到的变量被删除。对于每个复制筛选阈值,我们询问无意义变异分数的95%置信区间的上限是否与同义变异分数的最低5%重叠。如果没有,则认为得分正确。作为对照,我们对同义和无义变量得分进行了重新取样,但随机化了得分与得分乘积的重复次数之间的关联。每个复制过滤器值使用引导程序重复此过程100次。用于执行此过程的代码在Github存储库中提供。所有PTEN变体丰度得分的数据表包含在附加文件中2:表S3。

结合丰度和活动得分

对于脂类磷酸酶活性,我们将分析局限于归类为WT-like磷酸酶活性的变体,对应于同义变体的低95%(活性分数高于10-1.11),和失去活动,对应于无意义变体的上95%(活动得分低于10-2.13). 这两个值都被用作原始手稿的截止值[10]. 为了便于与丰度数据进行比较,重新调整磷酸酶评分,使平均无意义变异评分设置为零,WT设置为1。

公共数据的获取

2021年4月15日,从ClinVar网站上访问了PTEN错义和无义变体,并对其进行了人工筛选,以确定是否存在单密码子变化。2021年4月15日,从SFARI基因平台获取了与孤独症谱系障碍(ASD)相关的PTEN变体,并对其进行了单密码子变化筛选[18]. 从GnomAD v2.1.1(非TOPMed)获取人群中发现的PTEN错义和无义变体[1]2021年4月20日,以及来自TOPMed Freeze 8和Bravo数据库(https://bravo.sph.umich.edu/freeze8/hg38/) [19]2021年4月20日。对于体细胞变异分析,PTEN错义和无义变异取自cBioPortal上的“非冗余研究精选集”[20,21]从184项研究中提取,对应48035个样本。这些是从两个TCGA手动管理的[2]和非TCGA研究,没有重叠样本。我们还从单独的AACR GENIE数据库中提取了样本[22](也可通过cBioPortal访问),对应于另外4项研究,106908名患者和115754份样本。本研究中使用的克利夫兰诊所队列数据是根据Mighell等人发布的补充表格计算得出的[12]. 正如最初的研究所指出的,CC队列由256个具有种系PTEN非同义变体的预期累积个体组成,其中145个个体编码错义变体,其余111个个体编码无义变体。

蛋白质印迹

HEK 293T LLP-iCasp9-Blast克隆12[16]用1.5μg pCAG-NLS-HA-Bxb1和1.5μg attB-PTEN-HA-IRES-mCherry质粒转染细胞,该质粒编码WT-PTEN或使用6μL Fugene 6的PTEN变体,不含强力霉素。转染四天后,将细胞切换到含有多西环素的培养基中,并加入10nM的AP1903以杀死未重组的细胞。用0.25%胰蛋白酶-EDTA收集每个汇合液6孔,在PBS中洗涤,并用50μL裂解缓冲液(20 mM Tris pH 8.0、150 mM NaCl、1%Triton X-100和蛋白酶抑制剂鸡尾酒(Sigma-Aldrich))在4°C下培养10分钟。以21100倍的速度旋转溶解的细胞在4°C下保持10分钟,将上清液收集到单独的试管中。将12μL澄清的裂解液与4μL 4x样品负载染料混合,并使用Spectra Multicolor Broad-Range Protein Ladder(ThermoFisher Scientific)在MOPS缓冲液中的NuPage 4–12%Bis-Tris凝胶(Invitrogen)上分离。使用GENIE®电泳转移盒(Idea Scientific)将分离的蛋白质转移到聚偏二氟乙烯膜上。在含有0.1%吐温-20的三缓冲盐水(20 mM tris,150 mM NaCl)中的5%奶粉中隔夜封闭膜。

用1:2000稀释的抗磷酸-AKT(p.Thr308;13038;Cell Signaling Technology)对每个膜进行Western blot,然后用1:4000稀释的抗兔HRP(NA934V;GE Healthcare)进行检测,再用1:2000倍稀释的抗泛-AKT进行检测(2920;Cell信号技术),最后用1:5000稀释的抗鼠HRP进行检测(NA931V;GE Healthcare),1:5000稀释的抗HA-HRP(3F10;罗氏),或1:2000稀释的抗β-肌动蛋白-HRP(ab8224;Abcam),使用SuperSignal West Dura延长基材(ThermoFisher Scientific)。

统计分析

皮尔逊的第页和斯皮尔曼的ρ使用R中的基函数计算。工作中使用的线性模型是使用R中lm()基函数计算的。在引导复制过滤器分析中使用的置换测试如上所述,并使用上述Github存储库中的R Markdown文件进行编码和完全可复制https://github.com/MatreyekLab/PTEN_composite公司[17].

在癌症基因组数据中,PTEN变异亚群的零分布是在不使用癌症特异性突变特征的情况下确定的,因为我们之前观察到,当使用肿瘤特异性转移和颠倒率来估计零分布时,丰度得分的分布几乎没有影响[9]. 为了创建空分布,使用Python脚本计算将PTEN cDNA中的每个核苷酸替换为其他每个核苷酸,从而生成所有可能的单核苷酸变体的列表,并且每个密码子都经过计算翻译。同义变体已从列表中删除。然后,该列表被分解为独特的错义和无意义变体,这些变体还根据密码子表的简并性给出了表示频率。随后,根据每个变体的丰度和活性表型,将错义和无义变体频率表划分为子类,并添加变体频率,以在没有选择的情况下提供预期类别频率的零估计。

结果

PTEN丰度的突变耐受模式

我们之前开发了VAMP-seq,这是一种通用的方法,可以同时测量数千种错义蛋白变体对细胞内丰度的影响[9]. 在VAMP-seq中,每个细胞表达一种不同的蛋白变体,直接融合到荧光蛋白,如增强型绿色荧光蛋白(EGFP),因此每个细胞的荧光水平与该蛋白变体的稳态丰度成正比。将单拷贝、定点基因组整合到HEK 293T着陆垫细胞系中,可以以集合的形式表达数千种蛋白变体的文库[23]. 然后使用荧光激活细胞分选(FACS)将汇集的细胞分为四个分级荧光箱。高通量DNA测序用于量化每个变体在四个箱子中的分布,并对该分布进行分析,以得出每个变体的丰度得分。迄今为止,VAMP-seq已应用于五种蛋白质:PTEN[9]、TPMT[9],NUDT15[24],VKOR[25]和CYP2C9[26].

为了补充我们最初测量的4407个PTEN变体的丰度[9],我们生成了一个新的PTEN库,重点放在初始实验中覆盖率低的位置(附加文件1:图S1A、B)。我们使用简并NNK引物对198个低覆盖位点进行扩增,将得到的PTEN变异文库与EGFP融合,并用唯一的核苷酸条形码标记每个质粒。我们将该库引入改进的HEK 293T着陆垫细胞系[14]通过使用内置的iCasp9盒触发培养物中未修饰细胞的凋亡,可以快速富集表达文库的修饰细胞。我们使用该文库进行了七次重复的VAMP-seq实验,获得了该二级文库中4186个独特变体的额外丰度数据。在最初和新的实验中,在5个或更多重复中观察到272个变体,这些重叠变体的丰度得分具有很好的相关性(Pearson’s第页20.70,图。1A) ●●●●。与重叠变异体得分相匹配的线性模型斜率为0.89,截距为0.11,这表明两个库的丰度得分可以合并,而无需额外的归一化步骤。

图1
图1

4721个PTEN变异体的稳定细胞丰度数据。A类对原始和新PTEN丰度库中5个或更多重复中观察到的变异进行独立评分并进行比较。灰线:斜率为1,截距为0的理想相关性。紫色线:观察到斜率为0.9,截距为0.1的相关性。B类在组合数据集的4个或更多副本中观察到的所有变体子集的丰度得分。C类对具有17个或17个以上得分错义变异体的PTEN高覆盖位置的突变耐受模式进行评估,并显示在以丰度得分着色的聚集热图中。未评分的变量用灰色表示。WT残留物用黑点标识。位置根据其突变耐受模式通过层次聚类进行排序,相应的树状图显示在底部。D类PTEN晶体结构(1d5r)上Arg173和Asp326侧链的球状和棒状表示,PTEN畴间边界处的氢键网络导致Arg173和Asp32对取代完全不耐受。氮原子是蓝色的。氧原子被染成红色。水分子被染成品红色。预测的氢键用黄色虚线表示。Gly251转向面向域间接口,如图顶部所示

因此,我们汇总了初始库和新库的丰度得分(附加文件1:图S1C)。我们通过取在4次或4次以上复制中观察到的变体的所有复制分数的平均值来创建一个复合丰度分数,这是我们使用同义变体和无义变体分离的排列测试设置的阈值(附加文件1:图S2)[17]. 正如预期的那样,由两个或更多唯一密码子编码的变体数量随着复合数据集的增加而增加(附加文件1:图S3A)。4721个变体的最终过滤数据集包括174个同义变体、160个无义变体和4387个错义变体,包括764个在初始实验中未得分的变体(图。1B) ●●●●。在初始实验中得分的3904个变体得到了适度细化的分数,降低了许多变体的变异系数(附加文件1:图S3B)。这导致变异系数小于0.5的变体数量净增加12.5%(附加文件1:图S3C)。我们将修订后的分数与一组24个PTEN变异体进行了比较,我们分别评估了原始手稿中的稳态丰度,虽然相关系数没有随着修订后的得分而改变,但这可能是因为与原始数据的相关性已经很高(斯皮尔曼ρ2= 0.93; 其他文件1:图S3D)。总之,自信地指定低丰度分类的变体数量从1260个增加到1423个,自信地分配WT-like分类的变体的数量从1577个增加到1738个变体(附加文件1:图S3E)。因此,随着细胞和库工程方法的改进,VAMP-seq数据集可以通过包含新变体的额外复制来支持,并且可以重新分析现有数据集以创建更完整和准确的数据集。

复合丰度数据集的一个优点是具有高变异覆盖率的位置数量增加,揭示了每个位置可耐受的氨基酸替代模式。复合数据集包括61个位置,其中约90%的错义变体被评分(从最初的50个位置增加),22个位置被完全覆盖(从原来的9个位置增加了)。我们对高覆盖位置丰度得分进行了层次聚类,得出了不耐受、部分耐受和耐受位置组(图。1C) ●●●●。大约一半(n个=33)个位置几乎都能耐受替换。相比之下,15个职位对替换有部分容忍度,而其余13个职位则不容忍。残留物Arg173、Gly251和Asp326几乎完全不能替代(图。1C) ●●●●。所有这三个残基都位于PTEN磷酸酶和C2结构域之间的界面上,这表明这些位置的WT氨基酸的特定特征对于保持界面完整至关重要。与此假设一致,Arg173和Asp326在PTEN结构中进行了广泛的极性接触(图。1D) ●●●●。除His61外,其余不耐受位点编码苯丙氨酸、异亮氨酸、亮氨酸或缬氨酸残基,仅部分耐受其他庞大的疏水性侧链(图。1C) ●●●●。

缺失数据通常使用机器学习进行计算插补,以生成特定下游分析所需的完整数据集[27,28]. 最近的一项研究在训练PTEN变异效应和分子表型的逻辑回归分类器之前,估算了缺失的PTEN丰度数据[12]. 在我们改进的数据集中,对693个估算丰度值进行了评分,从而可以独立确认估算的准确性。我们检查了估算丰度数据和从第二个库中新获得的数据之间的相关性,发现估算值和实验测定值之间存在适度的相关性和标度(斜率:0.53;皮尔逊第页2:0.54;其他文件1:图S4)。这与作者在初始插补算法与初始丰度数据集(Pearson’s第页2: 0.56). 低于预期的斜率在很大程度上可以用插补数据的比例差异来解释,范围从0.25到1,而测量值从0到1。

接下来,我们研究了插补不当的位置,以更好地理解插补算法难以准确预测丰度得分的情况。Arg173和Gly251的变体是早先强调的几乎完全不能替代的三个位置中的两个,它们被错误地插补为中等丰度分数,可能是因为我们的分析表明这些WT残基对维持PTEN丰度异常关键(图。1C、 品红色三角形)。脯氨酸残基的估算值通常较低,即使是像Pro103和Pro248这样的残基,这些残基很容易被取代,并且产生了许多具有WT-like评分的变体(图。1C、 蓝色三角形)。该算法还与Tyr180、Leu182和Asp268进行了斗争,这些残基是部分耐受替代的残基,并根据变体显示出广泛的丰度得分,而插补值大致接近位置平均值(图。1C、 青色三角形)。通过提供额外的实验数据和减少对插补的依赖,我们在此提供的额外丰度数据将提高丰度数据下游使用的准确性。

PTEN变异体的丰度和活性分类

我们的复合丰度评分,以及在酵母中测量的PTEN脂质磷酸酶评分[10],提供了总共4178个PTEN错义变体属性的两个不同度量。我们整合了这两个数据集,将PTEN变异体分为四个不同的亚群:WT-like、仅丰度损失、仅活性损失以及丰度和活性损失。为了进行这种四向分类,我们将重点放在两种分析都有把握评分的变体上,因此可以根据这两种属性进行分类(图。2A;看见方法). 大多数变体与这两种分析一致,因为51%的分类变体在这两种特性中都是WT样的(图。2A、 绿色),而21%表现出活性和丰度的损失(图。2A、 紫色)。

图2
图2

PTEN变体的四种分类。A类两种分析中PTEN变体得分的散点图,丰度得分显示在x个-轴和磷酸酶得分显示在-轴。类WT变体以绿色显示,活性缺失变体以橙色显示,丰度缺失变体以青色显示,活性和丰度均缺失的变体以紫色显示。图中显示了每个扇区中已分类或未分类(灰色)变体的总数。B类20个变体的活动评分散点图和单独评估的EGFP荧光。已知催化条件下影响残基45、124和129以及PIP的变体2结合残基1到13从分析中去除。C类低丰度ClinVar致病性或CC队列PHTS或自闭症谱系障碍(ASD)变体的散点图,以丰度和活动得分绘制。活动得分不低的变量会被标记。D类PTEN晶体结构上显示出极端效应变体的位置(pdb:1d5r)。E类(顶部)条形图显示了不同临床分组中PTEN变异亚群的丰度和活性分布。(底部)将每个类别中每个变体类别的分数除以All-SNV类别中相应变体类别的小数,以计算褶皱富集或亏损。PHTS类别包括PHTS的ClinVar致病性或可能致病性PTEN变体,以及CC队列中PHTS患者的变体。ASD类别包括SFARI基因数据库中列出的变异,以及CC队列中ASD或发育障碍患者的变异。与两者相关的变体被归入各自的PHTS和ASD类别。VUS是ClinVar中意义不确定的变体。GnomAD和TOPMed数据库捕获的未受影响人群中观察到的PTEN变体也显示出来

其余28%的变异体在两种分析中表现出差异,表明分子表型比细胞内丰度损失导致的磷酸酶活性几乎完全丧失要微妙得多。最小的亚群是6%的被归类为仅失活变体的变体,其中磷酸酶活性被取消而不影响蛋白质稳态丰度(图。2A、 橙色)。其余变异占总分类变异的22%,仅为丰度损失(图。2A、 绿松石)。这些可能是对磷酸酶活性没有内在影响的变体,但可能会减少细胞内PTEN表达的总量,因此最终结果可能是细胞内功能减退。这包括Asp331Gly,当其在U87-MG胶质母细胞瘤细胞中表达时,其丰度也降低[29],但在纯化和等量的体外测试中具有接近WT磷酸酶活性[29,30].

仅丰度损失变体的优势促使我们更密切地检查两种分析之间的关系。我们首先分析了一组20个变异体的标度活动分数,这些变异体显示了一系列丰度,当与GFP融合时,这些丰度单独评估了其稳态平均荧光强度[9]. 只有当其测得的丰度显著降低至少5倍时,该面板中的变体才始终显示出活性降低(图。2B) ●●●●。因此,在酵母拯救活性测试中,非常低丰度的变体可以作为WT-like评分。

为了更好地了解这些低丰度变体在没有降低酵母拯救活性评分的情况下是否具有临床重要性,我们将重点放在低丰度PTEN变体子集上,这些PTEN变体在ClinVar中被归类为致病性,或与孤独症谱系障碍(ASD)或PTEN错构瘤综合征(PHTS)相关最近发表的克利夫兰诊所PTEN变异阳性患者队列(CC队列)[12]. 在这组40个总变异中,22个(55%)被归类为活性和丰度变异的损失(图。2C) ●●●●。其余18个变异体(45%)被自信地评估为低丰度,其中8个仅因其高活动分数而被认为丰度损失。其他10种表现出中间活性。值得注意的是,当其他实验室在人类细胞模型中进行评估时,其中12种具有临床意义的变体(Tyr27Ser、Gly129Arg、Met134Thr、Arg173Cys、Arg163His、Thr202Ile、Pro246Leu、Gly251Val、Asp252Gly、Lys254Thr、Asn276Ser、Asp326Asn)的体外活性降低、丰度降低或功能改变,进一步支持这些变量的扰动函数[30,31,32,33,34,35,36,37,38]. 对于剩下的6种致病性变体,我们数据集中的低丰度分数是迄今为止唯一测量改变实验结果的方法。因此,我们很容易推测,尽管在酵母活性测试中评分为WT样或不确定,但至少其中一些仅丰度损失变体仅因其丰度降低而致病。然而,也有可能是这两种检测中的噪音、对细微但有临床意义的活性丧失缺乏敏感性,或酵母活性检测未捕捉到的功能改变,都可能导致这些变体的致病性。

接下来,我们询问了PTEN蛋白结构中每个亚群中的变体是如何分布的。在42个位置,大多数变体导致丰度损失和活性损失,这些大部分映射到两个PTEN域的埋藏区域(图。2D、 紫色球体)。在17个位置,大多数变体仅导致丰度损失,这些位置位于PTEN结构外围,尤其是C2域内(图。2D、 绿松石球体)。在9个位置,变异仅导致活性丧失,这些变异主要分布在活性位点周围,但包括Ala333,C2结构域上的膜近端残基(图。2D、 橙色球体)。

然后,我们分析了每个亚群与PHTS、ASD和癌症患者或CC队列中活检的各种肿瘤的公开数据库中发现的变异之间的关系[12]. 我们在ClinVar中发现59个与PHTS相关的生殖系致病性或可能致病性变体,或在CC队列中具有典型PHTS症状,这些变体在丰度和活动性数据集中也得到了可靠的评分。其中,46个仅为PHTS的变体,在SFARI数据库或CC队列中未观察到与自闭症谱系障碍或发育障碍相关的变体。与所有可能的单核苷酸变体或在未受影响的人群数据库(如GnomAD或TOPMed)中观察到的变体相比,这些仅PHTS的变体因丰度和活性变体的损失以及仅活性变体的丢失而丰富(图。2E、 紫色和橙色条)。相比之下,丰度变异的损失略有减少,而WT-like变异则有所减少(图。2E、 绿松石和绿条)。有8种变异只与自闭症谱系障碍相关。虽然样本很小,但在丰度损失或活性损失变体中有富集,但在伴随丰度和活性损失的变体中没有富集。另一方面,有13个种系变异与经典PHTS症状和自闭症谱系障碍相关。其中7个变异是丰度和活性的损失。

PHTS患者,尤其是那些同样表现出自闭症谱系障碍的患者,活动缺失和丰度变异的增加与Mighell等人在类似分析中观察到的表型总体一致[12]. 仅丰度损失或仅活动损失变体的富集程度存在显著差异。他们观察到更多与PHTS相关的纯丰度变异的丢失,而我们观察到更多的与自闭症谱系障碍相关的纯富度变异的缺失。他们的方法与我们的不同,因为他们的分析着眼于在队列中PTEN变异阳性个体中观察到的变异和变异类别的频率,而我们使用的是一组更大的数据,其中关于频率的信息并不总是可用的。因此,我们研究了每个丰度和活性类别是如何由独特的PTEN变体填充的,上述差异可能是由于这些方法的差异。无论如何,不同的临床组可能富含不同的PTEN分子表型。相反,在ClinVar中154个显著性不确定(VUS)变异体中仅观察到轻微的富集和缺失,这两个数据集中也对其进行了自信评分。根据这些标准,这些变体中有52种表现出丰度损失或活性损失,可能是未来重新分类的主要目标。

重新分类这些变体需要纳入PTEN特定考虑因素,以便专家工作组进行临床解释[39]. 沿着这些路线,最初的PTEN丰度和活性数据被用于创建一个逻辑回归模型,该模型能够将临床上有意义的PTEN变体与其他变体分离开来[12]. 该模型表明,在酵母中具有中间活性的PTEN变异体或截短型错义变异体也很可能导致PHTS,支持使用丰度和活性测量作为致病性的证据[12]. 这项研究依赖于估算的缺失丰度分数来训练他们的模型。通过提供额外的实验数据和减少对插补的依赖,我们在此提供的额外丰度数据将有助于改进PTEN变体的重新分类。

接下来,我们检查了cBioPortal访问的各种癌症基因组数据集中发现的乳腺癌、子宫癌、肺癌、结直肠癌、前列腺癌、皮肤癌和脑癌中不同PTEN丰度和活性亚群的变异富集情况[20,21]. 在这里,我们的目标是利用我们的数据更好地区分不同类型的潜在致癌、PTEN功能丧失变体和可能在肿瘤发展过程中偶然积累的潜在无害PTEN变体。我们通过计算通过单核苷酸变异可能出现的每个子集的频率,在没有选择的情况下估计了一个零突变模型(图。,灰色条)。与我们的空模型相比,类WT变体被一致耗尽,可能是因为来自其他功能损伤子集的变体的相应丰富程度超过了它们。仅丰度缺失的变异体也似乎被耗尽,这可能是因为根据定义,这些变异体至少保留部分活性,这可能足以在大多数情况下抵消肿瘤发生。相反,在不同的癌症类型中,表现出丰度和活性损失的变体都均匀富集。这一发现与我们之前观察到的低丰度变体的富集相一致[9]并表明PTEN通过丰度的丧失和活性的丧失而丧失功能是导致多种癌症发生的常见因素。

图3
图3

癌症基因组数据集中PTEN体细胞变异的分布。A类将PTEN cDNA中的每个核苷酸通过计算替换为其他核苷酸,以创建所有可能的单核苷酸变体列表,并通过计算翻译每个密码子,以创建通过单核苷酸变体可能的PTEN错义变体列表,以及根据密码子表的简并性观察到的它们的相对频率。大约46%的这些错义变体具有明确的丰度和活动分类(这是面板A中显示的四个类别中所有灰色线的总和)。为了帮助比较PTEN变体类的癌症特异性富集,将这些仅根据突变计算的PTEN变体频率分为不同的磷酸酶丰度组,其预期频率显示为粗灰色线。在癌症基因组数据库中观察到的PTEN变体也被磷脂酶丰度组分开,其频率显示为不同的颜色点。B类仅活性缺失变体接下来被分为已知的显性阴性,以及其他之前未经特征化的仅活性缺失变异体。癌症基因组数据库中观察到的体细胞PTEN变异体的总数以及伴随的丰度和活性分类如下所示n个每个癌症类型旁边的值

剩下的仅活性缺失子集特别有趣,因为它包括显性负PTEN变体[6]. 均聚被认为可以使PTEN保持其活性构象,并使其发挥最大的PtdIns(3,4,5)P磷酸酶活性[40]. 因此,当显性阴性变异体Cys124Ser与无效或不稳定变异体共同表达时,编码WT PTEN等位基因的细胞表现出更强的Akt细胞内信号[9,40]. 与该观察结果一致,一个等位基因被已知的显性阴性等位基因(如Cys124Ser和Gly129Glu)取代的转基因小鼠的肿瘤负担增加[40,41]. 因此,我们在不同的癌症中检测了该亚群中已知的和潜在的非特征化显性阴性变异。

仅活性缺失变体在不同癌症中的富集程度不同,乳腺癌、子宫癌、前列腺癌和肺癌的富集程度最高(图。A) ●●●●。已知显性负性变体Cys124Ser、Gly129Glu、Arg130Gly和Arg130Gln的观察频率远高于零模型预测的频率,在零模型中,它们只能通过3618个单核苷酸驱动的密码子中的5个密码子的改变才能共同实现(图。B) ●●●●。这些已知的显性负性变异是活性缺失变异增加的主要原因,在乳腺癌、子宫癌和肺癌中分别占58%、87%和100%。因此,没有对仅肺癌变异的额外活动丧失进行评分,而子宫癌和乳腺癌除了已知的显性阴性外,还增加了仅活动丧失变异(图。B) ●●●●。我们假设在子宫癌和乳腺癌中观察到的这种额外的仅活动性缺失变体可能代表新的显性阴性变体。

识别潜在显性-阴性变异体

为了验证这一假设并确定新的PTEN显性阴性变异体,我们量化了表达PTEN变异体和WT拷贝的细胞中Thr308(pAkt)的Akt激活环磷酸化水平[40](图。4,其他文件1:图S5)。我们通过使用已经表达野生型PTEN的HEK 2393T着陆垫细胞表达PTEN变体来实现这一测定[9]. 使用这种方法,我们之前将Pro38Ser确定为显性-阴性变异,因为它导致pAkt水平增加,类似于已知的显性-阴性Cys124Ser变异[9].

图4
图4

PTEN变体和磷酸化Akt1。WT或PTEN变异体在HEK 293T细胞中过度表达、裂解和HA标记的Western blot(A类,顶部),β-肌动蛋白(A类,底部),Thr308磷酸化Akt1(B类,顶部)或全部Akt1(B类,底部)。显示了典型的Western印迹。三个独立的蛋白质印迹实验中的每个实验的归一化带强度显示为点,而平均值显示为黑条。C类在癌症基因组数据库中观察到将平均归一化pThr308值与每个变体的独立样本数进行比较的散点图。D类癌细胞系百科全书中PTEN蛋白丰度水平和pThr308 Akt1丰度水平的比较。Leu42Arg未在我们的分析中进行测试,它以蓝色突出显示,因为它在CCLE数据中显示了PTEN丰度和pThr308的强烈反相蛋白质阵列数据

我们选择了一小组仅失活的变体来使用该分析进行筛选,包括Asp24Gly、Asp92His、Arg130Pro和Arg159Ser,这些变体之所以被选择是因为它们在乳腺癌、子宫癌或两者中被多次观察到。我们还选择了在肿瘤中观察一次或零次的Tyr16Ser、Tyr46Asp和Thr160Pro,以便我们测试在肿瘤中的观察是否与显性阴性活性相关。最后,我们将已知的低丰度变体Leu345Gln和Asp252Gly以及已知的显性-阴性变体Cys124Ser作为对照。

正如预期的那样,所有仅活性丧失的变体都在接近WT的水平上表达,并与Leu345Gln和Asp252Gly(丰度控制的丧失)有明显区别(图。4A) ●●●●。过度表达WT-PTEN使pAkt水平降低到未重组细胞的水平以下。相反,丰度控制变异的缺失具有与未重组细胞相似的pAkt水平,这表明我们可以定性区分可能对PtdIns(3,4,5)P3磷酸酶活性起作用的变异与那些不活跃的变异。重要的是,所有仅活性缺失变体的pAkt水平均等于或大于未结合和丰度控制的缺失,证实这些变体确实是活性缺失。除了已知的显性阴性变异体Cys124Ser外,Arg130Pro和Asp92His变异体的pAkt水平也显著增加(图。4B) ●●●●。pAkt信号的增加不是由于升高AKT1型表达,提示对Akt1信号传导有特殊作用。剩下的仅失活变异体显示中间pAkt信号,因此不太确定。

重要的是,每个变体驱动Akt1 Thr308磷酸化的能力与该变体在癌症中的发病率相关(Pearson’s第页:0.76)(图。4C) ●●●●。Arg130Pro在序列乳腺癌中被发现突变四次,在子宫癌中突变三次,在食管癌中突变一次(图。4C) ●●●●。Asp92His在三个独立的乳腺癌病例中发生突变。与这些结果一致,在癌症细胞系百科全书(CCLE)测试的CAMA-1乳腺癌细胞系中存在Asp92His变体[42]. 该细胞系PTEN表达正常,pAkt升高,与其他在CCLE中表达已知显性阴性变异体Arg130Gln、Cys124Ser和Arg130Gly的细胞系类似[42](图。4D) ●●●●。相反,Asp24Gly和Arg159Ser分别在乳腺癌和子宫癌中发生了两次突变,在我们的检测中,它们没有表现出pAkt强度增加。因此,PTEN大规模变异功能数据集与癌症基因组学数据相结合,可以识别可能表现出疾病严重程度改变的显性阴性变异。

讨论

在此,我们表明,整合多个大规模PTEN变异功能数据集可以揭示变异如何影响蛋白质功能,并阐明疾病相关变异的作用机制。我们通过分析一个新的独立生成的文库,改进了之前的PTEN变体丰度数据集,为764个新变体添加丰度得分。这得益于新设计的iCasp9着陆垫细胞,它允许我们快速选择整夜培养的重组细胞。相反,最初的方法需要FACS对mCherry阳性细胞进行分类,这需要数小时的准备和分类,每次重复重组花费数百美元。更重要的是,通过化学选择避免FACS步骤,我们可以避免分选前所需的延长培养、FACS过程中无法捕获每一个靶细胞或分选过程中发生的细胞活力丧失所导致的文库瓶颈。改进的工作流程、一个独立生成的先前缺失变体库以及先前评分变体准确性的轻微改进相结合,生成了一个包含4721个变体的最终数据集,并对其丰度进行了自信的评分。

我们将改进后的丰度数据集与现有的大规模PTEN磷酸酶活性数据集集成,根据其丰度和活性将变体分为四个不同的亚群。我们将这些亚群中的变异与PTEN错构瘤综合征或自闭症谱系障碍相关的种系变异进行了比较。疾病相关变体的活性往往降低,其中最大的一部分也降低了丰度。这一发现与最近发表的另一项比较PTEN变异活性和丰度的分析一致,该分析报告称ASD和PHTS变异在丰度和活性变异的损失中富集[12]. 对于PTEN体细胞变异,我们发现那些活性和丰度丧失的变异在癌症中均匀富集,而仅活性丧失的变异仅在乳腺癌、子宫癌和肺癌中特别富集。我们分析了在乳腺癌、子宫癌或两者中多次观察到的四种以前没有特征性的仅活性丧失变体,发现其中两种变体表现出与显性负活性一致的pAkt信号增强。这些发现突出了对重要疾病基因(如PTEN公司,因为整合这些数据可以揭示具有不同功能特性的变异体组,这些变异体对疾病具有不同的含义。

与零等位基因相比,某些肿瘤相关PTEN变异体在小鼠模型中的表达加剧了发育过度和肿瘤负担[41]. 这些等位基因对PI3K/Akt通路的细胞内调节也表现出显性负效应[40]. 因此,在体外表现出显性负活性的癌相关变异体很可能是癌症的强大驱动因素。最近的研究已经开始揭示一些功能不同的PHTS PTEN变异体之间的联系差异,特别是它们与孤独症、癌症或两者的联系[33,43]. 然而,需要对更大的队列进行额外的研究,以充分描述PTEN变异体与不同失活水平的基因型-表型关联,包括显性-阴性变异体。

只有Cys124Ser、Gly129Glu、Arg130Gly和Arg130Gln最初被鉴定为具有显性阴性体外活性[40]. 我们之前确定Pro38Ser具有类似WT的丰度,但其在黑色素瘤中的反复出现表明其可能是非活性的,因此以显性负向的方式发挥作用[44]. 随访分析显示,具有PTEN WT拷贝的细胞中Pro38Ser过度表达导致pAkt异常高,支持这一观点[9]. 在这里,通过比较数千个PTEN变体的丰度和活性,我们直接确定了许多缺乏活性的变体,而这些变体在细胞中仍然大量存在。这些包括PTEN显性负活性通常需要的功能特性。对四种变异体进行的后续分析显示,Arg130Pro和Asp92His也在PTEN的WT拷贝存在时破坏AKT调节,从而以显性-阴性方式发挥作用,至少在我们的细胞分析中是这样。

Arg130Pro加入Arg130Gly和Arg130Gln,这两个先前已知的显性阴性变体影响蛋白质酪氨酸磷酸酶和双特异性磷酸酶共享的P-Loop/HCXXGXXR基序中的关键催化残基[43,45]. 观察到WT精氨酸残基的三种不同取代可以产生显性负活性,这表明任何缺乏这种侧链的稳定PTEN变体都可能干扰WT PTEN活性。在我们的综合分析中,Ala、Phe和Leu的Arg130替代变体均得分稳定且不活跃,因此很可能也是显性阴性变体。在这三种基因中,只有Arg130Leu可能通过单核苷酸变异,因此在癌症基因组数据库中重复观察到[22,46].

Asp92是PTEN WPD环中的一个关键残基,被认为可以协调和极化亲核水分子[47]. 与Gly129Glu一样,发现Asp92Ala可以消除磷脂中磷酸基团的去除,但不能消除磷酸肽中的磷酸基团[48]. 然而,Asp92His尚未进行生化表征,因此尚不清楚它是否像Asp92Ala一样保留蛋白酪氨酸磷酸酶活性。在综合分析中,Asp92替代Glu、Leu、Pro、Gln、Arg和Ser的变体均得分为稳定且不活跃,尽管只有Asp92His和Asp92Glu可能通过单核苷酸变异。Asp92Glu在癌症中的检出率甚至比Asp92His更高,这表明其带负电荷的侧链不足以模拟天冬氨酸所起的作用,并且它也是一种显性负性变体。虽然在我们的数据集中没有得分,但在COSMIC数据库中观察到的Gly和Tyr的Asp92替代物也比His多,因此它们是强优势阴性候选物。

并不是所有假定的PTEN显性负变体都发生在活性位点残基上。与活性位点相邻的Pro38Ser可能通过干扰活性位点构象来发挥其作用,足以使其催化死亡,而不会破坏蛋白质的全局折叠。除了干扰活性部位外,其他机制,如异常亚细胞定位,也可能产生显性负效应。在编码PTEN Leu42Arg变体的T98G胶质母细胞瘤细胞系中可以找到一个候选基因。Leu42Arg丰度正常,磷酸酶活性完整,但膜定位异常[49]. 虽然Leu42Arg表现出中等活性评分,但在我们的丰度数据中却没有,因此我们无法将此变体纳入我们的分析。然而,T98G细胞的pAkt水平增加(图。4D) ,表明Leu42Arg可能具有不直接影响活性位点的显性负功能。值得注意的是,T98G细胞中基于Cas9的两个Leu42Arg等位基因中只有一个的逆转没有改变稳态Akt T308磷酸化,支持其声称的显性负活性[50].

PTEN同二聚体可能解释了为什么一些丰富的脂质磷酸酶缺陷变体可以作为显性阴性,而其他变体则不能。特别是,不能同源二聚的脂质磷酸酶缺陷变体将不能与野生型PTEN结合,因此不能发挥显性负活性。大多数先前已知的PTEN显性阴性变体替代催化基序中的保守残基,包括Cys124、Asp92和Arg130。这些变体有效地消除了酶的功能,但对蛋白质稳定性和三维构象几乎没有影响。因此,它们能够与WT PTEN蛋白二聚并主要抑制其功能[40]. 重要的是,单靠大规模变异效应数据集不足以识别显性负性PTEN变异。并非所有丰富但无活性的变体都表现出显性阴性活性,因为我们测试的五种变体没有引起pAkt水平的升高。因此,将变异效应数据与癌症基因组数据进行比较可能是突出潜在显性负变异的最有效方法。虽然不可能准确估计大量但不活跃的PTEN变异体中占主导阴性的比例,但我们相信,这可能不会超过我们测试的面板中的约13%,甚至可能要少得多。

综合分析也说明了每种分析的不同强度,即使是单独考虑。酵母PTEN活性测定直接评估催化活性,从而确定大量丰富但无活性的变体,这些变体在丰度测定中可能会被遗漏。丰度分析可以捕捉到与低形态变体相关的蛋白质丰度的细微下降,可能超出酵母活性分析的动态范围(图。2C) ●●●●。这与目前已知的文献中功能不同的PTEN变体组相一致,其中PTEN活性的显著降低通常与癌症和严重PHTS相关,而蛋白质稳定性的部分丧失和功能的轻微降低与自闭症谱系障碍和发育障碍的轻度表现有关[33,51,52,53]. 因此,每种分析都提供了补充的实验读数,共同提高了我们描述PTEN基因型如何影响表型的能力。

尽管它们很有用,但大规模功能数据有许多局限性。例如,在我们的分析中,有七种变体被归类为丰富且活跃,但在ClinVar中也被列为致病性变体。其中之一是His93Arg,已知其仍然丰富且部分活性,但由于磷脂结合位点的改变,底物特异性发生改变[54]. 酵母中未观察到His93Arg磷酸酶活性缺陷[55],表明分析读数的上下文特定差异。此外,不同的分析可能会得到不同动态范围的结果,在比较结果时必须小心。例如,VAMP-seq中EGFP融合变体的荧光读数可能具有略低于WT蛋白丰度的最高动态范围。相反,基于酵母的拯救试验依赖于PTEN酶活性,并且在PTEN磷酸酶活性低水平时,该试验的动态范围可能最高,远低于WT的活性。因此,大部分变体表现出类似WT的酵母拯救活性,但丰度较低(图。2A、 橙色),显示出填充散点图时几乎呈直角,而不是沿对角线的直线。与一系列单独评估的PTEN丰度变体的比较证实了这种关系模式(图。2B) ●●●●。对于不同的蛋白质和分析,每个类似的图可能会有所不同,因此,在整合多个大规模的变异效应数据集并解释其对丰度和活性之间的蛋白质特异性关系的含义时必须小心。事实上,最近对基于酵母的酶活性和哺乳动物细胞内CYP2C9丰度的比较分析揭示了相反的模式,其中有许多丰富的变体,但几乎没有检测到酶活性,这表明在这种情况下,这两种检测的灵敏度发生了逆转[26].

总之,正如我们和其他人所表明的那样,对多个大规模变异效应数据集的综合分析,每个数据集都测量单个蛋白质的不同性质,可以对蛋白质功能、蛋白质结构和疾病产生新的见解[24,25,56,57,58]. 我们预计,随着复合分析的广泛应用,这种综合分析将变得普遍。因此,需要改进的方法来集成各种效应数据集,以及在结构、临床和进化信息的背景下分析这些数据集的工具。

结论

我们发现,多维、大规模的变异功能数据与公共癌症基因组数据集和后续分析相结合,可以揭示蛋白质变异如何影响蛋白质功能,并阐明疾病相关变异的作用机制。我们创建了一个改进的PTEN细胞内丰度数据集,并将其与现有的大规模PTEN磷酸酶活性数据集集成,根据其丰度和活性将4178个PTEN变异体分为四个不同的亚群,并发现疾病相关的生殖系变异体倾向于失活变异体,其中大多数也减少了丰度。对于PTEN体细胞变异,我们发现那些活性和丰度损失的变异在癌症中均匀富集,而仅活性损失的变异则更具变异性。通过后续分析,我们发现其中两个变异体表现出pAkt信号增强,这与之前未被认可的这些变异体的显性负活性一致。这些发现强调了收集和整合PTEN等重要疾病基因的多个大规模变异功能数据集的重要性,以更好地了解蛋白质变异如何导致疾病。

数据和材料的可用性

支持本文结论的数据集可在多个存储库中获得:原始Illumina测序文件可在NCBI基因表达综合(GEO)存储库中访问,注册号为GSE159469,https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE159469[59]. 所有其他数据类型以及从数据文件重新创建分析的R标记脚本都可以在http://www.github.com/matreyeklab/pten_composite网站[17]. 所有PTEN变体丰度得分的数据表包含在附加文件中2:表S3。

缩写

MAVEs公司:

变异效应的多重分析

DMS系统:

深度突变扫描

博士学位:

PTEN错构瘤肿瘤综合征

VAMP-seq:

大规模平行测序的变异丰度

SNV:

单核苷酸变异

VUS(美国):

重要性不确定的变量

TCGA公司:

癌症基因组图谱

ASD:

自闭症谱系障碍

FACS公司:

荧光激活细胞分选

派克:

Akt在Thr308磷酸化

CCLE公司:

癌细胞系百科全书

工具书类

  1. Karczewski KJ、Francioli LC、Tiao G、Cummings BB、Alföldi J、Wang Q等。从141456人的变异中量化的突变约束谱。自然。2020;581:434–43.

    第条 计算机辅助系统 公共医学 公共医学中心 谷歌学者 

  2. Weinstein JN、Collisson EA、Mills GB、Shaw KRM、Ozenberger BA、Ellrott K等。癌症基因组图谱泛癌分析项目。自然遗传学。2013;45:1113.

    第条 公共医学 公共医学中心 计算机辅助系统 谷歌学者 

  3. Landrum MJ、Lee JM、Riley GR、Jang W、Rubinstein WS、Church DM等。ClinVar:序列变异与人类表型之间关系的公共档案。核酸研究2014;42:D980-5。

    第条 计算机辅助系统 公共医学 谷歌学者 

  4. Starita LM、Ahituv N、Dunham MJ、Kitzman JO、Roth FP、Seelig G等。变体解释:用于救援的功能分析。美国人类遗传学杂志。2017;101:315–25.

    第条 计算机辅助系统 公共医学 公共医学中心 谷歌学者 

  5. Gasperini M,Starita L,Shendure J.遗传变异的多重功能分析的力量。国家协议。2016;11:1782–7.

    第条 计算机辅助系统 公共医学 公共医学中心 谷歌学者 

  6. Lee Y-R,Chen M,Pandolfi PP。PTEN抑癌基因的功能和调控:新模式和前景。Nat Rev Mol细胞生物学。2018;19:547–62。

    第条 计算机辅助系统 公共医学 谷歌学者 

  7. Milella M、Falcone I、Conciatori F、Cesta Incani U、Del Curatolo A、Inzerilli N等。PTEN:人类恶性肿瘤的多种功能。前Oncol。2015;5点24分。

    第条 公共医学 公共医学中心 谷歌学者 

  8. Hasle N,Matreyek KA,Fowler DM。遗传变异对PTEN分子功能和细胞表型的影响。2019年《冷泉Harb Perspect Med.》;9(11):a036228。

    第条 计算机辅助系统 公共医学 公共医学中心 谷歌学者 

  9. Matreyek KA、Starita LM、Stephany JJ、Martin B、Chiasson MA、Gray VE等。通过大规模平行测序对蛋白质变体丰度进行多重评估。自然遗传学。2018;50:874–82.

    第条 计算机辅助系统 公共医学 公共医学中心 谷歌学者 

  10. Mighell TL,Evans-Dutson S,O’Roak BJ。了解PTEN脂质磷酸酶活性和基因型-表型关系的饱和诱变方法。美国人类遗传学杂志。2018;102:943–55.

    第条 计算机辅助系统 公共医学 公共医学中心 谷歌学者 

  11. Jepsen MM、Fowler DM、Hartmann-Petersen R、Stein A、Lindorff-Larsen K。使用蛋白质活性和稳定性的测量方法对疾病相关变体进行分类。生物Rxiv。2019https://doi.org/10.101/1688234

  12. Mighell TL、Thacker S、Fombone E、Eng C、O'Roak BJ。综合深度突变扫描方法提供了PTEN基因型-表型关系的临床见解。美国人类遗传学杂志。2020;106:818–29.

    第条 计算机辅助系统 公共医学 公共医学中心 谷歌学者 

  13. Gibson DG、Young L、Chuang R-Y、Venter JC、Hutchison CA 3rd、Smith HO。高达几百千碱基的DNA分子的酶组装。自然方法。2009;6:343–5.

    第条 计算机辅助系统 公共医学 谷歌学者 

  14. Aronesty E.ea-utils:用于处理生物测序数据的命令行工具。github。https://github.com/ExpressionAnalysis/ea-utils网站. 2011.

  15. Rubin AF、Gelman H、Lucas N、Bajjalieh SM、Papenfuss AT、Speed TP等。分析深度突变扫描数据的统计框架。基因组生物学。2017;18:150.

    第条 公共医学 公共医学中心 计算机辅助系统 谷歌学者 

  16. Matreyek KA,Stephany JJ,Chiasson MA,Hasle N,Fowler DM。哺乳动物细胞中大型蛋白库功能评估的改进平台。核酸研究2020;48(1):e1。

    第条 计算机辅助系统 公共医学 谷歌学者 

  17. 马特雷耶克KA。PTEN_composite:PTEN填充了丰富的DMS,并与Github的酵母活性评分相结合。https://github.com/MatreyekLab/PTEN_composite网站(2021)

    谷歌学者 

  18. Abrahams BS、Arking DE、Campbell DB、Mefford HC、Morrow EM、Weiss LA等。SFARI基因2.0:孤独症谱系障碍(ASD)的社区驱动知识库。摩尔自闭症。2013;4:36.

    第条 公共医学 公共医学中心 谷歌学者 

  19. Taliun D、Harris DN、Kessler MD、Carlson J、Szpiech ZA、Torres R等。NHLBI TOPMed计划53831个不同基因组的测序。自然。2021;590:290–9.

    第条 计算机辅助系统 公共医学 公共医学中心 谷歌学者 

  20. Cerami E、Gao J、Dogrusoz U、Gross BE、Sumer SO、Aksoy BA等。cBio癌症基因组学门户:探索多维癌症基因组学数据的开放平台。癌症发现。2012;2:401–4.

    第条 公共医学 谷歌学者 

  21. Gao J、Aksoy BA、Dogrusoz U、Dresdner G、Gross B、Sumer SO等。使用cBioPortal对复杂癌症基因组学和临床特征进行综合分析。科学信号。2013;6:11。

    第条 计算机辅助系统 谷歌学者 

  22. AACR项目GENIE联盟。AACR项目GENIE:通过国际财团为精准医学提供动力。癌症发现。2017;7:818–31.

    第条 谷歌学者 

  23. Matreyek KA,Stephany JJ,Fowler DM。哺乳动物细胞大变异库功能评估平台。核酸研究2017;45:e102。

    第条 公共医学 公共医学中心 计算机辅助系统 谷歌学者 

  24. Suiter CC、Moriyama T、Matreyek KA、Yang W、Scaletti ER、Nishii R等。大量平行变异特征确定了与硫嘌呤毒性相关的NUDT15等位基因。美国国家科学院院刊2020;117(10):5394–401.

    第条 计算机辅助系统 公共医学 公共医学中心 谷歌学者 

  25. Chiasson MA、Rollins NJ、Stephany JJ、Sitko KA、Matreyek KA、Verby M等。多样性丰度和活性的多重测量揭示了VKOR拓扑、活性位点和人类变异影响。埃利夫。2020;9:e58026。

    第条 计算机辅助系统 公共医学 公共医学中心 谷歌学者 

  26. Amorosi CJ、Chiasson MA、McDonald MG、Wong LH、Sitko KA、Boyle G等。CYP2C9变异酶活性和丰度的大规模平行表征。美国人类遗传学杂志。2021;108(9):1735–51.

    第条 计算机辅助系统 公共医学 公共医学中心 谷歌学者 

  27. Gray VE,Hause RJ,Luebeck J,Shendure J,Fowler DM。使用大规模诱变数据进行定量错义变异效应预测。细胞系统。2018;6:116–24.e3。

    第条 计算机辅助系统 公共医学 谷歌学者 

  28. Weile J、Sun S、Cote AG、Knapp J、Verby M、Mellor JC等。穷尽映射功能错义变体的框架。分子系统生物学。2017;13:957.

    第条 公共医学 公共医学中心 计算机辅助系统 谷歌学者 

  29. Georgescu MM、Kirsch KH、Kaloudis P、Yang H、Pavletich NP、Hanafusa H。PTEN肿瘤抑制因子C2结构域的稳定和生产性定位作用。癌症研究2000;60:7033–8.

    计算机辅助系统 公共医学 谷歌学者 

  30. Han SY,Kato H,Kato S,Suzuki T,Shibata H,Ishii S,et al.使用体外磷脂酰肌醇磷酸酶试验对PTEN错义突变进行功能评估。癌症研究2000;60:3147–51.

    计算机辅助系统 公共医学 谷歌学者 

  31. Fricano-Kugler CJ、Getz SA、Williams MR、Zurawel AA、DeSpenza T Jr、Frazel PW等。核排除自闭症相关磷酸酶和张力蛋白同源突变失调调节神经元生长。生物精神病学。2018;84:265–77.

    第条 计算机辅助系统 公共医学 谷歌学者 

  32. He X、Thacker S、Romigh T、Yu Q、Frazier TW Jr、Eng C。自闭症小鼠模型中,细胞质前体Pten与区域特异性脑酪氨酸羟化酶和多巴胺D2受体增加相关。摩尔自闭症。2015;6:63.

    第条 公共医学 公共医学中心 计算机辅助系统 谷歌学者 

  33. Spinelli L、Black FM、Berg JN、Eickholt BJ、Leslie NR。自闭症和肿瘤综合征中遗传PTEN突变的功能不同组。医学遗传学杂志。2015;52:128–34.

    第条 计算机辅助系统 公共医学 谷歌学者 

  34. Choi SW、Lee Y、Shin K、Koo H、Kim D、Sa JK等。PTEN作为胶质母细胞瘤独特治疗靶点的突变特异性非规范途径。细胞死亡疾病。2021;12:374.

    第条 计算机辅助系统 公共医学 公共医学中心 谷歌学者 

  35. Ngeow J、He X、Mester JL、Lei J、Romigh T、Orloff MS等。PTEN蛋白剂量在预测甲状腺癌患者和Cowden-like表型患者潜在种系PTEN突变中的作用。临床内分泌代谢杂志。2012;97:E2320–7。

    第条 计算机辅助系统 公共医学 公共医学中心 谷歌学者 

  36. Furnari FB、Lin H、Huang HS、Cavenee WK。PTEN抑制胶质瘤细胞生长需要一个功能性磷酸酶催化域。美国国家科学院院刊1997;94:12479–84.

    第条 计算机辅助系统 公共医学 公共医学中心 谷歌学者 

  37. Zhou X-P、Marsh DJ、Morrison CD、Chaudhury AR、Maxwell M、Reifenberger G等。PTEN的种系失活和磷酸肌醇-3-激酶/Akt通路的失调导致成人Lhermite-Duclos病。美国人类遗传学杂志。2003;73:1191–8.

    第条 计算机辅助系统 公共医学 公共医学中心 谷歌学者 

  38. Wong CW,Wang Y,Liu T,Li L,Cheung SKK,Or PM-Y,等。在诱导的多能干细胞系中,与Autism相关的PTEN错义突变导致核定位增强和神经突起生长。FEBS J.2020;287:4848–61.

    第条 计算机辅助系统 公共医学 公共医学中心 谷歌学者 

  39. Mester JL、Ghosh R、Pesaran T、Huether R、Karam R、Hruska KS等。PTEN变种保存的基因特异性标准:临床基因PTEN专家小组的建议。哼,变种。2018;39(11):1581–92.

    第条 公共医学 公共医学中心 谷歌学者 

  40. Papa A、Wan L、Bonora M、Salmena L、Song MS、Hobbs RM等。癌相关PTEN突变体以显性负性方式抑制PTEN蛋白功能。单元格。2014;157:595–610.

    第条 计算机辅助系统 公共医学 公共医学中心 谷歌学者 

  41. Wang H、Karikomi M、Naidu S、Rajmohan R、Caserta E、Chen H-Z等。pten敲除小鼠的等位基因特异性肿瘤谱。美国国家科学院院刊2010;107:5142–7。

    第条 计算机辅助系统 公共医学 公共医学中心 谷歌学者 

  42. Barretina J、Caponigro G、Stransky N、Venkatesan K、Margolin AA、Kim S等。《癌症细胞系百科全书》实现了抗癌药物敏感性的预测建模。自然。2012;483:603–7.

    第条 计算机辅助系统 公共医学 公共医学中心 谷歌学者 

  43. Smith IN,Thacker S,Seyf M,Cheng F,Eng C.自闭症相关种系PTEN突变与癌症相关种系相比的构象动力学和变构调节景观。美国人类遗传学杂志。2019;104:861–78.

    第条 计算机辅助系统 公共医学 公共医学中心 谷歌学者 

  44. Aguissa TouréA-H,Li G.人类黑色素瘤中PTEN的基因改变。细胞分子生命科学。2012;69:1475–91.

    第条 公共医学 计算机辅助系统 谷歌学者 

  45. Lee JO,Yang H,Georgescu MM,Di Cristofano A,Maehama T,Shi Y,等。PTEN抑癌剂的晶体结构:对其磷脂酰肌醇磷酸酶活性和膜结合的影响。单元格。1999;99:323–34.

    第条 计算机辅助系统 公共医学 谷歌学者 

  46. Tate JG、Bamford S、Jubb HC、Sondka Z、Beare DM、Bindal N等。COSMIC:癌症体细胞突变目录。2019年《核酸研究》;47:D941–7。

    第条 计算机辅助系统 公共医学 谷歌学者 

  47. Xiao Y,Chia JYC,Gajewski JE,Lio DSS,Mulhern TD,Zhu H-J等。PTEN催化磷脂去磷酸化反应遵循两步机制,其中保守的天冬氨酸-92不能作为家族性Cowden病相关PTEN突变的一般酸机制分析。细胞信号。2007;19:1434–45.

    第条 计算机辅助系统 公共医学 谷歌学者 

  48. Chia JY-C,Gajewski JE,Xiao Y,Zhu H-J,Cheng H-C。PTEN蛋白酪氨酸磷酸酶活性的独特生化特性证明了PTEN磷酸肽和磷脂磷酸酶活性对不同活性位点结构的要求。生物化学与生物物理学报(BBA)-蛋白质与蛋白质组学。2010;1804(9):1785–95.

    第条 计算机辅助系统 谷歌学者 

  49. Nguyen H-N,Yang J-M Jr,Rahdar M,Keniry M,Swaney KF,Parsons R等。膜移位缺陷定义的一类新的癌相关PTEN突变。致癌物。2015;34:3737–43.

    第条 计算机辅助系统 公共医学 谷歌学者 

  50. Hill VK,Kim J-S,James CD,Waldman T.通过AAV介导的基因编辑校正胶质母细胞瘤细胞系中PTEN突变。公共科学图书馆一号。2017;12:e0176683。

    第条 公共医学 公共医学中心 计算机辅助系统 谷歌学者 

  51. Portelli S、Barr L、de SáAGC、Pires DEV、Ascher DB。通过突变分析区分PTEN临床表型。计算结构生物技术杂志2021;19:3097–109.

    第条 计算机辅助系统 公共医学 公共医学中心 谷歌学者 

  52. Johnston SB,Raines RT。与癌症和自闭症谱系障碍相关的PTEN变体的构象稳定性和催化活性。生物化学。2015;54:1576–82.

    第条 计算机辅助系统 公共医学 谷歌学者 

  53. Leslie NR,Longy M.遗传PTEN突变和表型预测。精液细胞开发生物学。2016;52:30–8.

    第条 计算机辅助系统 公共医学 谷歌学者 

  54. Redfern RE、Daou M-C、Li L、Munson M、Gericke A、Ross AH。PTEN的一种突变形式与自闭症有关。蛋白质科学。2010;19:1948–56.

    第条 计算机辅助系统 公共医学 公共医学中心 谷歌学者 

  55. Rodríguez-Escudero I,Oliver MD,Andrés-Pons A,Molina M,Cid VJ,Pulido R。PTEN突变的综合功能分析:在肿瘤和自闭症相关综合征中的意义。人类分子遗传学。2011;20:4132–42.

    第条 公共医学 计算机辅助系统 谷歌学者 

  56. Starita LM、Young DL、Islam M、Kitzman JO、Gullingsrud J、Hause RJ等。BRCA1 RING域变体的大规模并行功能分析。遗传学。2015;200:413–22.

    第条 计算机辅助系统 公共医学 公共医学中心 谷歌学者 

  57. Park J,Selvam B,Sanematsu K,Shigemura N,Shukla D,Procko E。基于甜味受体亚单位共运输的二聚体C类GPCR的结构结构。生物化学杂志。2019;294:4759–74.

    第条 计算机辅助系统 公共医学 公共医学中心 谷歌学者 

  58. Andrews B,Fields S.大肠杆菌LamB中λ抗性和麦芽糊精转运突变敏感性的不同模式。Microb基因组。2020;6(4):e000364。

    公共医学中心 谷歌学者 

  59. Matreyek KA,Fowler DM。多维PTEN错义变异分析揭示了包括潜在显性阴性的变异亚群。GSE159469,NCBI基因表达总览2021https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE159469(网址:http://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE159469)

    谷歌学者 

下载参考资料

致谢

我们要感谢UW Foege Flow实验室的A.Leith和UW病理流式细胞术核心设施的D.Prunkard在细胞分选方面的帮助。我们还感谢苏黎世大学的Pawel Pelczar博士通过Addgene获得pCAG-NLS-HA-Bxb1质粒。此处显示的结果全部或部分基于TCGA研究网络生成的数据:(https://www.cancer.gov/tcga网站). 作者谨感谢美国癌症研究协会及其在AACR项目GENIE注册发展中的财政和物质支持,以及该联盟成员对数据共享的承诺。解释由研究作者负责。

基金

这项工作得到了美国国立卫生研究院(NIH;R01GM109110和RM1HG010461至DMF,R35GM142886至KAM)和美国癌症协会奖学金(PF-15-221-01至KAM)的支持。

作者信息

作者和附属机构

作者

贡献

KAM构思并指导了该项目,进行了实验,并进行了所有分析。JJS创建了变体库并为高通量测序执行库准备。EA建议根据CCLE数据进行额外分析。DMF为改进分析提供了建议。KAM写了手稿的初稿。KAM和DMF编辑了手稿。作者阅读并批准了最后的手稿。

通讯作者

与的通信肯尼思·马特雷耶克道格拉斯·M·福勒

道德声明

道德批准和参与同意

不适用

出版同意书

不适用

竞争性利益

EA目前为Revolution Medicines工作。其余作者声明,他们没有相互竞争的利益。

其他信息

出版商笔记

Springer Nature在公布的地图和机构关联中的管辖权主张方面保持中立。

补充信息

附加文件1:图S1。

原始和第二个库的PTEN变体覆盖率。图S2。用于对多个数据集进行评分的筛选方案。图S3。比较原始数据集和复合数据集的丰度得分。图S4。新丰度得分与先前估算值的比较。图S5。未经改良的western blot暴露用于评估PTEN变异显性阴性活性。表S1。用于生成单个PTEN变体的引物序列。表S2。新VAMP-seq细胞分类复制的统计数据。

附加文件2:表S3。

制表符分隔的值数据文件,包含分析中使用的全套变体丰度分数。

权利和权限

开放式访问本文根据知识共享署名4.0国际许可证获得许可,该许可证允许以任何媒介或格式使用、共享、改编、分发和复制,只要您对原作者和来源给予适当的信任,提供知识共享许可证的链接,并说明是否进行了更改。本文中的图像或其他第三方材料包含在文章的Creative Commons许可证中,除非材料的信用额度中另有说明。如果文章的知识共享许可证中没有包含材料,并且您的预期用途不被法律法规允许或超出了允许的用途,则您需要直接获得版权所有者的许可。要查看此许可证的副本,请访问http://creativecommons.org/licenses/by/4.0/知识共享公共领域专用豁免(http://creativecommons.org/publicdomain/zero/1.0/)适用于本文中提供的数据,除非数据的信贷额度中另有规定。

转载和许可

关于本文

检查更新。通过CrossMark验证货币和真实性

引用这篇文章

Matreyek,K.A.,Stephany,J.J.,Ahler,E。等。综合数千个PTEN变异活性和丰度测量结果,可以发现癌症中的变异亚群和新的显性阴性。基因组医学 13, 165 (2021). https://doi.org/10.1186/s13073-021-00984-x

下载引文

  • 收到以下为:

  • 认可的以下为:

  • 出版以下为:

  • 内政部以下为:https://doi.org/10.1186/s13073-021-00984-x

关键词