单元格。2016年9月22日;167(1):260-274.e22。
保留肿瘤内异质性的乳腺癌移植生物库筛选抗癌化合物
,1,11 ,1,11 ,1 ,1 ,1 ,1 ,1 ,1 ,1 ,1 ,1 ,1,2 ,2 ,1,2 ,三 ,1 ,1 ,4 ,4 ,4 ,5 ,6 ,7 ,8 ,9 ,10 ,三 ,7 ,4和1,2,12之间,∗
亚历杭德拉·布鲁纳
1英国剑桥大学肿瘤与癌症研究所,英国剑桥大学李嘉诚中心,剑桥CB2 0RE
奥斯卡·M·。鲁埃达
1英国剑桥大学肿瘤与癌症研究所,英国剑桥大学李嘉诚中心,剑桥CB2 0RE
温迪·格林伍德
1英国剑桥大学肿瘤与癌症研究所,英国剑桥大学李嘉诚中心,剑桥CB2 0RE
安基塔·萨蒂·巴特拉
1英国剑桥大学肿瘤与癌症研究所,英国剑桥大学李嘉诚中心,剑桥CB2 0RE
毛里齐奥·卡拉里
1英国剑桥大学肿瘤与癌症研究所,英国剑桥大学李嘉诚中心,剑桥CB2 0RE
拉杰比尔·纳特·巴特拉
1英国剑桥大学肿瘤与癌症研究所,英国剑桥大学李嘉诚中心,剑桥CB2 0RE
凯瑟琳·波格勒布尼亚克
1英国剑桥大学肿瘤与癌症研究所,英国剑桥大学李嘉诚中心,剑桥CB2 0RE
何塞·桑多瓦尔
1英国剑桥大学李嘉诚中心剑桥研究所肿瘤与癌症研究系,英国剑桥CB2 0RE
约翰·W·。卡西迪
1英国剑桥大学肿瘤与癌症研究所,英国剑桥大学李嘉诚中心,剑桥CB2 0RE
Ana Tufegdzic-Vidakovic女士
1英国剑桥大学肿瘤与癌症研究所,英国剑桥大学李嘉诚中心,剑桥CB2 0RE
斯蒂芬·约翰·萨穆特
1英国剑桥大学肿瘤与癌症研究所,英国剑桥大学李嘉诚中心,剑桥CB2 0RE
琳达·琼斯
1英国剑桥大学李嘉诚中心剑桥研究所肿瘤与癌症研究系,英国剑桥CB2 0RE
2英国剑桥CB2 2QQ剑桥大学医院NHS基金会托拉斯剑桥乳腺科、NIHR剑桥生物医学研究中心和剑桥实验癌症医学中心
埃琳娜·普罗文扎诺
2英国剑桥CB2 2QQ剑桥大学医院NHS基金会托拉斯剑桥乳腺科、NIHR剑桥生物医学研究中心和剑桥实验癌症医学中心
理查德·贝尔德
1英国剑桥大学肿瘤与癌症研究所,英国剑桥大学李嘉诚中心,剑桥CB2 0RE
2英国剑桥CB2 2QQ剑桥大学医院NHS基金会托拉斯剑桥乳腺科、NIHR剑桥生物医学研究中心和剑桥实验癌症医学中心
彼得·埃鲁
三加拿大不列颠哥伦比亚省癌症研究中心分子肿瘤学系,温哥华,BC V5Z 1L3
詹姆斯·哈德菲尔德
1英国剑桥大学肿瘤与癌症研究所,英国剑桥大学李嘉诚中心,剑桥CB2 0RE
马修·埃尔德里奇
1英国剑桥大学肿瘤与癌症研究所,英国剑桥大学李嘉诚中心,剑桥CB2 0RE
安妮·麦克拉伦·杜格拉斯
4英国剑桥郡CB10 1SA Hinxton Wellcome Trust Genome校区Wellcome-Trust Sanger学院
安德鲁·巴索普
4英国剑桥郡CB10 1SA Hinxton Wellcome Trust Genome校区Wellcome-Trust Sanger学院
霍华德·莱特福特
4威康信托桑格研究所,威康信托基因组校区,英国剑桥郡欣克斯顿CB10 1SA
马克·J。奥康纳
5DNA损伤反应生物学区,肿瘤学IMED,阿斯利康,阿尔德利公园,麦克斯菲尔德SK10 4TG,英国
乔·格雷
6俄勒冈州健康与科学大学OHSU奈特癌症研究所,地址:3181 SW Sam Jackson Park Road,Portland,OR 97239,USA
哈维尔·科尔特斯
7西班牙巴塞罗那瓦尔德赫布伦肿瘤研究所,08035
何塞·巴塞尔加
8美国纽约州10065斯隆-凯特琳纪念癌症中心医学部人类肿瘤和发病机制项目
伊丽莎白·马兰戈尼
9法国巴黎乌尔姆街26号居里研究所翻译研究部,邮编75005
阿拉纳L。韦尔姆
10亨茨曼癌症研究所,美国犹他州盐湖城,邮编84112
塞缪尔·阿帕里西奥
三加拿大不列颠哥伦比亚省癌症研究中心分子肿瘤学系,温哥华,BC V5Z 1L3
维奥莱塔·塞拉
7西班牙巴塞罗那瓦尔德赫布伦肿瘤研究所,08035
马修·J·。加内特
4英国剑桥郡CB10 1SA Hinxton Wellcome Trust Genome校区Wellcome-Trust Sanger学院
卡洛斯·卡尔达斯
1英国剑桥大学肿瘤与癌症研究所,英国剑桥大学李嘉诚中心,剑桥CB2 0RE
2英国剑桥CB2 2QQ剑桥大学医院NHS基金会托拉斯剑桥乳腺科、NIHR剑桥生物医学研究中心和剑桥实验癌症医学中心
1英国剑桥大学李嘉诚中心剑桥研究所肿瘤与癌症研究系,英国剑桥CB2 0RE
2英国剑桥CB2 2QQ剑桥大学医院NHS基金会托拉斯剑桥乳腺科、NIHR剑桥生物医学研究中心和剑桥实验癌症医学中心
三加拿大不列颠哥伦比亚省癌症研究中心分子肿瘤学系,温哥华,BC V5Z 1L3
4英国剑桥郡CB10 1SA Hinxton Wellcome Trust Genome校区Wellcome-Trust Sanger学院
5DNA损伤反应生物学区,肿瘤学IMED,阿斯利康,阿尔德利公园,麦克斯菲尔德SK10 4TG,英国
6俄勒冈州健康与科学大学OHSU奈特癌症研究所,地址:3181 SW Sam Jackson Park Road,Portland,OR 97239,USA
7西班牙巴塞罗那瓦尔德赫布伦肿瘤研究所,08035
8美国纽约州10065斯隆-凯特琳纪念癌症中心医学部人类肿瘤和发病机制项目
9法国巴黎乌尔姆街26号居里研究所翻译研究部,邮编75005
10亨茨曼癌症研究所,美国犹他州盐湖城,邮编84112
11第一作者
12潜在联系人
2016年2月5日收到;2016年6月21日修订;2016年8月18日接受。
这是一篇CC BY许可下的开放存取文章(http://creativecommons.org/licenses/by/4.0/).
结果
代表大多数乳腺癌临床和分子亚型的乳腺癌PDTXs的生成
我们通过将肿瘤样本植入高度免疫缺陷小鼠(NOD.Cg-Prkdcscid Il2rgtm1Wjl/SzJ或NSG),建立了一个大型的人类乳腺癌活组织移植库(n=83);参见STAR方法). 有关患者和植入产生PDTX的原始癌症样本的综合临床信息,请参见表S1迄今为止,PDTXs已从原发(n=46)和转移(n=37)部位成功建立,超过50%(n=50)来自ER+疾病(表S1). 初始植入和随后重新植入后PDTX的生长速率在不同模型中是可变的,在连续植入后大多保持稳定,并且在来源于内质网瘤的外植体中趋向于更快(A显示了31款车型的数据)。重要的是,迄今为止测试的所有已建立的模型都可以进行快速冷冻,然后成功植入,从而确保生物库的持久性。
代表乳腺癌亚型的广泛注释乳腺癌PDTX-PDTC生物库的推导
(A) 已建立PDTX模型的植入时间表(n=31;ER+为红色;ER−为蓝色)。每个方块代表植入的时间点。ER+和ER−平均重新植入时间显示在最右侧的面板上。模型ID根据集成集群(IntClust)进行颜色编码。
(B) 条形图显示PDTX模型的IntClust分布(n=40;阴影),用于比较METABRIC的原发性乳腺癌(n=1980;密集)。
(C) TCGA队列(n=495)和PDTX模型(n=30)中肿瘤体细胞突变的分布,按ER状态分层。
另请参见.
为了使用我们描述的方法将其分类为IntClust之一(Ali等人。,2014),PDTX通过浅层全基因组测序(“sWGS”)进行拷贝数分析,并通过微阵列(“RNAexp”)进行表达分析。每个IntClust中PDTX的拷贝数分布与原发性肿瘤中报道的相似(Curtis等人。,2012;A) ●●●●。计算IntClust分配的拟合优度得分(对于具有多个异种移植模型的IntClust:IntClust1、IntClust3、IntClust4、IntClust5、IntClut6、IntClist9和IntClust10),除一个例外(IntClust2)外,这些得分与对原发性肿瘤的分类非常相似(B) ●●●●。
与相关和STAR方法
(A) 复制基于顺式-定义10个集成集群的功能(Curtis等人。,2012)在METABRIC发现数据集(n=997个乳腺肿瘤)和PDTX生物库(n=121个来自36个模型的样本)中。
(B) 左面板:基于拷贝数的IntClust亚型分类的拟合优度得分(Metabric队列n=905个肿瘤,PDTX队列n=87个来自36个模型的样本)。右面板:METABRIC队列IntClust亚型的Kaplan-Meier(疾病特异性生存率)。IntClust4进一步分层为ER-+和ER-。
(C) 跨样本癌症途径激活评分的层次聚类(Ward方法)。包括从METABRIC队列和19个PDTX模型(加上5个技术复制品)的10个IntClust中随机抽取的15个样本。
(D) PDTX中癌症通路激活评分的再现性和预测准确性散点图(16个模型中的n=78对肿瘤/PDTX)。利用配对肿瘤和PDTX中癌症路径评分的Spearman相关性评估再现性。通过拟合广义加性模型并计算所解释的偏差来确定预测精度。
已知乳腺癌驱动基因中的拷贝数畸变(Curtis等人。,2012)PDTX中包含的增益/放大MYC公司(78%),CCNE1型(34%),ZNF703型(25%),CCND1号机组(31%),MDM2型(25%),以及ERBB2号机组(9%)和删除PTEN公司(41%),PPP2R2A型(72%),CDKN2A型(47%),以及CDKN2B型(47%). 这种CNA频率分布与乳腺癌临床人群中的频率分布不同(METABRIC数据集),反映了PDTXs的起源(约45%来自转移性活检)和三阴性基底样癌的过度植入(IntClust10)ER+肿瘤的更具侵袭性亚型(IntClust1和IntClust9;B) ●●●●。相反,我们观察到来自预后较好的亚型(IntClust3、IntClust4、IntClust7和IntClust8;B类;表S1).
使用基因集变异分析(GSVA)方法对mRNA表达数据进行下游分析(Hänzelmann等人。,2013),一种估计通路活性的方法,也显示了癌症相关通路中活性分数的多样性(分子特征数据库;http://software.broadinstitute.org/gsea/msigdb;Liberzon等人。,2011)PDTXs与乳腺癌临床人群的观察结果相似(C) ●●●●。此外,在配对中,PDTX中乳腺癌相关通路(例如PTEN、Tp53、BRCA1、Her2和Cyclin D1)的活性与原始乳腺癌样本中的活性得分相关并预测其活性得分(D) ●●●●。
植入PDTX的亚型分布也通过使用全基因组测序(“WES”)确定的突变频率反映出来。ER−乳腺癌中最常见的突变基因(癌症基因组图谱网络,2012)在ER−PDTX中以类似频率突变(C) ●●●●。相反,ER+PDTX中突变基因的频率反映了ER+肿瘤更具侵袭性亚型中发现的频率(Pereira等人。,2016). 例如,PIK3CA公司只有27%的ER+PDTX模型发现突变(C) 相比之下,在METABRIC和癌症基因组图谱(TCGA)队列中分别为46%和38%。
总之,这些数据表明,我们成功地建立了乳腺癌异种移植物的活生物库,代表了该疾病的临床和分子多样性。
PDTX通过传递保持其原始组织和分子特征
组织学上,PDTXs(分析了23个模型)显示出与原发肿瘤相似的形态学;如匹配的癌症患者样本所示,异种移植物中存在小管形成和相关基质(A) ●●●●。多个PDTX通路的组织学检查(表S2)结果表明,连续植入后肿瘤组织形态保持稳定。对上皮标记物(CK5、CK8、CK14、CK18、E-cadherin和上皮特异性抗原)和临床生物标记物(ER、PR、Her2、Ki67和p53)的免疫组织化学分析表明,在PDTX模型和原始乳腺癌样本的配对中,这些特征相似,并且在传代过程中始终保持不变(A和表S2用于数据汇总)。
与相关STAR方法和A和2B
(A) PDTX组织病理学分析的代表性图像。图中显示了不同通道的ER+(STG335)和三负(STG139)模型的图像。
(B) 基于从WES到人类基因组的映射读取比例估计小鼠含量的校准曲线。
(C) WES数据中估计的小鼠污染百分比。顶部面板:表示不同段落中每个模型的数据。底部面板:方框图显示了每个模型的人类细胞在所有测试样本中的百分比分布,包括来自同一传代和同一模型的不同小鼠,以及同一模型的不同传代(29个模型的n=94个样本;对同一模型和传代的估计值进行了平均)。
(D) PDTX样本FFPE组织切片上单个细胞的代表性FACS图(左)和FISH图像(右)。表显示了FACS测试的不同PDTX模型中小鼠细胞的平均百分比。
使用sWGS(用于CNA)、WES(用于单核苷酸变异[SNVs])、还原-重表达亚硫酸氢盐测序(“RRBS”)(用于DNA甲基化)和RNAexp(用于全局表达和通路活性分析)对PDTX样品的多个传代进行了全面的分子表征。
PDTX样本测序数据的分析因存在数量可变且未知的小鼠细胞而变得复杂。为了解决这个问题,我们创建了一系列含有已知人类和小鼠DNA混合物的对照样品的稀释序列,以开发一个强大的计算管道来区分人类和小鼠的读数,准确度>99.9%(参见B和STAR方法详细信息)。这条管道确定了三个自发的小鼠肿瘤,它们出现在植入部位或附近,这些肿瘤在进一步的实验中被丢弃。来自该管道的后过滤对齐数据用于体拷贝数和突变调用(参见STAR方法).
我们使用这些数据来确定植入、连续传代和复制植入如何影响基因表达、癌症途径激活分数、体细胞突变的等位基因部分、CNA和DNA甲基化。这项分析也是为了比较参考数据集(不同的肿瘤样本以及技术和生物复制品),揭示了所有数据类型的匹配样本对之间的高度相关性(A) ●●●●。
PDTX与原始患者癌症样本紧密匹配
(A) 跨分子数据类型的皮尔逊相关分数热图(正文中描述了不同的样本大小)。
(B) 五类分子数据的单独示例面板。(左面板:顶部)显示了AB551(原始样品[T]、PDTX和PDTC)的CNA图;显示了AB521M中甲基化CpG(来自RRBS数据)的(底部)散点图。(右面板:顶部)显示了AB521M中通路活性得分的散点图。STG139中不同等位基因片段的(中间)散点图。(底部)显示了AB551中的突变剖面。
模型的生物学相关性通过以下方面得到证明:原发肿瘤和PDTX之间的相似基因表达谱(RNAexp n=44;r=0.95;四分位区间[IQR]0.94-0.97)、致癌途径评分(r=0.67;IQR 0.44-0.79)、CNA谱(sWGS n=45;r=0.91;IQR0.84-0.93)、SNV等位基因部分(WES n=82;r=0.81;IQR 0.74–0.88)和DNA甲基化谱(RRBS n=8;r=0.82;IQR 0.89–0.84)。通过连续传代,模型的生物稳健性也很显著,保留了基因表达谱(RNAexp n=217;r=0.98;IQR 0.97-0.99)、致癌途径评分(r=0.87;IQR0.80-0.93)、CNA谱(sWGS n=109;r=0.97;IQR0.92-0.98)、SNV等位基因部分(WES n=201;r=0.92;IQR 0.87–0.95)和DNA甲基化谱(RRBS n=37;r=0.82;IQR 0.78–0.90;A) ●●●●。变异签名(Alexandrov等人。,2013,Rosenthal等人。,2016)在连续传代的匹配PDTX中,原始样本也被保存(B) ●●●●。单个PDTX模型的分子数据类型的代表性示例如所示B。
总之,人类乳腺癌外植体生物库的组织病理学特征、体细胞基因组畸变(CNA和SNV)、甲基化特征和基因表达的综合表征证实,这些模型与其匹配的起源癌具有显著的多维分子相似性,大大扩展了我们和其他人之前报告的观察结果(DeRose等人。,2011,Eirew等人。,2015,Li等人。,2013,Marangoni等人。,2007). 我们的发现有力地证明了这些多维分子特征通过小鼠连续植入而得以保存。
PDTXs的小鼠基质成分通过传递保持稳定
乳腺癌PDTX保留了与原发肿瘤相似的结构,并且通过传代,这一结构保持稳定。尽管小鼠间质取代了人类间质,但仍会出现这种情况(DeRose等人。,2011,伊达尔戈等人。,2014). 我们使用了上面描述的自定义序列分析管道(B类;STAR方法)解卷积PDTX样品中小鼠DNA序列的比例,作为小鼠基质细胞含量的替代物。在所检测的94份异种移植物样本中,只有5份含有40%以上的小鼠细胞。从这五个复制品中获得的小鼠基质含量较低,反映了PDTX内的异质性(C) ●●●●。来自多个PDTX模型的数据还表明,小鼠内容物的比例在不同代次之间没有显著变化(C) ●●●●。使用两种独立的方法来验证这些观察结果:用MHC I类抗小鼠H-2Kb/H-2Db抗体对PDTX衍生的单细胞悬浮液进行荧光激活细胞分选(FACS),以及在组织切片中用小鼠和人着丝粒探针进行荧光原位杂交(FISH)(劳森等人。,2015,Li等人。,2013;D) ●●●●。
总之,这些数据表明小鼠基质对异种移植物的贡献在连续传代中是稳定的。
PDTX中保持了肿瘤内异质性和克隆结构
人类乳腺癌由突变含量不同的克隆组成(Aparicio和Caldas,2013年)导致肿瘤内基因组异质性。这种瘤内异质性虽然在肿瘤间存在差异,但在诊断时已经存在(Shah等人。,2012)并在空间和时间上动态演化(Ding等人。,2010,Murtaza等人。,2015,Shah等人。,2009).
WES数据用于检查匹配的原发肿瘤、初始移植和连续传代异种移植物的瘤内异质性和克隆结构。
使用突变等位基因肿瘤异质性(MATH)方法量化肿瘤内异质性(Mroz和Rocco,2013年)结果显示,由于IntClust亚型的多样性,原始患者肿瘤样本的得分范围从低到高不等。匹配PDTX多代的异质性得分相似,表明外植体保留了肿瘤内异质性(A) ●●●●。
与相关和STAR方法
(A) 分析的每个模型的MATH得分箱线图(39个模型中的238个样本)。每个方框图表示匹配肿瘤(红色T)、PDTX和PDTC的得分分布。
(B) 克隆簇流行率平均变化图。PyClone用于推断来自每个PDTX模型的一组样本的克隆结构。对于具有两个以上样本的所有PDTX模型,克隆簇患病率的绝对变化在所有簇上取平均值。左图:PDTX细胞短期培养后克隆簇患病率的平均变化(3个模型的n=5个比较)。中间图:克隆簇流行率随连续传代的平均变化(12个模型中的38代)。右图:植入后克隆簇患病率的平均变化(原始样本与最早PDTX传代;16个模型中的24对)。网点大小与所分析的样本数量成正比。
(C) PyClone个体聚类图显示22个模型的克隆平均细胞流行率。宽度线与每个克隆簇中的变体数量成比例。图例指示集群的名称和其中变体的数量。星号表示集群的细胞频率在样本之间存在显著差异。图中仅显示具有至少一个变量的簇。
使用PyClone对来自22个模型的104个样本进行了个体样本中的克隆结构和植入后的克隆动力学和跨系列传代评估(Roth等人。,2014),正如我们最近所描述的(Eirew等人。,2015). PyClone在分析的样本中识别出190个克隆簇,但只有38个克隆簇(20%)的细胞流行率估计值发生了显著变化(表S3获取所有测试模型中PyClone分析的扩展信息)。首次植入时可以看到克隆选择(克隆流行率的平均变化为0.21),但通过连续移植可以看到最小的克隆选择(平均克隆流行率变化为0.07;B) ●●●●。接下来,我们询问显示植入相关动力学的克隆簇是否丰富了癌症驱动因素。最近,我们小组使用了比率法(Vogelstein等人。,2013)2433例乳腺癌中40个乳腺癌突变驱动基因的鉴定(Pereira等人。,2016). 值得注意的是,在植入后或传代过程中发生显著变化的38个克隆簇中,只有4个克隆簇可以确定突变驱动因素:BAP1号机组STG139中(集群12);KDM6A系列HCI004(集群3)中;地图3K1STG143(集群3)中;和PIK3CA公司HCI008(集群2;表S3). 这些数据强烈表明,异种移植物中的大多数克隆动力学与已知的驱动基因无关。A显示了单个克隆聚类图和这些聚类中单个基因的变异等位基因频率分布的示例。C显示了所分析的22个模型生成的所有单个克隆聚类图,以说明PDTX生物库中观察到的克隆结构的完全多样性。
乳腺癌PDTXs的克隆结构和克隆动力学
(A) AB551(左面板)、HCI002(中面板)和STG282(右面板)的示例图。(左图)显示了原始患者样本(T)和后续异种移植物传代(Xn;n代表传代数)或PDTC(XnCy;y代表培养天数)中突变簇的平均细胞流行率估计值。PyClone被用于利用WES数据推断集群和细胞流行率。线宽表示包括每个突变簇的SNV的数量(每个图附近括号中的数字)。星号表示细胞患病率发生显著变化的克隆簇。(右图)簇内选定基因的变异等位基因频率分布图。
(B) STG139和AB521样本的PyClone图(如A)和细胞流行率热图。
(C) 在CAMBMT1中五个空间分离的活检组织及其匹配的异种移植物的簇内(如A)选定基因的PyClone图和变异等位基因频率分布图。
另请参见.
我们详细分析了两例原发和继发转移样本均为STG139和12个月后肺转移、STG139M和AB521以及8个月后肝转移、AB521M的克隆结构。对于第一个患者,我们从原发肿瘤(STG139-X)和肺转移瘤(STG1139M-X)中生成异种移植物,对于第二个患者,则从肝转移瘤(AB521M-X)生成异种移植。B显示了克隆聚类图和从两名患者的样本集的WES数据导出的变异等位基因频率的热图。原始原发肿瘤和转移样本共享的克隆簇(STG139:克隆簇1、7和8;AB521:克隆簇2、8和10)在整个传代过程中具有稳定的细胞流行率。这些簇包含这两例中检测到的所有SNV的80%左右(B) 不仅包括茎或躯干簇,还显著包括亚克隆簇甚至非常小的簇(估计细胞流行率<5%)。仅转移的克隆簇(STG139:簇4;AB521:簇7)也在连续传代后保留。最后,仅在植入衍生样品中检测到簇(克隆簇3、11和12分别位于STG139和AB521中)。尽管这些结果需要一定程度的谨慎解释(仅分析了两个病例),但它表明,原发肿瘤和异种移植物都包含多个克隆,克隆在患者(通过比较原发和转移活检)和小鼠(通过比较传代)中的动态既有相似之处,也有不同之处。对更匹配的原发性转移样本及其衍生PDTX的克隆动力学的详细分析,以及镜像治疗方案,将为理解肿瘤克隆生态系统中的作用机制提供极其丰富的信息(赫普纳,1984年,Tabassum和Polyak,2015年).
从一个大的乳腺癌脑转移(CAMBMT1)中,我们获得了五个空间分离的活检,并将其植入五个不同的NSG小鼠。所有五次活检的WES数据显示出相似的克隆结构(C、 左侧面板;表S3). 该病例使我们能够比较五个异种移植样本的克隆结构,显示出显著的相似性,尽管在单独的活检中原始细胞的流行率有一些差异(例如,参见GATA3协议,OTOGL公司、和BTD公司;C、 右侧面板)。植入后的这些近乎相同的克隆动力学强烈表明,确定性机制作用于克隆选择,并验证了我们先前的假设,即特定突变作为适合度的遗传标记并决定进化轨迹(Eirew等人。,2015).
总之,这些数据表明PDTXs构成了一个临床前模型,它捕获了人类癌症最具临床相关性的特征:动态进化的异质基因组结构。此外,数据还表明,衍生和连续传代外植体的克隆动力学不是随机的。
PDTC短期培养物的生成
所述PDTX构成了乳腺癌外植体的活生物库,通过传代保留了临床上遇到的肿瘤间和肿瘤内异质性。因此,我们开发了一种方法,能够将这种宝贵的资源用于高含量临床前药物筛选,类似于广泛用于细胞系的方法(Barretina等人。,2012,加内特等人。,2012). 该方法包括优化从PDTX(称为PDTCs)分离的细胞的短期体外培养。这些短期PDTC培养成功地从所有尝试的模型中生成(n=27,每个模型至少有两个不同的传代;A;看见STAR方法).
与相关和STAR方法
(A) 电镀后第7天,8个PDTX短期培养模型(PDTCs)的代表性显微镜图像。
(B) 显示PDTX(n=94个样本)和PDTC(n=15个样本)模型(n=29)上人类DNA百分比的方框图。根据我们基于序列的方法估计的数据。
(C) 每个时间点PDTC细胞数量和活性的变化。
(D) PKH26分析的代表性FACS图像。表中显示了2个PDTC(STG195和STG201)和一个高增殖乳腺癌细胞系(MDAMB231)中PKH26低细胞在不同时间点的定量,以供比较。
(E) 使用3种不同的活性分析,比较8种模型(AB521、AB555、AB582、STG195、STG316、STG321、STG335和VHIO093)中19种药物的AUC值,以测量药物反应。测试了10种不同剂量。AUC的曲线拟合和计算如STAR方法。以颜色突出显示的点对应于PI3K途径抑制剂:GDC032(PI3Kα)为红色,GDC0941(泛PI3K)为蓝色,AZD6482(PI3Kβ)为紫色,AZD 8055(mTOR)为绿色。
测序数据证实,PDTC具有与原始PDTX中发现的相似比例的小鼠衍生细胞(B) ●●●●。对培养物中的细胞增殖、细胞活力和细胞分裂(通过PKH26分析测定)进行了分析,并显示了不同模型之间的预期差异,反映了源癌的多样性(C和S4D)。
使用WES、sWGS和RNAexp对十种PDTX模型衍生的PDTC进行了广泛表征。对这些数据的分析表明,体外培养的短PDTC保留了原始PDTX的分子特征(A和2B),包括类似的克隆结构(A、,B、 和S3C;表S3). 在匹配的PDTC-PDTX对中克隆簇细胞流行率的平均绝对变化为0.08(B、 左侧面板)。
总之,PDTC可以从PDTX系统地、一致地生成,并保留其基因组特征,使其成为高通量药物筛选的优秀模型系统。
PDTC模型中的高通量药物筛选
我们测试了PDTCs作为临床前药物筛选平台的使用,其方法与我们之前报道的细胞系和类有机物筛选方法类似(加内特等人。,2012,van de Wetering等人。,2015). 选择22种不同的PDTX模型作为PDTC进行电镀,24小时后用108种化合物进行筛选,共进行6634次药物测试(参见STAR方法). 使用的化合物要么是批准的癌症治疗药物,要么是针对关键癌症途径的药物(表S4). 通过CellTiter-Glo(CTG)测定药物处理对细胞活性的影响(加内特等人。,2012,van de Wetering等人。,2015)和由(1)半最大抑制浓度(IC)表示的药物反应50),(2)剂量-反应曲线,以及(3)剂量-响应曲线(AUC)下的面积。总共测试了2550种药物PDTC组合,每种药物筛选了5-20个PDTC模型(平均值=16)。对于大多数模型,药物治疗至少在三个技术重复(相同模型、相同传代和相同小鼠)和两个或三个生物重复(相同模型、不同传代)中进行。
这些分析的一个重要限制是,这些测量(IC50和AUC)没有考虑不同PDTC模型的细胞分裂率。生长速率抑制指标最近被证明可以提供更可靠的癌症药物敏感性测量(哈夫纳等人。,2016). 尽管如此,我们还是进行了几次观察,证明了尽管有此警告,但药物筛选结果的价值。
首先,所有受试药物和模型的观察AUC值在技术(皮尔逊相关系数为0.94)和生物复制(皮尔逊相关性为0.78;A) ●●●●。这些结果与我们之前在已建立的细胞系或肿瘤器官中报道的结果非常相似(加内特等人。,2012,van de Wetering等人。,2015). 为了进一步验证这些体外药物反应数据的稳健性,我们使用CyQUANT和Sytox端点分析以及CTG(参见STAR方法). 这些实验的结果表明,独立于所用的分析,药物反应高度相关(E;表S5).
利用PDTC进行高通量药物筛选
(A) 显示PDTC药物测试再现性的AUC散点图。(左面板)显示了技术复制品的AUC(n=6325;相同样品,相同化合物)。(右图)显示了生物复制品的AUC(n=1341;相同模型、不同传代、相同化合物)。r、 皮尔逊相关性。
(B) 靶向PI3K/AKT/mTOR通路的所有药物的AUC散点图(20个模型中的34代)。红色表示皮尔逊相关性>0.5。
(C) 受试模型中顺铂和BMN-673治疗的AUC散点图(n=15)。
(D) PI3K通路的插图,面板描述了模型(n=15)中AUC的差异,路径成员中有无分子改变。(左面板)显示了PI3Kα和PI3Kβ抑制剂。(右面板)显示AKT1和mTOR抑制剂。
另请参见,、和.
其次,对靶向相同途径或具有类似作用机制的化合物的AUC数据分析显示出高度相关的反应谱。PI3K-AKT-mTOR途径抑制剂(NVP-BEZ235/dattolisib、AZD8055、GDC0941/pictilisib、AKT抑制剂和MK-2206)的一个示例如所示B.靶向同源重组修复缺陷的化合物(PARP抑制剂BMN-673/他拉唑帕利和顺铂,一种DNA交联剂)的另一个示例如所示C、。
不同的PDTC型号有时可以共享相同的IC50和化合物的AUC值,具有非常不同的剂量-反应曲线。因此,开发了一种基于剂量-反应曲线斜率模式的新方法,将药物敏感性模式分为八组(参见STAR方法).A显示了在使用该药物测试的所有模型中,每种化合物的药物反应在八种药物敏感性模式中所占的比例。药物敏感性模式的聚类(B) 证实了数据的高重复性和生物稳健性:相同模型的不同通道和具有相似作用机制和靶向特异性的化合物聚集在一起。
与相关和STAR方法
(A) 根据反应曲线将药物反应分为8组。左侧面板-药物反应分为8组。右侧面板-显示每种化合物的每个药物反应模式的样本百分比图(20种模型中的37个样本)。显示药物名称(粗体)和假定靶点。
(B) 根据药物反应模式的亚型(颜色编码如A所示),对受试模型(20个模型中的37个样本)中的药物反应进行无监督聚类。纵轴-药物;横轴-模型。
第三,我们探讨了PDTC药物反应和分子数据的联合分析是否概括了已知的药物敏感性和耐药性机制。例如,在测试的三个Her2+模型中,有两个对EGFR/ERBB2抑制剂BIBW2992(阿法替尼)敏感(A) ●●●●。对PARP抑制的敏感性(Drew等人。,2011)在一个有体细胞的模型中看到巴西航空公司1启动子甲基化和随后的表达缺失(STG201),以及在一名生殖系感染患者的模型中巴西航空公司1突变(VHIO124;B和S6C;表S6、和分别用于体内和体外数据)。有趣的是,来自巴西航空公司1种系突变携带者对PARP抑制剂具有耐药性,并且这些携带者具有以下失活突变:53制动踏板1(STG316:c.134+3A>c)和MAD2L2型(VHIO179:c.66_67delAG;表S6;). 以前曾报道过由于非同源末端连接(NHEJ)缺失而导致PARP抑制剂的耐药性53制动踏板1(Bouwman等人。,2010,Bunting等人。,2010,查普曼等人。,2012)和MAD2L2型(Boersma等人。,2015,Xu等人。,2015). 因此,这些数据进一步证明乳腺癌外植体重述了药物敏感性和耐药性的已知机制。
体内PDTX试验验证体外PDTC药物反应
几种模型中代表性的敏感(灰色面板)和耐药(粉红色面板)药物反应。(左图)显示PDTC体外剂量反应。(右图)显示了PDTX体内肿瘤生长曲线(图中显示了样本量;显示了代表SD的平均值和误差条)。
另请参见.
与相关和STAR方法
(A) AUC和iC50值(百分比,参见STAR方法)用于EGFR/ERBB2抑制剂BIBW2992(Afatinib)。点表示使用所有技术复制的估计值,误差条是使用每个技术复制单独获得的估计值的标准误差。
(B) 通过RRBS测量BRCA1启动子甲基化百分比(n=33个模型)。
(C) 通过表达微阵列测量BRCA1表达(19个模型的35个样本)。
最后,我们探索了PI3K通路抑制背景下的多层分子数据。在D、 我们展示了PI3K-AKT-mTOR通路的示意图,以说明关联的复杂性。对PI3Kα抑制剂的敏感性{“type”:“entrez protein”,“attrs”:{“text”:“GDC00941”,“term_id”:“1619842378”,“term_text”:“GDC00941”}GDC00941号(pictilisib)在具有PIK3CA公司-激活突变(3/15),PTEN公司损失(5/15),INPP4B公司损失(2/15)、高p-AKT水平(4/15)或这些特征的组合(表S6). 比较通路中是否存在生物标记物(基于表达、SNV、CNA或启动子甲基化)时对通路抑制剂的反应差异(用AUC测量)。这显示了突变型与野生型的模型PIK3CA公司对PI3Kα和AKT抑制剂的反应较好,但对mTOR和PI3Kβ抑制剂的反应较差。我们对最近在乳腺癌模型中测试的BET抑制剂JQ1进行了类似的分析(Shu等人。,2016). 我们测试了19个模型,其中7个对JQ1敏感,包括4/7 ER+(IntClust1[3]和IntClust10[1])和3/12 ER−(IntClus10[2]和IntClus9[1]);表S6).
这些数据突出了乳腺癌中单个生物标记物/药物反应相关性的异质性,并表明对分子和药物反应数据的综合分析信息更丰富。预计未来将使用对细胞分裂率不敏感的新药物反应指标进行进一步改进。
使用PDTC测试药物组合
联合治疗越来越多地被用作对抗癌症治疗中耐药性发展的一种方法。为了测试PDTC模型在高通量药物联合分析中的应用,我们设计了一个5×5的基质,其中含有标准的化疗药物(顺铂和紫杉醇)和六种临床相关的靶向化合物(A) ●●●●。这些药物-药物组合分析中的单药反应与108个单独化合物筛选中获得的反应高度相关(皮尔逊相关系数0.84),进一步证实了我们的PDTX/PDTC平台的稳健和可重复性能(B) ●●●●。Bliss模型(参见STAR方法),一种不需要精确估计IC的方法50s、 用于计算协同作用和拮抗作用。通过在Her2-阳性模型(HCI008)中显示Hsp90抑制剂(17-AAG或丹皮霉素)与紫杉醇的协同作用,验证了Bliss模型的性能,这一点之前已有报道(莫迪等人。,2011;A) ●●●●。使用六种目标化合物测试成对组合(A) 证实了合理预测的IGFR1/INSR1抑制剂(BMS-754807)与双重PI3K/mTOR抑制剂(NVP-BEZ235)或EGFR抑制剂(吉非替尼/艾瑞莎;B) ●●●●。
PDTC中的药物联合研究
(A) 紫杉醇与17-AAG的协同作用。(顶面板)显示了紫杉醇组合的Bliss独立模型残差。绘制了这些差异的95%(百分比)。对于每种药物组合,将预期反应与组合中所有剂量范围内的观察反应进行比较。(中间面板)显示了测试的每个PDTC模型中紫杉醇和17-AGG组合的残差分布(布利斯独立性模型)的方框图。(底部面板)显示了HCI008的详细分析(从上到下:单药曲线、组合的双变量等渗拟合以及每个剂量组合的Bliss模型残差)。红色阴影,协同效应;蓝色阴影,拮抗作用。
(B) IGF-1R/IR抑制剂(BMS-754807)与PI3K/mTOR抑制剂(NVP-BEZ235)的协同作用。面板与A中相同(底部面板:STG201的详细分析)。
与相关和STAR方法
(A) 试验药物组合表。
(B) 散点图显示了在单个化合物筛选和药物组合筛选中作为单一药物测试的所有药物的AUC值。显示了皮尔逊相关分数(n=125对8个模型进行比较)。
总之,这些数据表明PDTC可以成功用于测试药物组合。
PDTC检测预测PDTX体内药物反应
接下来,我们利用PDTXs作为异种患者进行一系列临床前试验,测试PDTC药物体外反应是否预测体内反应。鉴于PDTX最近被证明可以预测人类临床试验药物反应,这一步骤对于验证本文所述平台的实用性至关重要(Gao等人。,2015). 我们选择了40种在八种不同模型中测试的体外PDTC药物反应进行体内验证。值得注意的是,尽管有时必须在PDTX中使用具有相同特异性的不同化合物(出于剂型或生物利用度的原因),但40种体内外药物反应中有33种(82.5%)在体内得到了重现(例如:;表S7有关所有体外和体内药物测试的详细信息)。这包括验证PI3K-AKT-mTOR途径、ER、PARP、Wee1和IGFR1抑制剂的体内反应(A;表S7). 我们还在体内验证了预测的PI3K与IGFR1/INSR1抑制剂的协同组合(表S7).
总体而言,这些结果显示了在使用PDTX进行体内测试之前,PDTC作为预测药物反应模型的价值。
STAR★方法
实验模型和主题细节
人乳腺癌移植瘤活生物库的建立与维护
CRUK Cambridge Institute已经建立了一个人类乳腺癌移植库(A和表S1)在过去4年中,阿登布鲁克斯医院与欧洲合作医院(居里研究所、巴黎和VHIO、巴塞罗那)、美国(亨茨曼癌症研究所、犹他州盐湖城)和加拿大(UBC、温哥华)共同努力。剑桥的PDTX生物库继续扩大,平均每周植入3个乳腺癌样本。从患者采集到小鼠植入的时间范围为30-180分钟。
手术切除的原发性乳腺癌组织、脑、皮肤、肝脏、骨、腋窝和淋巴结转移的活检以及来自同意患者的胸腔积液或腹水样本。该研究得到了剑桥郡2 REC国家研究伦理服务局的适当批准(REC参考号:08/H0308/178)。将组织样本嵌入基质凝胶中,然后将其皮下植入2-4只严重免疫受损的雌性NSG小鼠。将胸腔积液和腹水样本离心,用水冲洗两次以清除红细胞,细胞颗粒在皮下注射到小鼠之前重新悬浮在50%基质凝胶:FBS溶液中。
PDTX被连续植入多个宿主,以允许每个模型(已建立的模型)的体内扩张。在每次传代时,将来自每只小鼠的异种移植物样品在液氮和冷冻介质(FBS/10%DMSO)中冷冻保存。始终对所有样本进行基因分型,以确认与原始患者衍生样本的匹配(见下文)。迄今为止,所有测试的模型都可以通过重新植入冷冻保存的组织来挽救。这包括成功植入从合作者网络获得的PDTX样本,这些样本均由适当的机构审查委员会获得,并根据材料转移协议转移至剑桥。所有动物实验均按照严格的内政部法规框架(项目许可证707679)进行。
活PDTX衍生肿瘤细胞的产生
使用无菌手术刀将新鲜收集或冷冻保存在FBS/10%DMSO中的异种移植组织切碎,并在DMEM/F12/HEPES(GIBCO)、1mg/ml胶原酶(Roche)、100U/ml透明质酸酶(Sigma)、25%BSA分数V(GIBC0)、5μg/ml胰岛素和50μg/ml庆大霉素(GIBCO)中分离最长90分钟。随后使用胰蛋白酶(GIBCO)、Dispase(StemCell技术)和DNase(Sigma)进一步分离。红细胞溶解是通过在HF介质(GIBCO):氯化铵(StemCell技术)的1:4溶液中清洗细胞颗粒来完成的。细胞在MEGM(Lonza)中重新悬浮,并通过40μm过滤器过滤。对于高通量药物筛选,细胞在384孔板的MEGM中以1x10的浓度进行电镀6cells/ml。其他体外试验使用个别方法中概述的细胞浓度。
样本命名法
每个样本ID遵循结构XXXX-A0C0,其中
XXXX:型号名称
A: 样本类型(T:肿瘤,N:正常,X:异种移植)
0:如果样品是异种移植物,传代次数(从零开始)
C: C表示PDTC
0:培养天数
名称中的任何R、R1都表示复制。
方法详细信息
组织病理学回顾
使用从含有来自患者肿瘤和异种移植物的材料的福尔马林固定石蜡包埋块中提取的重复0.6mm核来制备组织微阵列。
这些都是使用徕卡的聚合物精炼套件在其自动粘合平台上运行的。HIER(柠檬酸钠和三EDTA预处理)均在100°C下运行,时间如表所示。DAB增强剂(用于除ER和PR以外的所有抗体)参考号为AR9432。IHC前的脱蜡和再水化在自动徕卡ST5020上完成,IHC后的脱蜡与清除也是如此。最后,安装在徕卡的CV5030上完成。病理学家对幻灯片进行了审查。
PKH26分析
PKH26分析(Sigma)按照制造商的说明进行。简要地;1x10个7将异种移植单细胞悬浮液中的细胞在2x10中培养5分钟−6M PKH26。然后将细胞在MEGM培养基(Lonza)中悬浮培养。定期取等分样品,并在流式细胞术分析之前固定在2%中性缓冲福尔马林中。
中心体FISH
使用人类和小鼠特异性Star进行泛中心FISH∗FISH©染色体涂料(Cambio)。按照制造商的说明,在3-6微米FFPE组织切片上执行该方案。
异种小鼠基质细胞含量的流式细胞术分析
冷冻异种移植物样品制备为单细胞悬浮液。非特异性抗体标记通过在10%正常大鼠血清中孵育30分钟而被阻断。使用FITC抗鼠H-2Kb/H-2Db抗体[克隆号:28-8-6](Biolegend UK Ltd)定量小鼠基质含量百分比。
细胞活性测定
单细胞悬浮液由1.5 cm三将PDTX肿瘤以40000个细胞/孔的速度分三次电镀到384孔板中。24小时后将药物添加到微孔中。为了量化PDTC中的药物反应,在治疗6天后获得细胞存活率读数强度,并根据正负值进行标准化。为了使用CellTiter-Glo(CTG)独立验证我们的药物筛选方法的数据,我们筛选了8种模型,其中18种药物和细胞活力由CTG和两个进一步的测试(CyQUANT和SYTOX)并行测定。
体内PDTX的治疗
以下试剂在荷瘤NSG小鼠随机化后用于体内验证:MK-8669/Ridaforolimus作为变构mTORC1抑制剂(1mg/kg,5IW),BKM120/Buparlisib作为泛PI3K和BYL719,GDC0032/Taselisib作为PI3K-α抑制剂(分别为27.5,35mg/kg 6IW和5 mg/kg),LEE011/Ribociclib作为CDK4/6抑制剂(75mg/kg),AZD2281(Olaparib/Lynparza)作为PARP抑制剂(50mg/kg,5IW),AZD1775作为Wee1抑制剂(120mg/kg,5dON 9dOFF),Tamoxifen(10mg/ml,100μl daily)作为ER途径抑制剂。将肿瘤体积归一化为起始肿瘤体积,绘制平均体积,并与车辆治疗对照组进行比较。使用的小鼠数量和每个治疗臂的平均体积等详细信息如所示表S7.
所有实验程序均由剑桥大学动物福利和伦理审查委员会以及瓦尔德赫布伦医院临床调查伦理委员会和动物使用委员会批准。
实验设计
该项目的主要目标之一是研究植入肿瘤的分子特征的可变性和PDTC中的药物反应。为此,使用了不同水平的复制:肿瘤生物复制品(植入不同的原始癌症样本)、PDTX生物复制品,PDTC生物复制品(同一PDTX至少培养两倍于PDTC)和PDTX和PDTC的技术复制品。
没有采用特定的随机化策略,也没有使用盲法,但前一节所述的药物反应体内验证除外。由于这是一项初步研究,我们之前没有对植入之间的变异性进行估计,因此没有进行样本量计算。没有排除肿瘤植入的标准。
量化和统计分析
在所有分析描述中,我们将“模型”称为原发肿瘤、匹配正常样本、匹配PDTX通路或PDTCs的集合,“样本”称为给定模型的任何实例。
统计参数包括样本和模型数量方面的n的准确值,以及每个图形的位置和分散度量的定义,均在图形和图形图例中报告。
分析样品的细节和数量
全基因组测序
已排序的样本数:1
不同型号数量:1
139M标准
全外显子序列测定
已排序样本数:193
不同型号数量:33
AB521M、AB551、AB555、AB559、AB580、AB630、CAMBMT1、HCI001、HCI002、HCl004、HCL005、HCI008、HCI 009、HCI010、HCI-011、IC007、STG139、STG139M、STG143、STG195、STG201、STG282、STG316、STG335、VHIO039、VHIO089、VHIO 093、VHIO098、VHIO102、VHIO124、VHIO131IGFRES、VHIO179、VHIO 244
浅层全基因组测序
不同样本数:132
不同型号数量:32
AB521M、AB551、AB555、AB559、AB580、AB630、CAMBMT1、HCI001、HCI002、HCl004、HCL005、HCI 008、HCI009、HCI010、HCIC011、STG139、STG139M、STG143、STG195、STG201、STG282、STG316、STG335、VHIO039、VHIO089、VHIO093、VHIO098、VHIO102、VHIO124、VHIO131IGFRES、VHIO179、VHIO244
约化表示亚硫酸氢盐序列
已排序的样本数:68
不同型号数量:33
至少5次读取的平均CpG数:2355537
AB521M、AB555、AB559、AB564、AB572、AB580、HCI001、HCI002、HCI004、HCl005、HCI006、HCI 008、HCL009、HCI010、HCIC011、HCI-012、HCI014、IC006、STG139、STG139M、STG195、STG201、STG282、STG316、STG335、VHIO039、VHIO089、VHIO093、VHIO098、VHIO102、VHIO124、VHIO169、VHIO 179
表达式数组
样本数量:153
不同型号数量:39
AB521M,AB551,AB555,AB559,AB580,AB630,HCI001,HCI002,HCI004,HCI005,HCI006,HCI008,HCI009,HCI010,HCI011,HCI014,IC006,IC007,STG139,STG139M,STG143,STG195,STG201,STG282,STG316,STG335,VHIO006,VHIO039,VHIO089,VHIO093,VHIO094,VHIO098,VHIO102,VHIO124,VHIO131,VHIO161,VHIO169,VHIO179、VHIO244
药物筛选
单药试验:
单药试验总数(含技术复制):6634
单药试验次数:2550
不同型号数量:20
不同型号/通道数:37
不同药物数量:104
组合:
组合试验总数(含技术重复):288
组合测试次数:144
不同型号数量:8
不同型号/通道数:10
不同组合的数量:18
HCI002、HCI009、HCI010、HCI001、HCI005、HCI 008、HCl011、IC007、STG139、STG139M、STG143、STG201、STG195、STG282、STG316、STG335、VHIO098、VHIO179、VHIO169、VHIO244
用于区分老鼠和人类序列的计算管道
PDTXs测序数据的分析因存在小鼠基质污染而受阻。由于两个基因组之间的高度同源性,一部分老鼠的阅读仍然可以映射到人类基因组的同源区域,可能存在一些不匹配,严重影响下游分析。
为了开发一种能够解决这一问题的计算方法,我们在受控环境中进行了全外显子序列测定(WES)实验,其中混合了定量的人类和小鼠DNA,从纯人类样本到纯小鼠样本。
所采用的策略是根据结合了Novoalign的人-鼠基因组来调整读数。通过这种方式,虽然小鼠的阅读能力可以与人类基因组进行比对,但它们可能会在相应的小鼠基因座上获得更高的分数。在两个(或更多)位置具有相同分数的读取映射被丢弃。
下表显示了我们方法的性能。当一个纯人类DNA样本或一个纯小鼠DNA样本与组合的基因组进行映射时,99.9%或更多的读取结果都被正确映射。
样本ID | %人类DNA | 复制 | %人类基因组上的读数 | %在小鼠基因组上定位的读数 | 估计的人类DNA含量 |
---|
0_100_R1 | 0 | 1 | 0.10 | 99.90 | 0 |
0_100_R2 | 0 | 2 | 0.10 | 99.90 | 0.01 |
0_100_R3 | 0 | 三 | 0.08 | 99.92 | 0.01 |
25_75_R1型 | 25 | 1 | 62.44 | 37.56 | 22.55 |
25_75_R2 | 25 | 2 | 64.58 | 35.42 | 24.36 |
50_50_R1型 | 50 | 1 | 83.14 | 16.86 | 52.59 |
50_50_R2 | 50 | 2 | 82.18 | 17.82 | 50.56 |
50_50_R3 | 50 | 三 | 82.78 | 17.22 | 51.82 |
90_10_R2 | 90 | 1 | 97.59 | 2.41 | 90.97 |
90_10_R3号 | 90 | 2 | 97.58 | 2.42 | 90.93 |
100_0_R1号机组 | 100 | 1 | 99.98 | 0.02 | 98.70 |
100_0_R2 | 100 | 2 | 99.98 | 0.02 | 98.69 |
100_0_R3号 | 100 | 三 | 99.98 | 0.02 | 98.70 |
我们发现人类DNA含量百分比和人类基因组上的读取百分比之间存在非线性关系。这种偏差可能是由捕获步骤引起的,因为使用了专门针对人类外显子设计的探针。因此,我们使用黄土回归导出了校准曲线(B) ,使得能够估计独立样本中的人类DNA含量。
WES分析
WES文库是按照制造商的说明使用Nextera Rapid Capture Exome(Illumina Inc.,美国)制备的(美国Illuminia Inc.,《浓缩指南》第15037436版,J版)。简单地说,PDTX DNA使用Quant-iT宽范围dsDNA分析(美国Thermo Fisher)进行量化,50ng用作Nextera外显子文库制备的输入。预捕获文库标准化为20nM,并合并用于浅层全基因组测序(sWGS)。使用qPCR对预捕获库进行量化,并使用生物分析仪2100(美国安捷伦科技公司)上的DNA1000芯片对其平均长度进行评估。每个文库收集500ng用于三重外显子组捕获,11个PCR扩增周期后再次归一化为15nM,并收集用于高覆盖率配对外显子序列测定。
使用125bp配对读取进行测序。使用novoalign(Novocraft)和我们的自定义管道将短读数对齐,以消除鼠标污染。使用samtools对Bam文件进行合并、排序和索引。使用Picard工具标记重复,使用GATK重新对齐插入和删除(indels)。
出于质量控制的目的和检查样本标记错误,所有样本都使用GATK单倍型呼叫器进行基因分型,并识别和纠正了一些错误。HaplotypeCaller也用于变量调用,之后使用Bioconductor包VariantAnnotation应用了几个过滤器:对于单核苷酸变体(SNV),最小基因分型质量为20,在变体位置至少读取5个,链偏压Phred-scale p值小于40,且周围区域不存在均聚物。对于indels,我们增加了区域的宽度以检测附近的均聚物。根据这些呼叫计算基因型和变异等位基因频率(VAF)。
使用annovar版本2015年3月用于基因/外显子注释,1000个基因组版本2014年10月,dbSNP版本138,重复区域基因组SuperDups数据库,SIFT,Polyphen 2,MutationTaster和MetaLR,所有版本ljb26对所有变体进行注释。
基因间、内含子或ncRNA内含子位置的变异被丢弃。
为了量化匹配肿瘤/PDTX、PDTX不同传代或匹配PDTX/PDTC的变异性,获得了每个模型中至少一个样本中检测到的所有变异。对于那些未检测到这些变体的样本,在这些位置上再次运行GATK HaplotypeCaller,以查看这是否是该区域中没有读取该样本的结果,还是真正缺少变体的结果。
结合浅层测序(见下一节)中的拷贝数调用和SNV调用,获得每个肿瘤样本的正常污染估计值。首先,我们在匹配的正常样本中选择杂合SNP(如果可用,否则考虑肿瘤中的所有杂合变异体),然后根据分段平均拷贝数对数比小于-0.1的定义,仅观察肿瘤中拷贝数丢失区域中的杂合SNPs。在这些区域,由于杂合性丢失,预计所有变体的VAF都将为0或1(如果不存在正常污染)。对于留给B基因型的AB SNP,污染的预期值为2∗VAF–1,假设所有肿瘤细胞都有缺失。由于这是一个向下的估计,我们选择这些变体的VAF密度函数的最大值作为肿瘤含量的估计值。在其余分析中,这些估计值用于校正肿瘤VAF或复制需要的数字。
1000基因组数据库或任何正常样本中存在的所有变体都被标记为生殖系。标记为重复的区域也会被过滤,如果在给定模型的所有样本中至少有四分之三或其中三个样本中不存在代表节段重复的插入,则会被删除。为每个模型编译未经筛选的体细胞变体。对于PI3KCA等基因,需要进行一些人工处理,在人工检查后,包括来自节段重复区域的变异。
将突变频率与TCGA进行比较。
计算肿瘤中VAF与PDTX、同一模型不同传代、同一传代的PDTX和PDTC、小鼠复制品、同一样品和不同肿瘤的技术复制品之间的Pearson相关性。
为了量化肿瘤异质性,使用了两种方法:MATH(Mroz和Rocco,2013年)和PyClone(Roth等人。,2014). MATH本质上量化了VAF值中心宽度的比率,而PyClone是一种贝叶斯聚类方法,它从每个模型中推断出每个样本的克隆种群结构。简言之,PyClone将每个样本中体细胞突变的等位基因频率和在样本中一起转移的簇突变作为输入,预测每个样本中每个簇的细胞频率,以解释拷贝数变化和正常细胞污染。因为PyClone需要为每个突变输入绝对等位基因拷贝数信息,所以为此任务运行了ASCAT v2.2。ASCAT使用浅测序的对数比率(如果可用)和外显子组测序的VAF运行。对于那些没有浅层测序的样本,对整个外显子样本运行CopywriteR。如果可能,在ASCAT上进行肿瘤/正常配对分析。在运行ASCAT之前进行过滤和质量控制;如果所有突变的平均覆盖率小于20,则删除样本。癌症或正常样本中未测序到至少10读的突变也被排除在外。
然后,我们将Pyclone应用于总共22个PDTX模型,每个模型的样本范围为2到15个。在所有模型样本中,仅使用中位数覆盖率至少为50的突变。此外,对于每个模型,从分析中删除任何样本中覆盖率小于15的突变。种系突变(正常样本中存在的SNPs、重复和重复)没有被利用(但请注意,PyClone分析的种系过滤不那么严格;特别是,1000基因组数据库中存在的变体没有被删除,因为我们观察到样本之间的一些VAF变化,这将有助于区分变异性和真实变化)。所有样本中变异等位基因频率低(<0.1)的突变也被排除在外。在筛选后仍有超过300个高质量突变的情况下,使用中值覆盖率最高的300个突变作为PyClone的输入。还使用了每个肿瘤样本的正常细胞污染估计值(PDTX和PDTC样本的理论污染为0)。使用贝塔二项式参数500,PyClone运行了40000次迭代,20000次迭代的磨合期。为了测量流行率在不同时间点之间发生显著变化的克隆,我们计算了90%的可信区间,并且那些样本与其他样本不重叠的集群称为显著。如果这些突变是40个MutDriver基因的一部分,则被认为是癌症驱动基因(Pereira等人。,2016). 为了澄清这一点,正如原始PyClone论文中所建议的那样,我们只绘制了具有多个突变的簇。
突变概况(Alexandrov等人。,2013)使用软件包解构Sig计算每个样本(Rosenthal等人。,2016). 由于许多样本中的变体数量较少,因此未计算签名。
sWGS公司
sWGS工作流使用捕获前exome-sequencing库的低覆盖率排序来生成高质量的CNA调用。这对PDTX DNA的使用效率高,成本低(每个样本约30英镑),并且生成的拷贝数数据质量优于WES。如上所述,在外显子序列分析中,使用Nextera Rapid Capture exome(Illumina Inc.,美国)制备文库。预捕获文库被归一化为10uM,并合并用于浅层全基因组测序(sWGS)。
50bp的单读全基因组浅测序与外显子测序并行进行,以提供清晰准确的拷贝数估计。使用bwa与我们的定制管道进行对齐,以消除鼠标污染。使用samtools对Bam文件进行合并、排序和索引。使用Picard工具标记副本。使用生物导体包QDNaseq对数据进行分析。该方法将基因组划分为100Kb的区域,并计算这些容器中的所有读取数。然后对这些读数进行可映射性和GC含量校正,并使用DNAcopy进行分割。应用了一些额外的筛选来说明未正确映射的区域。
我们还观察到,在一些情况下,由于中值归一化,该方法改变了log2比率。使用ASCAT获得的VAF图对这些病例进行检查,并进行修复。
针对正常污染(如外显子管道所述)和拷贝数(HOMD、纯合缺失、HETD、杂合缺失、NEUT、中性拷贝数、GAIN、单拷贝增益和AMP、高水平扩增)校正肿瘤的分段平均值,根据分段平均log2比率(−1,−0.4,0.25,0.75)的阈值调用。
计算肿瘤分段平均数与PDTX、同一模型不同传代、同一传代的PDTX和PDTC、小鼠复制品、同一样品和不同肿瘤的技术复制品之间的皮尔逊相关。
微阵列表达分析
使用Illumina HT-12 v3平台分析RNA表达。原始数据使用beadarray包进行处理。采用BASH算法校正空间伪影。使用包装中推荐的检测阈值和前面描述的Illumina HT-12v3平台的重新命名,对珠级数据进行总结和基于质量的探针选择(Curtis等人。,2012). 使用PAM50和三基因分类器将样本分为固有亚型。通过与mclust包的混合模型拟合,推断ER、Her2和PR状态。
分类为集成集群(IntClusts)。PDTX样本被分为10个综合集群之一(Curtis等人。,2012)使用中提供的脚本(Ali等人。,2014)和R包iC10(Ali等人。,2014). 每个样本被分为10个综合聚类,每个模型的分配都是一致的(即该模型中所有样本的多数组)。可用时使用拷贝数和表达数据(n=21)。如果不是,则只有表达式数据(n=17)或只有拷贝数数据(n=0,没有模型具有只有拷贝数的所有样本)。将使用拷贝号和表达式完成的赋值与仅使用一种数据类型的赋值进行比较,当仅使用表达数据与使用组合CNA表达数据时,没有模型发生变化,12个模型在仅使用拷贝数数据与使用复合CNA-表达数据时发生变化(2从IntClust 1到IntClus 9,1从InClust 5到IntClust10,1从IntClut 7到IntClust 8,2从IntClust 10到IntClust 3,1从IntClust 10至IntClusts 4,5从IntClus 10到IntClust 9)。
由于PDTX队列可能并不代表所有类型的乳腺癌,我们纳入了1980年Metabric样本(Curtis等人。,2012)并将其与PDTX样本进行量化规范化,以获得所有方法的更准确分类。
路径激活分数。我们从分子特征数据库下载了c6致癌特征(并合并了内部PI3K/AKT/mTOR和内部DNA损伤响应DDR特征),并应用GSVA软件包推断样本特异性通路激活。同样,由于PDTX队列可能并不代表所有类型的乳腺癌,因此我们还将1980年Metabric样本纳入研究,并在将表达值转换为z评分之前将其分位数正常化。对于具有应上调基因子集(UP)和应下调基因子集(DOWN)的路径,最终得分为UP-DOWN。
使用欧几里得距离和Ward方法进行热图和聚类分析。
计算肿瘤和PDTX、同一模型不同传代、同一传代的PDTX和PDTCs、小鼠复制品、同一样品和不同肿瘤的技术复制品的对数密度表达值或通路激活分数之间的Pearson相关性。
对肿瘤、PDTX和PDTX通路中的通路活性得分进行详细比较,并使用R包mgcv对每条通路进行拟合,以肿瘤得分为因变量,以所有PDTX通道得分的平滑函数为自变量。偏差和斯皮尔曼相关性被计算作为预测能力和再现性的衡量标准。使用第一个PDTX通道作为因变量,其余通道作为独立变量来拟合类似的模型。
甲基化还原表示亚硫酸氢盐序列分析
采用125bp配对读码进行RRBS测序。使用Bismark和我们的定制管道进行校准,以消除鼠标污染。仅选择具有至少5次读取的CpG进行后续分析。甲基化水平是CpG位点中Cs的比例。
计算肿瘤中CpG位点甲基化比例与PDTX、同一模型不同传代、同一传代的PDTX和PDTCs、小鼠复制品、同一样品和不同肿瘤的技术复制品之间的Pearson相关性。此分析应用了1000000次读取的筛选器。
对于下游分析,使用150万次读取的过滤器来选择样本,并计算每个基因启动子甲基化得分,作为TSS周围±2000区域中CpG位点的平均值。
PDTCs高通量药物筛选分析
观察到的反应计算为:100–(100∗(强度阴性对照)/(阳性对照-阴性对照)。进行质量控制,比较平板和类似日期进行的筛查的响应值。使用R函数isoreg的非参数等渗回归适用于给定样本的给定药物反应的技术复制集。曲线下面积(AUC)是使用使用梯形规则的包裹流量在模型拟合上计算的。最大半数抑制浓度(IC50)预测将平滑样条拟合到等渗回归线。作为AUC和IC周围可变性的度量50估计,等渗回归曲线分别适用于每个技术复制品及其AUC和IC50还计算了基于标准偏差的总体估计的误差线。为了比较IC50根据不同剂量范围的药物估计,我们计算了IC50作为使用公式100的百分比剂量∗(集成电路50–测试的最小剂量)/(测试的剂量范围)。
使用欧几里德距离和Ward方法对拟合的剂量-反应曲线进行无监督聚类,显示出八种不同的模式,对应不同的预期反应。然后,我们根据五个剂量点的细胞死亡百分比建立了八条理论曲线:
•
(0, 0, 0, 0, 0)
•
(0,0,0,0,50)
•
(0, 0, 0, 50, 90)
•
(0, 0, 30, 50, 90)
•
(0, 25, 50, 75, 100)
•
(0, 50, 60, 80, 100)
•
(60, 60, 60, 60, 60)
•
(100, 100, 100, 100, 100)
这些曲线涵盖了从无反应到完全毒性的日益敏感的反应模式。通过最小平方法将每个响应划分为这些理论曲线。
根据相同样品和相同药物的药物反应(AUC)计算技术重复之间的Pearson相关性。根据相同模型和相同药物的药物反应(AUC)计算生物重复之间的Pearson相关性。
来自药物组合的数据与单一药物管道中的数据进行了相同的归一化处理。由于每个联合筛选也包含两种单一药物反应(针对联合中的每种药物),因此将这些反应与相同模型/药物的单一药物筛选(之前获得的)进行比较,计算皮尔逊相关性。将等渗回归曲线和AUC拟合到联合用药的单效曲线。使用Bliss模型测量协同效应(布利斯,1939年,Greco等人。,1995),比较两种药物在给定组合下的观察反应和独立模型下的预期反应。也就是说,如果药物X的剂量i导致细胞死亡的比例是rx(i),药物Y的剂量j导致细胞死亡比例是rY(j),那么i和j组合下的细胞死亡的预期比例是rx(i)+rY(j)-rx(i)rY(i)。通过对每个单一药物反应进行等渗回归拟合来计算这些值,并将其与使用R包isotronic.pen获得的药物组合的双变量等渗拟合进行比较。Bliss模型的残差被定义为观察到的响应与预期响应之间的差异。这些值仅作为描述性标记,没有对其进行推断。
数据和软件可用性
数据资源
原始测序和微阵列文件可从EGA:EGAS00001001913获得。
标准化/汇总数据文件可在图中找到:https://figuhare.com/s/4a3f6bc543e5ba85834c该库还包含一系列绘图文件,包括SNV的Pearson和Spearman相关性、拷贝数、基因表达、通路激活和甲基化、显示每个模型中变异等位基因频率的成对散点图、每个样本中的突变谱、每个样本的拷贝数图,成对散点图显示每个模型中的通路得分,成对平滑散点图表示每个模型中CpG甲基化得分,每个受试模型中所有药物的AUC和iC50得分,每个药物和受试模型的剂量-反应曲线,成对散点图显示针对同一通路的药物AUC得分,箱线图显示了针对相同通路的化合物的癌症通路活性评分和AUC之间的Spearman相关性,以及应用于每个模型的每个药物组合的Bliss模型结果。
该数据集还可在交互式门户网站中使用,该门户网站允许进行勘探、绘图和数据下载:http://caldaslab.cruk.cam.ac.uk/bcape