我们对7例晚期胰腺癌患者进行了快速尸检(补充表1). 在所有患者中,每个患者的两个或多个解剖部位都存在转移性沉积物,最常见的是肝脏、肺和腹膜,这是这种肿瘤的典型特征4.
低代细胞系(6名患者)或第一代异种移植物(1名患者)是从每个患者尸检时出现的一个转移瘤中创建的。如胰腺癌基因组突变调查所述,这些样本包括24例胰腺癌中的7例,之前进行了全外显子组测序和拷贝数分析5在之前的研究中,在7个指数转移病灶中测序的220884033 bp中,共鉴定出388个不同基因中的426个体细胞突变,对应于每个指数转移病灶平均61个突变(范围41-77)。在所有样本中,绝大多数突变都表现为错义或沉默的单碱基替换(补充图1和补充表2).
对于在七个指数转移病灶中确定的每一个体细胞突变,我们确定在解剖上不同的转移瘤中是否存在相同的体细胞突变。我们还确定这些突变是否存在于发生转移的原发性胰腺肿瘤中。这些感兴趣的样本中有少量是细胞系或异种移植物,与指数病变相似,而大多数是新鲜冷冻组织,其中包含混合的肿瘤细胞、基质细胞、炎症细胞、内皮细胞和正常上皮细胞(). 因此,在纯化DNA之前,对每个组织样本进行显微解剖,以尽量减少对非肿瘤元素的污染。
转移性胰腺癌体细胞突变综述a.原发浸润性胰腺癌和转移至腹膜、肝脏和肺的胰腺癌的组织病理学。除了在每个病变中浸润癌细胞外(箭头所示),非肿瘤细胞类型也很丰富。b.根据比较病变排序,代表原发性癌中父母克隆(创始突变)和克隆进化(进展突变)的总突变。所有分析样本的常见突变是最常见的类别。
确定了两类突变(). 第一个也是最大的类别对应于给定患者所有样本中出现的突变(“创始”突变,平均64%,每个患者48-83%的突变;,中的示例补充图2a). 这些数据表明,胰腺癌中存在的大多数体细胞获得性突变发生在转移灶发生之前。所有其他突变均以“进展型”突变为特征(平均36%,范围为每个患者所有突变的17-52%;,中的示例补充图2b). 这些突变存在于一个或多个被检查的转移瘤中,包括指数转移瘤,但不存在于亲本克隆中。
这些突变类型用于将包含它们的病变分为双亲克隆(仅包含创始人突变)和亚克隆(包含创始人和进展型突变)。根据定义,一个患者中可能只有一个父母克隆,尽管可能有许多不同的子克隆。亲本克隆往往包含比亚克隆更多的有害突变(无义突变、剪接位点或移码突变)(亲本克隆中12.6%的突变对亚克隆中8.1%的突变,补充表2). 双亲克隆已经在所有驱动基因中积累了突变(卡拉斯,TP53和SMAD4型)以前的研究表明,它可以促进胰腺肿瘤的发生6.通过综合分析指数病变的高密度SNP芯片数据(补充表3)加上所有病变的测序数据(补充表2)我们发现,指数病变中的绝大多数纯合突变(51个突变,占所有纯合突变的89%)已经存在于亲本克隆中。纯合子突变是肿瘤抑制基因的特征,例如SMAD4型和CDKN2A型通常与染色体不稳定有关7总之,亲本克隆包含大多数有害的遗传改变和染色体不稳定,其上叠加了与克隆进化和转移相关的前表达子突变的积累。
根据体细胞突变和等位基因丢失的模式以及单个转移沉积物的位置,为每个患者的癌症构建进化图(,补充图。3到8). 这些图谱显示,尽管在亲代克隆中存在大量创始者突变,但引起转移病灶的细胞仍有大量的进展突变。例如,在Pa01中,父母克隆包含49个创始者突变,但在肺和腹膜转移瘤中存在以6个额外基因突变为标志的克隆扩张(补充图3). 此外,在肝转移瘤中又发现22个突变。请注意,转移灶中的所有突变都是克隆性的,即,根据Sanger测序评估,如果不是转移灶的所有肿瘤细胞,则绝大多数都存在。因此,这些突变存在于克隆性扩张成为转移的细胞中。同样,在所检查的七例患者的转移瘤中,通常都观察到大量的进展基因突变(和补充图。3到8).
原发性癌转移克隆的地理定位和Pa08的克隆进化a.快速尸检时从Pa08中取出的胰腺标本的图解,以及标本的切片平面。b.在浸润性胰腺癌的连续切片中通过比较病变序列确定的亲本克隆和亚克隆的定位。引起肝和肺转移的转移亚克隆非随机地位于切片3内,用蓝色圆圈表示。这些克隆在地理和基因上都不同于导致同一患者腹膜转移的克隆,绿色表示。c.基于测序数据的克隆进化建议。在这个模型中,在亲本克隆发育后,原发癌(黄色矩形)内继续进行克隆进化,这些亚克隆种子在远处转移。*表明在TTN公司基因。
为了区分原发癌内和继发癌内发生克隆进化的可能性,我们将两名患者的原发肿瘤切成许多三维组织块()并检测了每一个创始者和进展者突变片段的DNA。在Pa08患者中,两个独立的腹膜转移瘤(定义一个子克隆)中存在三个进展突变,肝和肺转移瘤中存在23、25或27个额外的进展突变(定义三个额外的子克隆;). 通过对原发肿瘤不同区域的分析,可以清楚地看出,引起这些转移的亚克隆都存在于原发肿瘤中。此外,这些亚克隆并不小;从碎片的大小来看()以及回收的DNA数量,每个亚克隆必须包含超过1亿个细胞。此外,通过对同一肿瘤的其他片段的分析,可以识别出四个以上不同的亚克隆,每个亚克隆都包含同样数量的细胞。这些亚克隆可以被放入一个有序的层次结构中,为肿瘤进展建立一条进化路径(). 对患者Pa04的多个原发肿瘤片段和转移病灶的分析显示出类似的克隆进化,原发肿瘤中不同的、较大的亚克隆导致不同的转移(补充图8).
为了进一步阐明初级位点内的克隆进化,我们尝试关联代表Pa08亚克隆的突变特征()用原发肿瘤碎片的地理位置来定义它们(). 亲本克隆的代表性样本遍布原发性癌。相比之下,代表亚克隆的样本是非随机的,彼此靠近,在其中可以看到导致腹膜转移和远处转移的亚克隆。因此,我们得出结论,转移的遗传异质性反映了原发性癌症中已经存在的异质性,并且原发性癌症是许多亚克隆的混合物,每个亚克隆都独立扩展形成了大量细胞。
该数据集还可用于推断胰腺肿瘤不同进展阶段的发展时间8我们假设肿瘤是由一种遗传事件引发的,这种遗传事件赋予细胞选择性生长优势,从而成为肿瘤的创始细胞。为了估计时间,我们首先使用Ki67标记测定了无胰腺癌患者手术切除胰腺的7个正常导管上皮样本的增殖率以及每个指标的转移率。Ki67阳性细胞核平均占正常导管细胞的0.4%,而转移病灶指数内的癌细胞平均16.3%为Ki67阳性,这与先前的估计一致9-10(补充表4). 基于这些数据加上指数病变序列的数据,我们得出了肿瘤演变中三个关键时间的估计值:T型1-肿瘤开始与产生亲本克隆的细胞出生之间的时间;T型2-导致指数转移的细胞出生所需的后续时间;和T型3–该细胞传播到患者死亡之间的时间(). 换句话说,有一个时间点,t吨0肿瘤发生的时间点t吨1当一个细胞出生时,其父母克隆中存在所有突变。同样,肿瘤的演变也有一个时间点,t吨2当一个细胞出生时,它具有指数转移中存在的所有突变。T型1由给定t吨1-t吨0和T型2由提供t吨2-t吨1.如果我们表示t吨3作为病人死亡的时间T型3=t吨3-t吨2.
胰腺癌的遗传进化模式肿瘤发生始于正常细胞中的起始突变,该突变具有选择性生长优势。克隆扩张的连续波与获得额外突变相关,与胰腺上皮内瘤变(PanIN)的进展模式和时间相对应T型1。PanIN病变中的一个创始细胞将播种亲本克隆,从而引发浸润性癌(T型1和的开头T型2). 最终,将产生指数病变的细胞将出现(T型2和的开头T型3). 不幸的是,大多数患者直到进入时间间隔后才被诊断T型3当这些转移的亚克隆细胞已经逃离胰腺并开始在远处器官内生长时。间隔的平均时间T型1,T型2和T型3所有七名患者的情况都显示在左边的括号中(另请参阅补充表6).
使用方法中描述的数学模型,我们能够保守估计从肿瘤发生开始到产生亲本克隆的细胞出生的平均11.7年,从那时到产生指数病变的细胞出生平均6.8年,从那时到患者死亡的平均时间为2.7年(参见补充讨论和补充表5).
我们首次表明,原发性胰腺癌包含地理上不同的亚克隆,每个亚克隆都包含大量(数亿)细胞,这些细胞在转移出现临床症状之前的几年内就存在于原发性肿瘤中。这些促进转移形成的转移亚克隆的特征尚不清楚,因为无法确定转移亚克隆一致的遗传特征。我们确实在这7名IV期疾病患者的一个或多个指标转移性病变中发现了几个突变基因,但在17名II期疾病患者的原发性胰腺指标病变中没有发现突变基因(补充表2). 这些基因包括那些通过异型细胞粘附在侵袭或转移能力中起作用的基因(CNTN5公司),运动性(文档2),蛋白质水解(MEP1A型)和酪氨酸磷酸化(LMTK2型). 然而,这些突变本身并不是转移特异性的,因为在这7名患者的匹配原发癌中除了一个之外,其他所有基因都存在,并且没有证据表明我们观察到的突变赋予了这些基因转移活性。这些数据也没有揭示导致进展突变形成的原发癌中的选择性压力。根据最近的发现,胰腺癌的血管生成不良11,一种可能性是肿瘤内缺氧创造了一个肥沃的微环境,以形成超出亲本克隆的额外突变。
这些数据的主要影响之一是对筛查预防胰腺癌死亡的影响。定量分析表明,在该病仍处于治愈阶段时,有很大的机会进行诊断,至少需要十年。我们的模型还预测,从产生亲本克隆的细胞出生到指数转移的种子期,平均为6.8年。不幸的是,绝大多数患者直到整个肿瘤发生过程的最后2年才被诊断出来。挑战在于及时检测这些肿瘤T型1,甚至之后T型1但在转移瘤播散之前。先进的成像方法,以及检测癌症特异性蛋白质、转录物或基因的血液测试12为这种无创性早期检测提供了希望。
方法
患者和组织样本
收集7例胰腺导管腺癌患者的组织样本,与胃肠道肿瘤快速医疗捐赠计划(GICRMDP)相关。该计划得到了约翰斯·霍普金斯大学机构审查委员会的批准,并被视为符合《健康保险便携性和责任法案》。之前已经详细描述了该计划的细节13组织采集协议包括以下内容:;使用标准技术打开体腔后,使用无菌刀片和镊子对包括胰腺癌在内的整个胰腺和每个大体确定的转移瘤进行取样。将整个胰腺切成1×1×0.4 cm的切片,在10%的缓冲福尔马林中过夜固定,在液氮中冷冻Tissue-Tek OCT复合物(日本东京樱花精细技术公司),在1.7 mL冷冻瓶中冷冻snap,并在−80°C下保存。如前所述,从这7名患者的死后癌组织中产生了富含异种移植或低代细胞系13,14.
激光捕获显微切割(LCM)
使用低温恒温器将尸检组织的冷冻组织切片切成7μm的切片,并将其嵌入紫外线处理的PALM膜载玻片(Carl Zeiss MicroImaging,Oberkochen,Germany)上,并将载玻片立即储存在−80°C下,直到随后固定。行LCM的组织切片解冻,在100%甲醇中固定3分钟,在显微切割之前用甲苯胺蓝染色,以去除污染的基质元素。使用PALM显微激光系统(卡尔蔡司显微成像)解剖切片。解剖后的组织被弹射成粘性帽。通常,通过LCM从5-10个连续切片中获得>20000个细胞,以便获得足够数量和质量的基因组DNA用于后续扩增和测序。
基因组DNA提取与全基因组扩增
根据制造商的协议,使用QIAmp DNA Micro Kit(美国加利福尼亚州巴伦西亚齐根市)从显微解剖组织中提取基因组DNA。通过实时PCR计算长散布核元素(LINE)定量基因组DNA。设计了LINE引物组5′-AAAGCGCTCAACTACATAGG-3′(正向)和5′-TGCTTGAATGCCCCAGAG-3’(反向)。实时PCR条件为95°C,持续10分钟;94°C 40次循环10秒,58°C 15秒,70°C 30秒。PCR使用铂金SYBR Green qPCR SuperMix-UDG(Invitrogen,Carlsbad,CA,USA)进行。为了最小化使用低起始模板产生的测序偏差,仅使用LINE检测浓度≥3.3 ng/ul(1000基因组当量)的样品作为全基因组扩增(WGA)的起始模板。按照制造商的协议,使用10 ng总模板DNA和插图GenomiPhi V2 DNA扩增试剂盒(美国新泽西州皮斯卡塔韦市GE Healthcare)进行WGA。使用Microspin G-50系统(GE Healthcare)纯化WGA产品。通过NanoDrop分光光度计(Thermo Fisher Scientific,Waltham,MA,USA)对纯化的WGA产物进行定量,并稀释至20纳克/μL进行测序分析。使用这些方法和质量控制,从培养细胞系/异种移植物获得的突变特征与从匹配的冷冻组织制备的WGA材料完全一致。
桑格测序
使用Jones等人描述的条件和引物进行PCR扩增和测序。5少数测序反应失败(<总反应的2%),这些相应的基因未被纳入克隆进化的进展模型或定量时间估计中。
基因分型
采用BeadChip平台进行的Illumina Infinium II全基因组基因分型分析用于分析1072820(1M)SNP位点的肿瘤样本,如前所述5简而言之,所有SNP位置都基于人类基因组参考序列的hg18(NCBI Build 362006年3月)版本。基因分型分析首先与50个核苷酸的寡核苷酸杂交,然后进行双色荧光单碱基延伸。使用Illumina BeadStation软件处理荧光强度图像文件,以提供每个SNP位置的标准化强度值和等位基因频率。对于每个SNP,将归一化实验强度值(R)与来自正常样本训练集的该SNP的强度值进行比较,并表示为对数的比率(称为“对数R比”)2(右实验的/R(右)训练设备). 对于每个SNP,使用归一化等位基因强度比(theta)估计该SNP的定量等位基因频率值(称为“B等位基因频度”)15使用Illumina BeadStudio软件,日志R(右)比率和B等位基因频率值沿染色体坐标绘制并目视检查。杂合性丢失区域(LOH)被确定为基因组区域>2Mb,具有连续的纯合基因型调用(B等位基因频率接近0或1)。LOH的较小(<2Mb)区域是通过要求在连续纯合子基因型调用的区域中同时出现Log-Rratio评分降低来确定的(B等位基因频率接近0或1)。对这些沿着染色体坐标绘制的数据进行目视分析后,对所选感兴趣基因的数据进行手动分析。
扩散率估算
为了估计细胞分裂率,计算每例先证者病变中的Ki-67标记指数(LI)。还计算了组织学正常胰腺实质中胰腺导管上的Ki-67 LI。从2名非胰腺癌原因死亡的尸检患者和5名因浆液性囊腺瘤或胰岛细胞瘤在约翰霍普金斯医院接受远端胰腺切除术的患者中采集正常胰腺。石蜡块被切割成4μm厚的切片,用于Ki-67免疫染色,所有染色过程从去石蜡化到苏木精复染均使用Ventana Discovery染色系统(Ventana-Medical Systems,Tucson,AZ)自动进行。使用抗人Ki-67小鼠单克隆抗体(克隆MIB-1,Dako Cytomation,Glostrup,丹麦)。每个病例至少随机选择12个包含至少2000个细胞的高功率场,并计算标记指数(LI)作为阳性细胞核的百分比。每个病例中的反应性小淋巴细胞被视为Ki-67的内部阳性对照。与内部阳性对照组相比,相同或更强烈的核染色被认为是阳性。
肿瘤演化建模
乘客突变被定义为那些不太可能导致肿瘤发生的突变。保守地说,在最近一项基于24例胰腺癌全外显子组测序的研究中,我们将乘客突变视为不包括在候选癌基因中的突变5由于癌症中发现的绝大多数突变被认为是乘客,因此该模型的结果并不高度依赖于用于估计相对较少驾驶员数量的模型16.
因为乘客突变是中性的,不会以任何方式影响进化,所以它们在每个细胞谱系中独立积累。根据亲本克隆的创始细胞的谱系,我们可以假设它获得了一个新的中性突变率第页在每个细胞分裂处第页是每个细胞分裂每个碱基对的突变率与测序的碱基对数量的乘积。细胞谱系中中性突变的积累可以用泊松过程和速率很好地描述第页每个细胞分裂。我们感兴趣的是从肿瘤开始到父代克隆创始细胞出生之间的单个谱系中细胞分裂的数量,在此期间,N1乘客突变不断累积。另一方面,N1也是在一名患者的所有肿瘤样本中发现的突变数。由于我们对每个患者的至少一个原发肿瘤样本和至少三个不同转移瘤样本进行了测序,因此这些特定的N1突变必须存在于所有三个转移瘤的起始细胞和原发肿瘤的细胞中。因此,肿瘤中有一个细胞具有这些N1第一次发生特异性突变,也就是根据定义,父代克隆的创始细胞。由于我们可以忽略肿瘤发生前突变的积累1突变是沿着从肿瘤起始细胞到父代克隆起始细胞的单一谱系累积的。由于两个后续突变之间的细胞分裂数按指数分布,平均值为1个/年,所需的单元划分数是N个1具有平均值的独立指数分布随机变量1个/年,并根据具有形状参数的Gamma分布进行分布N个1和比例参数1个/年。此分布的平均值为N个1/第页标准偏差为(请参见补充表6). 由于研究中测序的碱基对数量为31.7·106,每代每对碱基的突变率估计为5·10−10,第页=31.7·106·5·10−10≈0.016每代8.
通过测量7个指数病变的Ki-67标记指数(平均16.3%),我们能够估计7个指数病灶中细胞的S期分数(平均LI=9.5%)17.假设人体组织和肿瘤S期持续时间的中位数,T型秒,共10小时18,并使用潜在细胞倍增时间的公式T型锅=λT型秒/李,我们估计T型锅3.5天。这里λ是细胞周期中细胞非线性年龄分布的校正因子,假设为0.819这一估计与Amikura等人的胰腺癌平均细胞倍增时间一致。202.3天。我们在分析中使用后一种估计,因为我们认为它对胰腺癌更准确。
Amikura等人20胰腺癌转移的中位加倍时间为56天。为了估计指数转移的年龄,我们使用了一个两阶段模型。我们估计肿瘤加倍时间等于细胞加倍时间(T型消息)直到肿瘤直径达到100微米,此时需要血管生成21之后,我们使用了上述中值倍增时间。
我们的模型可以很好地估计肿瘤演化过程中离散事件之间的细胞分裂数。为了从细胞分裂的数量到实际时间,我们需要估计细胞分裂的平均速率。因此,我们对实际时间预测的准确性取决于该估计的准确性。如果我们允许T型消息表示细胞谱系中后续细胞分裂之间的平均时间,我们得出时间的表达式T型1:
因此,我们估计了细胞分裂的数量,以及时间T型1在肿瘤发生和父代克隆创始细胞出生之间,与乘客突变数量成正比,N个1肿瘤在那段时间内获得。在我们的计算中,我们使用了文献中对胰腺癌细胞倍增时间的估计20作为的值T型消息.
T型2用类比法确定N个2定义为指数病变中出现的乘客突变数,但父母克隆中没有。T型3根据基于文献的肿瘤和细胞倍增时间的估计值以及尸检时指数病变的大小确定20.