跳到主要内容
访问密钥 NCBI主页 MyNCBI主页 主要内容 主导航
自然遗传学。作者手稿;PMC 2015年1月28日发布。
以最终编辑形式发布为:
2011年11月27日在线发布。 数字对象标识:10.1038/ng.969
预防性维修识别码:项目经理4309644
NIHMSID公司:NIHMS656141
采购管理信息:22120008

结直肠癌局部DNA高甲基化和长程低甲基化区域与核膜相关结构域一致

关联数据

补充资料

摘要

DNA甲基化的广泛变化在癌症中很常见,可能通过肿瘤抑制基因的转录沉默促进肿瘤发生1.基因组尺度的研究对这些变化产生了重要的见解2,,4,5但关注的是CpG岛或基因启动子。我们使用全基因组亚硫酸氢盐测序(亚硫酸氢酯-seq)以单碱基对分辨率全面分析了原发性人类结肠肿瘤和邻近正常结肠组织。肿瘤局部高甲基化区域主要位于CpG岛,并集中在长程(>100 kb)低甲基化区域。这些低甲基化结构域覆盖了近一半的基因组,与人类细胞系中晚期复制和核层附着相一致。我们在25种不同的大肠肿瘤和匹配的邻近组织中证实了这些区域内的高甲基化和低甲基化的融合。我们认为,癌症中广泛存在的DNA甲基化变化与细胞核内染色质三维组织调控的沉默程序有关。

主要

我们对CpG岛(CGI)甲基化子表型(CIMP)-高6,3期原发性结肠腺癌KRAS公司导致p.Gly12Asp的突变。我们使用基于芯片的SNP基因分型法估计样本中肿瘤DNA含量为67%(补充图1、2). 我们使用了亚硫酸氢盐seq7为肿瘤样本生成760亿个唯一可比对bp(28倍平均基因组覆盖率)的序列,为来自同一个人的正常邻近结肠粘膜样本生成870亿bp(32倍覆盖率)序列(补充说明). 在两个样本中,大约80%的基因组CpG二核苷酸被五个或更多的唯一定位测序读数覆盖(补充表1、2). 二硫化物seq甲基化水平显示出很强的一致性(Pearson相关性(第页)0.93–0.97),采用Illumina Infinium人甲基化27k甲基化测量。拷贝数改变区域(114Mb有增益,223Mb有损耗)也为亚硫酸氢盐seq和Infinium阵列产生了类似的DNA甲基化结果(补充图3). 非CpG(CpH)胞嘧啶环境下的DNA甲基化几乎无法检测到,正如已报道的体细胞系那样,这与人类胚胎干细胞(hESCs)和诱导多能干细胞形成对比8(补充图4). 基因组中具有代表性的10-kb区域显示肿瘤和正常结肠组织之间存在显著差异;肿瘤中的DNA甲基化在CGI启动子区内较高,但在CGI外较低(图1).

保存图片、插图等的外部文件。对象名为nihms656141f1.jpg
结肠肿瘤和邻近正常粘膜的亚硫酸氢盐

单个测序读取和摘要甲基化水平显示在STK33号机组正常邻近结肠组织(顶部)和匹配结肠肿瘤(底部)的基因启动子。显示的读数与链方向无关,并用颜色表示读数中甲基化的CpG二核苷酸的百分比(没有CpG的读数用黄色表示)。甲基化百分比轨迹总结了每个CpG二核苷酸(黑点)甲基化读取的百分比以及五个CpG滑动窗口内的平均甲基化(实心棕色图)。底部的甲基化差异轨迹显示了五个CpG滑动窗口内肿瘤和正常组织之间的平均甲基化差异,红色表示肿瘤高甲基化,绿色表示肿瘤低甲基化。

我们通过比较肿瘤与邻近正常粘膜在小到两个相邻CpG二核苷酸和大到20kb的全基因组窗口中的甲基化,研究了整体DNA甲基化的变化(补充图5). 在所有窗口大小下,绝大多数窗口在两个组织中都被甲基化,但在窗口大小小于5kb时,存在两个正常非甲基化的透明簇窗口(图2a). 基于这些簇,我们通过筛选五个相邻CpG窗口内的甲基化来确定离散元素,将平均甲基化水平<5%的定义为非甲基化,将甲基化水平>35%的定义为甲基化。这使我们能够识别出5163个在正常结肠细胞中未甲基化的元素和在肿瘤中甲基化的(甲基化倾向)元素,以及21134个在两者中均未甲基化(甲基化抗性)的元素。虽然含量较少,但我们发现662种元素在正常结肠组织中甲基化,而在肿瘤中未甲基化(甲基化缺失)。

保存图片、插图等的外部文件。对象名为nihms656141f2.jpg
焦点元素的三种不同甲基化类别

()4号染色体上五个相邻CpG二核苷酸所有窗口内平均DNA甲基化的密度图。甲基化脯氨酸(MP)和甲基化抗性(MR)窗口的不同亚群可见为高密度簇,而甲基化缺失(ML)区域为低密度。(b条)每个甲基化类别与ENCODE蛋白-DNA结合(ChIP-seq)数据的比较9和其他基因组特征(有关完整版本,请参阅补充图6). 我们通过将每个甲基化类别中重叠元素的比例除以大小匹配、随机生成的基因组位置中重叠元素的比例(显示为倍数变化)来确定基因组富集。所有转录因子显示在箱线图中(左侧),选定的基因组特征显示为单个条形图(右侧)。

我们将这三种甲基化类别与基因组注释和ENCODE进行了比较9蛋白质-DNA相互作用(染色质免疫沉淀测序(ChIP-seq))(图2b补充图6). 虽然只有29%的甲基化-脯氨酸元件对应于已知的启动子(转录起始位点(TSS)),但它们几乎普遍(95%)与CGI一致10hESCs中多梳抑制复合物1和2活性标记高度富集。虽然早期的研究表明甲基化-脯氨酸启动子处的多梳位点富集6,11,12,13,非促性腺激素调节区的特征尚不明确。我们发现含有已知增强子的非促性腺激素区域标记p300(参考文献14)和H3K27ac15比启动子更有可能甲基化抗性,但那些甲基化倾向的非启动子区域与启动子一样,主要位于CGI,与多梳标记高度重叠。转录因子Sp1、Nrf1或YY1的结合可以保护CGI免受肿瘤特异性DNA甲基化4,16,我们发现这种保护性延伸到ENCODE中55个转录因子中的大多数;几乎所有因子都强烈富集了抗甲基化元素(中位数富集22×),而甲基化-脯氨酸元素仅弱富集(中位数浓缩4×)。同样,耐甲基化元素对CTCF绝缘体结合位点有29倍的富集17(51%的抗甲基化元素与CTCF位点重叠),而甲基化-脯氨酸元素对这些位点的富集度仅为7倍(13%的所有甲基化-丙氨酸元素与CTCC位点重叠)。与早期报告一致18,甲基化-脯氨酸元素被Alu重复序列和其他与甲基化-抗性和甲基化-缺失元素相关的短和长散布元素强烈耗尽(图2b).

我们进行了微阵列表达分析,发现甲基化-脯氨酸启动子(CGI和非CGI)与正常结肠组织中的低表达和肿瘤中的表达缺失相关(补充图8). 肿瘤中沉默的基因在整个CGI启动子中甲基化(MGMT公司) (图3a)或在启动子的隔离部分内(MAF公司). 我们使用了HOMER程序19识别富含甲基化抗性或甲基化脯氨酸元素的序列基序(图3b补充图13–15). 与最近的研究一致4、甲基化-脯氨酸元素富集CA和GA二核苷酸重复序列,甲基化-抗性元素富集大量与已知转录因子结合基序匹配的序列,包括Nrf1、Sp1、GABPA、YY1和NF-Y(图3b补充图14).

保存图片、插图等的外部文件。对象名为nihms656141f3.jpg
局部甲基化类别对应不同的表观基因组和序列特征

()UCSC基因组浏览器绘制的两个下调基因(MGMT公司MAF公司)和两个上调(B3GNTL1型接触标准2)基因显示,甲基化-脯氨酸(MP)、甲基化-抗性(MR)和甲基化-缺失(ML)类的元素通常与启动子或增强子组蛋白修饰(H3K4甲基化)、DNase I超敏性(HS)和转录因子结合相结合。在增强子和启动子轨道中,每种颜色代表一个单独的ENCODE细胞系,所有细胞系在DNase HS和转录因子轨道中结合。(b条)HOMER的重要成果19序列模体在三个甲基化类别中的每个类别中搜索(有关完整结果,请参阅补充图13–15). 由于甲基化-脯氨酸和甲基化-抗性元素通常与CGI TSS相对应,因此这两类元素的排列与定向TSS相对,而甲基化损失类元素(右)的排列与无定向甲基化损失元素的中心相对。与HOMER数据库中已知图案的匹配如下所示从头开始它们匹配的图案(Nrf1和AP-1)。

与甲基化-脯氨酸和甲基化-抗性元件相比,那些在肿瘤中失去甲基化(甲基化丢失)的元件在启动子(3%)和CGI(26%)处发生的频率较低,但通常富集在ENCODE转录因子结合位点,包括TAF1(图2b; 中位数富集11.4×),表明这些元素中的许多要么作为未标记的启动子,要么作为转录增强子。无论是在启动子还是增强子上,甲基化缺失元件更有可能与肿瘤中获得表达的基因相关(补充图7)与甲基化-脯氨酸元素相反。B3GNTL1型TACSTD2系统都在肿瘤中上调,并且在含有Fos和Jun转录因子位点的假定增强子中含有甲基化缺失元素(图3a). 甲基化缺失元件中主要过度表达的序列基序对应于Fos-Jun二聚体的AP-1结合序列(图3b)因此,我们很容易推测甲基化缺失反映了Fos-Jun在这些位点启动的染色质重塑,这一过程在肠道增殖和肿瘤发生中起着关键作用20.

不同窗口大小的全基因组甲基化变化表明,甲基化的大多数基因组可以在20 kb的窗口中分解为两个不同的部分(图4a). 其中一个组分在肿瘤中明显地低甲基化,类似于体细胞系中出现的部分甲基化结构域(PMD),但不存在于人胚胎干细胞中8基于此图谱,我们通过搜索平均甲基化率为20–60%的10-kb窗口,然后将其折叠成大于100kb的域,从而确定了PMD全基因组;总之,44%的肿瘤基因组包含在这些PMD域中(图4b). 我们发现不同的体细胞系共享近75%的PMD8,并且我们发现大约75%的IMR-90成纤维细胞PMD包含在结肠肿瘤PMD中。尽管肿瘤PMD区域在正常结肠细胞中甲基化程度略有降低(图4a),实际上没有一个符合PMD标准(图4b)这表明永生化细胞系和肿瘤具有共同的特性,而正常体细胞组织中没有这种特性。

保存图片、插图等的外部文件。对象名为nihms656141f4.jpg
高甲基化CGI属于长的肿瘤特异性PMD

()4号染色体所有20-kb窗口内平均DNA甲基化的密度图,显示了代表肿瘤但非正常结肠组织中PMD的不同窗口子集。(b条)我们通过搜索100-kb的部分甲基化窗口(见正文)确定了四种细胞类型的PMD,并比较了肿瘤和正常结肠组织以及其他两种细胞类型PMD中包含的基因组百分比7. (c(c))对于在正常结肠中未甲基化的所有启动子,平均甲基化变化显示为与CGI启动子的距离的函数(平均甲基化<0.2)。我们将启动子分为甲基化-脯氨酸(MP;平均肿瘤甲基化>0.3)和甲基化-抗性(MR;平均肿瘤甲化<0.2),并且这些图的方向是显示右侧的转录区。(d日)UCSC基因组浏览器绘制的染色体3q上具有代表性的10-Mb区域图显示,结肠肿瘤与IMR-90 PMD、Lamin-B1标记和局部超甲基化之间存在大量重叠(甲基化变化轨迹中的甲基化抗性元件可见红色尖峰)。Lamin-B1和ENCODE增强子和启动子轨道来自UCSC注释数据库。

为了研究启动子高甲基化和PMD低甲基化之间的关系,我们计算了CGI启动子周围可变大小窗口中的甲基化水平(图4c). 启动子在CGI边界约1 kb范围内高度甲基化,从约10 kb到1 Mb以外的启动子趋向于更低甲基化。这在10-Mb区域中很明显(图4d)局部高甲基化峰值(甲基化变化轨迹中的红色峰值)主要出现在低甲基化PMD中。即使在控制了相关基因的表达水平后,这种关系仍然适用于全基因组(补充图9)其中57%的甲基化-丙元素和19%的抗甲基化元素位于PMD内(补充图6). 在基因启动子处,TSS上游和下游都发生了相关的低甲基化(图4c),表明对基因体差异甲基化的观察21,22可能至少部分是这些较长的多基因PMD的结果。

以前,长程表观遗传沉默(LRES)的多基因域是根据前列腺癌细胞中的基因表达确定的23,24.这些研究中的一些前列腺LRES24显然与我们的结肠PMD相吻合,总体上这两组基因重叠显著(P(P)<0.0001;补充图10、16). 然而,我们的PMD在血压水平上与前列腺LRES没有明显重叠,这可能是LRES研究分辨率较低的结果。然而,我们确实观察到肿瘤PMD和核板相关结构域(LAD)之间存在显著的对应关系25)TIG3成纤维细胞(图4d). 因为与核膜的动态结合和分离被认为是长程基因沉默发育调控的关键机制26,我们研究了一个大区域,该区域包含几个对结肠肿瘤或IMR-90成纤维细胞特异的PMD边界(图5a). 该区域包含两个肿瘤抑制基因,在上皮性肿瘤中经常发生表观遗传沉默,1号核反应堆(参考27)和SFRP1系统(参考28)这两种基因都有高甲基化的启动子,并且在我们的肿瘤中表达降低。这两个基因都属于结肠肿瘤特异性PMDSFRP1系统启动子定义了IMR-90细胞而非肿瘤中的PMD边界(图5b). 确定这种细胞类型特异性边界在正常谱系规范或肿瘤发生过程中是否出现还需要进一步研究,但最近的研究表明,关键边界元素(如CTCF位点)的丢失会导致癌症沉默域的异常扩散29分析肿瘤PMD将有助于探索染色体重排是否也会导致异常沉默边界。

保存图片、插图等的外部文件。对象名为nihms656141f5.jpg
PMD边界的属性

()UCSC基因组浏览器绘制的13-Mb区域与结肠肿瘤或IMR-90成纤维细胞特有的多个PMD边界7注释了肿瘤特异性PMD区域,表明这两种上皮性肿瘤抑制因子1号核反应堆SFRP1型属于这些地区。(b条)周围高亮显示区域的高分辨率视图SFRP1系统表明该基因启动子在肿瘤中高度甲基化,并在IMR-90细胞中定义了细胞型特异性PMD边界。(c、 d日)绘制了与结肠肿瘤相关的10-kb bins的一些注释特征的平均基因组密度(c(c))和IMR-90(d日)PMD边界。图的方向是PMD外部的区域位于中点的左侧,PMD内部的区域位于中间点的右侧,如每个图下面的图表所示。我们通过将每个箱子内的值除以PMD外部箱子内的平均密度来标准化基因组密度。有关完整的边界图,请参见补充图11.

SFRP1系统边界启动子,我们研究了不同基因组注释相对于PMD边界的全基因组分布(图5c补充图11). 我们证实甲基化-脯氨酸CGI启动子在PMD内富集,但我们发现它们在PMD的前150 kb内最丰富,这一模式类似于人类胚胎干细胞多梳标记相对于LAD边界的模式25(图5c,左上)。相反,甲基化抗性CGI启动子在PMD内被耗尽,但在边界本身的10 kb内被强烈富集,如SFRP1系统(图5c,右上角)。只有面向PMD的甲基化抗性启动子在边界富集;那些面向PMD的启动子被耗尽,这表明基因转录和PMD边界形成之间存在着机械联系。与ENCODE ChIP-seq数据的比较揭示了在PMD边界富集的其他因素,包括CTCF和SIN3A,后者在PMD边界富集,但在PMD本身几乎完全不存在(图5c,左下方)。IMR-90细胞的LAD边界与结肠肿瘤PMD边界高度吻合(图5c,右下方)。

我们使用IMR-90数据来研究同一细胞中PMD边界和组蛋白修饰谱之间的关系30(图5d,顶部)。启动子相关的H3K4me3标记在PMD边界处富集,在PMD内有所耗尽,而组合的H3K 4me1/3增强子标记31PMD中几乎完全没有。异染色质相关的H3K9me3标记在PMD的深层内部富集。IMR-90 PMD边界也与成纤维细胞中晚期复制区域的边界一致32(图5d,底部),这一特征可能在机制上导致其在重复细胞分裂中的DNA甲基化损失33在细胞核的三维结构中,IMR-90 PMD对应于淋巴母细胞中使用全基因组染色质构象捕获(Hi-C)确定的两个主要核隔之一34.

我们使用来自25个结肠和直肠肿瘤以及匹配的邻近组织的独立和多样的DNA甲基化阵列数据,确认了PMD内高甲基化和低甲基化的空间关联6(图6). 我们使用严格的肿瘤与正常对照来表征每种肿瘤四种类别之一的阵列特征:甲基化抵抗、甲基化倾向、部分甲基化缺失或组成甲基化(图6a补充图12). 每个肿瘤中高甲基化和低甲基化的程度高度相关(图6b)这表明存在一个单一的癌细胞群,同时累积这两种变化。在每个肿瘤中,相对于不变的甲基化抗性和组成甲基化位点,甲基化脯氨酸和部分甲基化缺失位点优先定位在肿瘤PMD内(图6c). 从这些观察结果中可以得出两个结论:(i)与邻近正常结肠相比,大肠肿瘤通常含有低甲基化的PMD,(ii)这些PMD结构域中存在局部高甲基化和长程低甲基化。这两种现象似乎是通过发育调控联系在一起的26进化上保守35细胞核内染色质的高级组织和DNA复制时间的机制32永生化细胞系具有明确的PMD,但没有广泛的局部超甲基化,这两种基因是如何在永生化细胞中解耦的,将有助于深入了解癌细胞所使用的特定基因表达机制36这些发现显示了亚硫酸氢盐seq在使用临床DNA样本的单个分析中检测局部变化(即启动子、增强子或绝缘体)和高阶染色质结构的能力。

保存图片、插图等的外部文件。对象名为nihms656141f6.jpg
在25种不同的结肠肿瘤中,肿瘤特异性高甲基化和低甲基化是相关的,并且在PMD中高度富集

()五种代表性肿瘤的Infinium HumanMethylation27k阵列值(β值),分别与同一个体的相邻正常结肠粘膜进行比较。使用亚硫酸氢盐seq(来自个体14838)测序的肿瘤与来自参考文献6和彩色点表示探针被鉴定为四种甲基化类别之一:甲基化倾向(MP,红色)、甲基化抗性(MR,青色)、部分甲基化丢失(PML,绿色)和组成甲基化(CM,紫色)。未明确归入这些类别的探针以橙色显示。(b条)甲基化脯氨酸探针的平均高甲基化(肿瘤β减去正常β)和甲基化缺失探针的平均低甲基化(正常β减去肿瘤β)显示出强烈的线性相关性(Pearson第页=0.80)。彩色线表示最适合每个甲基化亚型的稳健线性回归。(c(c))对于每个肿瘤-正常对照,显示了不同基因组区域(H3K27me3、亚硫酸氢盐-seq PMD等)内的微阵列特征部分,特征由甲基化类别(甲基化抗性、甲基化倾向、甲基化丢失和组成甲基化)分隔。形状表示面板中的肿瘤亚型b条,亚硫酸盐seq数据为纯黑色。

URL

亚硫酸氢盐seq图,http://epigenome.usc.edu/; 南加州大学高性能计算中心,http://www.usc.edu/hpcc/; MAQ、,http://maq.sourceforge.net/; 内部Java库,http://sourceforge.net/projects/ngsgenomelibs/; 基因表达总览,网址:http://www.ncbi.nlm.nih.gov/geo/; Salk表观基因组学,http://neomorph.salk.edu/human_methylome/; UCSC ENCODE门户,http://genome.ucsc.edu/ENCODE/.

方法

组织样本

最近的一项研究对125例大肠肿瘤和25例正常邻近组织的启动子DNA甲基化进行了分析,从中提取了测序样本6.BRAF公司使用焦磷酸测序对所有样本进行突变分析,我们排除了那些患有BRAF公司突变导致p.Val600Glu和选择中的微卫星不稳定。然后,我们根据一组肿瘤特异性启动子的平均甲基化增益对肿瘤进行排序,并从CIMP高级别中选择一个高度甲基化的肿瘤。肿瘤中含有克拉斯突变导致p.Gly12Asp,来自一名患有3期原发性结肠腺癌的60岁男性。肿瘤和邻近正常粘膜的DNA来自安大略省肿瘤库(肿瘤的来源为OTB14838T,邻近组织的来源为OTB14838N)。所有受试者均获得知情同意,南加州大学机构审查委员会批准进行所述分析。

亚硫酸氢盐-seq文库构建和测序

每个样本的DNA文库都是用类似于先前研究的方法制备的7但有很多定制。简而言之,使用带有完全甲基化胞嘧啶的测序适配器(集成DNA技术)创建Illumina Genome Analyzer IIx测序文库,然后进行亚硫酸氢盐转化(Zymo EZ DNA甲基化试剂盒,Zymo Research)和PCR扩增。每个样本都有两个文库,每个文库都经过PCR扩增,将其分为九个独立的PCR反应,然后汇集PCR产物。

在Illumina Cluster Station流体装置上,将文库DNA连接到基因组分析仪流式细胞。如前所述,使用Illumina基因组分析仪IIx进行单基因DNA测序(76-bp读数)7对正常结肠和肿瘤样本分别进行了总共63条和67条通道的测序。通过Illumina贞操质量过滤器的读数被保留,正常样本的读数为1694273737,肿瘤样本的读数是1658970379(补充表1).

甲基胞苷水平的校准和提取

基因组构建hg18(NCBI v.36)用于所有分析。MAQ(见URL)用于序列比对,使用“-c”选项将测序读数中的任何c或T与参考基因组中的c相匹配。SAM工具37用于执行BAM文件的处理和合并,对于每个样本的两个测序库中的每一个,删除从相同基因组位置开始的重复读取。如果MAQ映射质量分数小于30,则也会过滤掉读取数据,这会删除许多不匹配的比对,以及那些与基因组中多个位置对齐得同样好的读取数据。使用内部Java库(参见URL)将BAM比对转换为基因组中每个胞嘧啶的甲基化百分比。如果参考基因组中的每一个胞嘧啶被亚硫酸氢盐转化链上的三个或三个以上的C或T读覆盖,则将其纳入分析范围,链上90%以上的读是C或T,而相反链上的90%以上读是G(即不受亚硫酸氢转化影响的“G”链)。如果以下位置的读数超过90%为G,则细胞因子被视为高置信CpG;如果下一位置的读数大于90%为H(A、C、T),则细胞色素被视为高置信CpH。对于结肠肿瘤样本,在序列读取覆盖的49057680个参考基因组CpG中,96.2%(47179160)被归类为高置信度CpG。在正常结肠粘膜中,49101921个CpG中有47886080个(97.5%)被归类为高可信CpG。

部分甲基化结构域的鉴定

通过扫描至少10 kb的所有窗口并在CpG二核苷酸中包含至少十个单独的胞嘧啶(每个CpG双核苷酸包含两个胞嘧啶,每条链上一个)来确定部分甲基化结构域。所有重叠的部分甲基化窗口折叠成单个PMD。在随后的分析中,只使用了那些长度超过100 kb的PMD。由于在PMD边界10kb范围内发现的甲基化抗性启动子占优势(图5c),为了分析验证肿瘤,我们将每端PMD缩短了10 kb(图6b).

局部甲基化变化的识别

通过扫描五个CpG二核苷酸内至少十个单独CpG胞嘧啶的所有窗口来确定非甲基化区域(每个CpG二核苷酸包含两个胞嘧啶,每条链上一个)。仅对至少三个胞嘧啶或胸腺嘧啶读数所覆盖的胞嘧啶进行计数,并为每个CpG二核苷酸分配一个权重因子,该权重因子定义为上游下一个CpG双核苷酸和下游下一个PpG双核核苷酸之间的跨度(以bp为单位)。计算每个窗口的加权平均值,肿瘤和邻近正常组织中平均DNA甲基化低于5%的窗口被归类为甲基化抗性。相邻正常组织中甲基化低于5%、肿瘤中甲基化高于35%的窗口被描述为甲基化倾向,相邻正常组织甲基化大于35%、肿瘤中小于5%的窗口被定义为甲基化缺失。来自单个甲基化类的两个或多个重叠区域合并为一个。用于在这些区域内丰富功能注释(图3b,c),将500bp内每个甲基化类的元素合并到一个位点。未合并元素进行基序分析(图3d).

使用Illumina 1M SNP阵列进行拷贝数分析

我们使用Illumina 1M SNP阵列平台(Illumiana)进行SNP分析,以评估结肠肿瘤和正常邻近样本中的肿瘤纯度和拷贝数变化。使用染色体1p上chr1:1–37740361位置的大缺失片段评估肿瘤纯度。我们选择了B等位基因频率在0.1到0.9之间的所有SNP(即二倍体细胞组分中杂合AB,单倍体肿瘤细胞组分中缺失a-或B-的SNP)。平均单倍体等位基因频率μ自动飞行在这2194个探针中,标准偏差为0.762(探针之间的标准偏差为0.050,得出的95%置信区间为0.760–0.764)。单倍体细胞的百分比计算为2−(1/μ自动飞行)或0.688(95%置信区间为0.684–0.692)。为了确定全基因组的拷贝数改变,我们使用了genoCNV38匹配肿瘤/正常模式(genoCNA)和肿瘤中拷贝数为1、2和3或更多的输出域(补充图2). 196个域中的223 Mb被确定为拷贝数1(删除),598个域中114 Mb被确认为拷贝数3或更多(增加),其余数据(2566 Mb)被确定为二倍体。

基因表达数据

表达数据处理在参考文献6中进行了描述,并可在NCBI基因表达综合总线(GEO)(见URL)上获得,登录号为GSE25070标准.

25对结肠癌和正常验证样本

下载参考文献6(GEO)中25个肿瘤和正常结肠样本的Infinium HumanMethylation27k阵列数据GSE25062标准). 甲基化亚型标签(CIMP-H、CIMP-L、Cluster 3和Cluster 4)取自GEO记录,代表来自两个队列的125个结肠肿瘤的无监督聚类:(i)安大略肿瘤银行(OTB)的100个样本,其中包括本研究中详细描述的14838个样本,和(ii)荷兰Groene Hart医院的26个配对肿瘤和邻近组织样本(“CL”收集)。对于我们的验证分析图6,我们只使用了CL收集,因为它完全独立于所研究的OTB肿瘤,并且它允许我们比较肿瘤和非肿瘤甲基化水平之间的差异。由于潜在的样本交换,我们删除了一个个体(17768),总共得到25对(补充图12).

我们确定了如下CL对的甲基化类别。单个肿瘤样本的甲基化抗性探针被定义为25个正常组织样本中正常组织β(甲基化)值小于0.2且肿瘤β在探针平均值0.5 s.d.以内的探针。在25个正常组织样本中,甲基化-脯氨酸探针是指正常组织β小于0.2,肿瘤β大于探针平均值5 s.d.的探针。组成甲基化探针是指25个相邻正常组织样本中正常组织β大于0.5,肿瘤β在探针平均值0.5 s.d.内的探针。在25个正常组织样本中,部分甲基化缺失探针是指正常组织β大于0.5,肿瘤β大于5 s.d.低于探针平均值的探针。

其他外部数据集

H1和IMR-90细胞系的亚硫酸氢盐seq数据7从Salk Epigenomics网站下载(参见URL)。FANTOM4 5′TSS注释39从基因组生物学网站下载。来自UCSC ENCODE门户的ChIP-seq数据(参见URL)、HiC数据34来自GEOGSE18199和复制定时数据来自参考文献32。

补充材料

补充电子表格

单击此处查看。(91K,xlsx)

补充文本和图表

单击此处查看。(44M,pdf)

致谢

我们感谢Kenneth T.和Eileen L.Norris基金会对南加州大学表观基因组中心的慷慨支持。我们感谢S.Hansen提供DNA复制数据。高性能计算支持由南加州大学高性能计算中心提供(请参阅URL)。我们非常感谢丹尼斯·库哈内出色的校对技巧。

这份手稿中描述的工作没有得到Epigenomics AG的支持,也不会使其受益。

脚注

接入代码。

本研究的序列数据和比对可在dbGaP登录代码PHS000385下获得。

接入代码

参考材料

基因表达总览

GSE25070标准

GSE25062标准

GSE18199

贡献

该项目由P.W.L.、D.J.W.、B.P.B.、D.V.D.B.和T.H.构思并设计实验。亚硫酸氢盐-seq文库构建和基因组分析仪测序由D.J.W.J.F.A.和D.V.D.B执行。Infinium基因分型和数据分析由B.P.B.执行。,H.N.的基序分析和B.P.B.和Z.R.的管道自动化由B.P.B.、Z.R和H.N.进行数据处理和分析。验证样品由C.P.E.L.、C.M.v.D.、R.A.E.M.T.、B.P.B.,D.J.W.和T.H.收集和分析。手稿由B.P.B和P.W.L.编写,研究由P.W.L监督。

竞争性金融利益

P.W.L.是AG表观基因组学的科学顾问委员会成员和顾问,AG对DNA甲基化生物标记物具有商业利益。

补充信息

PDF文件

1.补充文字和附图(18M)

补充说明,补充图1-16

Excel文件

1.补充表1和2(94K)

染色体亚硫酸氢盐seq汇总统计和亚硫酸氢酯seq详细统计

参与者信息

本杰明·伯曼,南加州大学表观基因组中心、南加州大学凯克医学院、美国加利福尼亚州洛杉矶市。

Daniel J Weisenberger,南加州大学表观基因组中心、南加州大学凯克医学院、美国加利福尼亚州洛杉矶市。

约瑟夫·F·阿曼,南加州大学表观基因组中心、南加州大学凯克医学院、美国加利福尼亚州洛杉矶市。

Toshinori Hinoue,南加州大学表观基因组中心,南加州大学凯克医学院,美国加利福尼亚州洛杉矶。

扎卡里·拉姆扬,南加州大学表观基因组中心、南加州大学凯克医学院、美国加利福尼亚州洛杉矶市。

刘亚萍,南加州大学表观基因组中心、南加州大学凯克医学院、美国加利福尼亚州洛杉矶市。

胡坦·努什梅尔,南加州大学表观基因组中心、南加州大学凯克医学院、美国加利福尼亚州洛杉矶市。

克里斯托弗·佩·兰格,荷兰古达Groene Hart医院外科。荷兰莱顿大学医学中心外科。

科内利斯·范·迪克,荷兰古达Groene Hart医院病理科。

Rob A E M Tollenaar,荷兰莱顿大学医学中心外科。

David Van Den Berg,南加州大学表观基因组中心,南加州大学凯克医学院,美国加利福尼亚州洛杉矶。

Peter W Laird,南加州大学表观基因组中心、南加州大学凯克医学院、美国加利福尼亚州洛杉矶市。

工具书类

1Jones PA,Baylin SB。表观遗传事件在癌症中的基本作用。Nat.Rev.基因。2002;:415–428.[公共医学][谷歌学者]
2Gal-Yam EN等。PC3前列腺癌细胞系中Polycomb抑制标记的频繁切换和DNA超甲基化。程序。国家。阿卡德。科学。美国。2008;105:12979–12984. [PMC免费文章][公共医学][谷歌学者]
三。Irizarry RA等。在保守的组织特异性CpG岛海岸,人类结肠癌甲基组表现出类似的低甲基化和高甲基化。自然遗传学。2009;41:178–186. [PMC免费文章][公共医学][谷歌学者]
4Gebhard C等。正常细胞中CpG岛上的一般转录因子结合与对从头开始癌细胞中的DNA甲基化。癌症研究。2010;70:1398–1407.[公共医学][谷歌学者]
5Noushmehr H等人。CpG岛甲基化表型的鉴定,该表型定义了胶质瘤的不同亚群。癌细胞。2010;17:510–522。 [PMC免费文章][公共医学][谷歌学者]
6Hinoue T等。大肠癌中异常DNA甲基化的基因组尺度分析。基因组研究。2011年6月9日;在线发布,[PMC免费文章][公共医学][谷歌学者]
7李斯特R等。碱基分辨率的人类DNA甲基体显示出广泛的表观基因组差异。自然。2009;462:315–322. [PMC免费文章][公共医学][谷歌学者]
8李斯特R等。人类诱导多能干细胞中异常表观基因重编程的热点。自然。2011;471:68–73. [PMC免费文章][公共医学][谷歌学者]
9ENCODE项目联盟等。DNA元素百科全书(ENCODE)用户指南《公共科学图书馆·生物》。2011;9:e1001046。 [PMC免费文章][公共医学][谷歌学者]
10Irizarry RA、Wu H、Feinberg美联社。基于物种通用概率模型的CpG岛定义。妈妈。基因组。2009;20:674–680. [PMC免费文章][公共医学][谷歌学者]
11Widschwendter M等人。癌症中的表观遗传干细胞特征。自然遗传学。2007;39:157–158.[公共医学][谷歌学者]
12Schlesinger Y等。组蛋白H3的Lys27的多梳介导甲基化预标记基因从头开始癌症中的甲基化。自然遗传学。2007;39:232–236.[公共医学][谷歌学者]
13Ohm JE等。干细胞样染色质模式可能使肿瘤抑制基因易发生DNA超甲基化和遗传沉默。自然遗传学。2007;39:237–242. [PMC免费文章][公共医学][谷歌学者]
14Visel A等,ChIP-seq准确预测增强子的组织特异性活性。自然。2009;457:854–858. [PMC免费文章][公共医学][谷歌学者]
15Rada-Iglesias A等人。一种独特的染色质特征揭示了人类早期发育增强因子。自然。2011;470:279–283. [PMC免费文章][公共医学][谷歌学者]
16Boumber YA等。Sp1/Sp3结合多态性提供甲基化保护。公共科学图书馆-遗传学。2008;4:e1000162。 [PMC免费文章][公共医学][谷歌学者]
17Cuddapah S等。染色质屏障区绝缘体结合蛋白CTCF的整体分析揭示了活性域和抑制域的划分。基因组研究。2009;19:24–32. [PMC免费文章][公共医学][谷歌学者]
18Estécio MR等。以反转录转座子为标志的基因组结构调节癌症中DNA甲基化的倾向。基因组研究。2010;20:1369–1382. [PMC免费文章][公共医学][谷歌学者]
19Heinz S等。谱系决定转录因子质体的简单组合顺式-巨噬细胞和B细胞特性所需的调节元件。分子细胞。2010;38:576–589. [PMC免费文章][公共医学][谷歌学者]
20Aguilera C等。C-Jun N端磷酸化拮抗Mbd3/NuRD阻遏物复合物的募集。自然。2011;469:231–235.[公共医学][谷歌学者]
21宾夕法尼亚州琼斯。DNA甲基化悖论。趋势Genet。1999;15:34–37.[公共医学][谷歌学者]
22Hellman A,Chess A.活性X染色体上的基因体特异性甲基化。科学。2007;315:1141–1143。[公共医学][谷歌学者]
23Frigola J等。结直肠癌的表观遗传重构导致整个染色体带上的协同基因抑制。自然遗传学。2006;38:540–549.[公共医学][谷歌学者]
24Coolen MW等。通过长程表观遗传沉默(LRES)将癌症基因组整合到抑制染色质的结构域中会降低转录可塑性。自然细胞生物学。2010;12:235–246. [PMC免费文章][公共医学][谷歌学者]
25Guelen L等人。通过核膜相互作用的映射揭示了人类染色体的结构域组织。自然。2008;453:948–951.[公共医学][谷歌学者]
26Peric-Hupkes D等。分化过程中基因组-核膜相互作用重组的分子图。分子细胞。2010;38:603–613. [PMC免费文章][公共医学][谷歌学者]
27Chua YL等人NRG1型乳腺癌中的基因经常因甲基化而沉默,是8p抑癌基因的有力候选基因。致癌物。2009;28:4041–4052. [PMC免费文章][公共医学][谷歌学者]
28Dahl E等人SFRP1系统多发人类实体瘤中的表达:与肾细胞癌中异常启动子甲基化的关系。致癌物。2007;26:5680–5691.[公共医学][谷歌学者]
29Witcher M,Emerson BM。p16(INK4a)抑癌基因的表观遗传沉默与CTCF结合和染色质边界的丢失有关。分子细胞。2009;34:271–284. [PMC免费文章][公共医学][谷歌学者]
30Hawkins RD等人。多能干细胞和谱系承诺人类细胞的独特表观基因组景观。细胞干细胞。2010;6:479–491. [PMC免费文章][公共医学][谷歌学者]
31Heintzman ND等。人类增强子的组蛋白修饰反映了全球细胞类型特异性基因表达。自然。2009;459:108–112. [PMC免费文章][公共医学][谷歌学者]
32Hansen RS等人。对新复制的DNA进行测序揭示了人类复制时间的广泛可塑性。程序。国家。阿卡德。科学。美国。2010;107:139–144. [PMC免费文章][公共医学][谷歌学者]
33Aran D,Toperoff G,Rosenberg M,Hellman A.活性人类基因的复制时间相关和基因体特异性甲基化。嗯,分子遗传学。2011;20:670–680.[公共医学][谷歌学者]
34Lieberman-Aiden E等人。对长程相互作用的综合绘图揭示了人类基因组的折叠原理。科学。2009;326:289–293. [PMC免费文章][公共医学][谷歌学者]
35Pickersgill H等人黑腹果蝇核纹层的基因组。自然遗传学。2006;38:1005–1014.[公共医学][谷歌学者]
36Xiang Y等。JMJD3是组蛋白H3K27脱甲基酶。细胞研究。2007;17:850–857.[公共医学][谷歌学者]
37Li H等。序列比对/地图格式和SAMtools。生物信息学。2009;25:2078–2079. [PMC免费文章][公共医学][谷歌学者]
38Sun W等。使用高密度SNP阵列对拷贝数状态和基因型调用的综合研究。核酸研究。2009;37:5365–5377. [PMC免费文章][公共医学][谷歌学者]
39Balwierz PJ,et al.分析深度测序表达数据的方法:用deepCAGE数据构建人类和小鼠启动子组。基因组生物学。2009;10:R79。 [PMC免费文章][公共医学][谷歌学者]