跳到主要内容
访问密钥 NCBI主页 MyNCBI主页 主要内容 主导航
自然遗传学。作者手稿;PMC 2010年10月20日发布。
以最终编辑形式发布为:
2009年11月1日在线发布。 数字对象标识:10.1038/ng.471
PMCID公司:项目经理2958040
尼姆斯:美国国家卫生研究院237010
PMID:19881528

组织和癌症特异性CpG岛岸的差异甲基化区分了人类诱导多能干细胞、胚胎干细胞和成纤维细胞

关联数据

补充资料

摘要

诱导多能干细胞(iPS)是通过表观遗传重编程获得的,但其DNA甲基化模式尚未在全基因组范围内进行分析。在这里,我们发现与亲代成纤维细胞相比,9个人类iPS细胞系中的胞嘧啶-磷酸-鸟嘌呤(CpG)岛海岸存在大量的高甲基化和低甲基化。重组细胞(表示为R-DMR)中的差异甲基化区域(DMR)在组织特异性(T-DMR;2.6倍,P(P)< 10−4)和癌症特异性DMR(C-DMR;3.6倍,P(P)< 10−4). 值得注意的是,尽管iPS细胞来源于成纤维细胞,但其R-DMR可以区分正常的脑、肝和脾细胞,以及结肠癌和正常结肠细胞。因此,许多DMR广泛参与组织分化、表观遗传重编程和癌症。我们观察到低甲基化R-DMR与高甲基化C-DMR和双价染色质标记的共定位,以及高甲基化R-DMAR与低甲基化C-DMAR的共定位以及双价标记的缺失,这表明iPS细胞和癌症中的表观遗传重编程有两种机制。

诱导多能干细胞(iPS)可以通过引入少量基因从体细胞中获得:例如,POU5F1,MYC公司,KLF4型索214作为个体自身组织的直接衍生物,iPS细胞具有巨大的治疗前景5避免使用它们的免疫学和伦理障碍。iPS细胞在表观遗传学上不同于其体细胞亲本细胞,因此,对iPS和体细胞的表观基因组进行全面比较将有助于深入了解组织重编程的机制。尽管最近有两项针对性研究6,7检测了基因组7000的一个子集(参考文献。6)和66000(参考。7)CpG位点——在一个由三对iPS-成纤维细胞对组成的小队列中,尚未进行全基因组甲基化的全球评估。

最近,我们描述了区分正常组织类型(T-DMR)和可将结直肠癌组织与匹配正常组织(C-DMR)分离的模式的差异甲基化模式8出乎意料的是,这两个DMR在CpG岛“海岸”发生的频率是CpG岛屿本身的13倍,CpG密度相对较低的区域位于传统的CpG群岛附近。癌症显示出大约相等数量的低甲基化和高甲基化区域,45%的C-DMR与T-DMR重叠,表明癌症的表观遗传变化涉及组织特异性分化正常模式的重新编程8.

在这里,我们使用了一种类似的方法来解决iPS细胞重新编程的问题,首先通过综合高通量阵列相对甲基化(CHARM)分析将六种人类iPS细胞系与从中获得它们的成纤维细胞进行比较9此方法允许使用定制设计的NimbleGen HD2微阵列在全基因组范围内查询约460万个CpG位点,包括人类基因组中几乎所有的CpG岛和海岸。iPS细胞基因组DNA,5用McrBC酶消化其亲代成纤维细胞和人类胚胎干细胞(在线方法),分离、标记并杂交到CHARM阵列。

共发现4401个区域(包括96404个CpG位点)在iPS细胞系中与原发性成纤维细胞不同(表1,补充表1)错误发现率(FDR)为5%;我们称这些区域为R-DMR。在这些R-DMR中,与成纤维细胞相比,iPS细胞中高甲基化的DMR占了低甲基化DMR的大多数(60%:40%)。在4401个DMR中,1969个位于基因转录起始点2 kb以内。

表1

CHARM发现的差异甲基化区域(DMR)与组织特异性差异甲基化区(T-DMR)重叠

数字式万用表总数。方法。DMR总计TSS基因2 kb内的DMR与T-DMR重叠
不。折叠丰富。P(P)价值
iPS-光纤。R-DMR公司(n个= 6)iPS>纤维。2,6631,278观察1,4252.51<0.0001
4,401随机568
光纤>iPS1,738691观察1,0382.67<0.0001
随机389
iPS-ES DMRb条(n个= 3)71iPS>ES5123观察373.32<0.0001
随机11
ES>iPS209观察920.020
随机4
iPS-光纤。R-DMR公司b条(n个= 3)2,179iPS>光纤。988497观察6303.30<0.0001
随机191
光纤>iPS1,191384观察6792.86<0.0001
随机237

小谎。,成纤维细胞;冰毒。,甲基化;丰富。,丰富。

FDR截止值为0.05。
b条10.0的绝对面积截止值。

P(P)基于10000个排列的值。随机值是所有10000次迭代的平均值。

根据生物信息学分析,与这些R-DMR相关的基因显示出重要的功能特征。首先,对这些基因的基因本体(GO)注释分析揭示了参与发育和调控过程的基因的显著富集(补充表2). 例如,与成纤维细胞相比,iPS中有38%的基因发生了低甲基化(P(P)= 3.56 × 10−60)与成纤维细胞相比,iPS中高甲基化的基因占22%(P(P)= 1.73 × 10−12)参与发展过程。为了进一步阐明这些R-DMR的功能意义,我们观察了它们与标记胚胎干细胞发育基因的二价结构域的重叠10,11值得注意的是,与成纤维细胞相比,在iPS细胞中低甲基化的R-DMR中,有65%与二价结构域标记显著相关(P(P)<0.0001×10000个排列),而只有18.6%的高甲基化R-DMR与这些结构域重叠(P(P)=0.5699乘以10000排列)(补充表3). 此外,当我们观察到R-DMR与多能性标记的已知结合位点重叠时,如POU5F1,NANOG公司索2(参考。12),我们看到了类似的关系,其中低甲基化的R-DMR显示出明显的重叠(P(P)<0.0001乘以10000排列),而高甲基化DMR没有(P(P)=1乘以10000排列;补充表4). 这些观察结果表明,在成纤维细胞重编程为iPS细胞的过程中,去甲基化位点与对多能性具有重要功能的基因紧密相连。

R-DMR显示了几个值得注意的特征。首先,超过70%的R-DMR与CpG岛海岸相关,而不是与相关的CpG岛屿相关(图1a)与成纤维细胞相比,无论诱导多能干细胞中的R-DMR是高甲基化还是低甲基化(补充图1a). 其次,56%的R-DMR重叠了T-DMR,这些T-DMR以前被鉴定为代表三种生殖细胞谱系的不同组织,即脑、肝和脾8(表1). 这种重叠具有统计学意义(P(P)<0.0001乘以10000排列)。此外,iPS细胞中的高甲基化和低甲基化R-DMR与已知的T-DMR都显示出相似的重叠,重叠率分别为54%和60%(表1). 因此,R-DMR在CpG岛海岸大量富集,并在很大程度上与正常发育中涉及的T-DMR重叠。基因-最大R-DMR和T-DMR也有61%的重叠。

保存图片、插图等的外部文件。对象名称为nihms237010f1.jpg

对差异甲基化区域(R-DMR)进行重新编程。()在CpG岛海岸富集R-DMR。CHARM阵列(左侧标记为CpG区域)在CpG岛富集,R-DMR(右侧标记为R-DMR)在Cp岛海岸富集。岛屿表示为包含大于50%的CpG岛屿或完全包含在岛屿中的区域,重叠区域表示为包含0.1-50%的CpG-岛屿的区域。显示了不重叠岛屿区域的特定基准间隔;(0-500)是指从1到500个碱基。分配百分比(轴)表示CpG区域(CHARM数组,零假设)和重编程差异甲基化区域(R-DMR)。(b条,c(c))DMR示例。编码骨形态发生蛋白7的基因(骨形态发生蛋白7)如所示b条和编码鹅膏样蛋白的基因(GSC公司)如所示c(c)在每种情况下,上部面板显示甲基化图(M(M)价值;参见在线方法)与基因组位置,其中曲线表示平均平滑M(M)价值观;显示了CpG二核苷酸的位置(黑色勾号)、CpG密度、CpG-岛的位置(橙色线)以及基因注释。底部面板显示通过亚硫酸氢盐焦磷酸测序进行的验证(映射到上部面板中的红色框)。条形图代表iPS细胞(粉红色)、成纤维细胞(灰色)和ES细胞(蓝色)以及通常高度甲基化的HCT116结肠癌细胞系和从其衍生的通常低甲基化的双DNA甲基转移酶1/3B双敲除系(DKO)的平均甲基化(一式三份测量)±s.d.。在每种情况下,对五个单独的CpG位点进行了定量分析,显示为不同的色度。

然后,我们对一组单独的三个iPS细胞系和它们来源的成纤维细胞以及三个人类ES细胞系重复CHARM分析。我们无法对较少的测线进行FDR统计测试,因此我们在曲线中使用了类似的面积截止值,其大小与之前实验的5%FDR截止值相对应。在第二次分析中,共鉴定出2179个R-DMR,iPS细胞中的低甲基化DMR略多于高甲基化DMRs(55%比45%)。值得注意的是,80%的DMR与第一次实验中发现的重叠(参见补充表5完整列表)。与第一次分析一样,CpG岛海岸(78%,补充图1b),60%的R-DMR与T-DMR重叠(表1).

第二次分析揭示了iPS细胞与ES细胞相比的甲基体。尽管这两种细胞类型的DNA甲基化非常相似,但71个DMR将其区分开来,其中51个细胞表现出高甲基化,20个细胞表现为低甲基化(补充表6). 这些DMR的GO注释显示,与ES细胞相比,iPS细胞中的高甲基化基因的发育过程显著丰富(补充表7). 在32个区分iPS细胞和ES细胞的DMR中,DMR位于感兴趣的基因附近,包括HOXA9型和编码锌指蛋白的两个基因ZNF568型ZFP112型在某些情况下,iPS细胞的甲基化介于分化的成纤维细胞和ES细胞之间;例如,这是真的TBX5型,编码参与心脏和肢体发育的转录因子。在其他情况下,iPS细胞中的甲基化与成纤维细胞和ES细胞不同,这表明iPS细胞具有独特且可能异常的表观遗传状态。一个例子是PTPRT公司,编码一种蛋白酪氨酸磷酸酶,参与包括分化在内的许多细胞过程。对于某些ES-iPS差异,与成纤维细胞相比,胚胎干细胞甲基化水平的变化方向相同,但程度更大;例如,同源异型盒基因的甲基化HOXA9型与ES相比,iPS中的甲基化程度更高,ES在该基因上的甲基化水平高于成纤维细胞。

我们通过两种方式验证了这些数据。首先,我们通过九个DMR的亚硫酸氢盐焦磷酸测序验证了CHARM的甲基化结果,检查每个DMR中的2-6个CpG。对于所有这些基因,亚硫酸氢盐焦磷酸测序数据证实了来自CHARM的差异甲基化数据(图1b、c,补充图2).

我们还使用Affymetrix HGU133 Plus 2.0微阵列进行了全球基因表达分析。在距离基因转录起始位点(TSS)500 bp以内的R-DMR处,差异基因表达和差异DNA甲基化之间存在强烈的负相关:P(P)< 10−3对于高甲基化和低甲基化(补充图3a,补充表8). 即使R-DMR在TSS的1kb范围内,这种显著关联仍然成立(P(P)=0.01和P(P)< 10−3对于高甲基化和低甲基化的R-DMR,补充图3b). 此外,在CpG岛海岸的DMR中,这种相关性增强。

此外,我们使用R-DMR进行了无监督聚类分析,以确定这些位置的甲基化在多大程度上区分了正常的大脑、肝脏和脾脏。值得注意的是,这三种组织完全分离,表明在重新编程期间发生的甲基化改变的位点通常可以区分这些不同的组织(图2a). 此外,R-DMR可以在很大程度上区分正常结肠粘膜和结直肠癌,这表明R-DMR也参与了癌症的异常重编程(图2b). 作为显著性测试,1000个随机生成的长度和数量相等的CHARM阵列区域列表中,没有一个能够将组织聚集在一起,通过它们在给定组织类型的样本中是否产生了至少与使用R-DMR时发现的欧氏距离中位数进行评估,或得出不同组织类型样本之间的欧氏距离中值,至少与使用R-DMR时的结果相同。无论是正常组织之间的比较,还是癌与正常组织的比较,都是如此。

保存图片、插图等的外部文件。对象名为nihms237010f2.jpg

R-DMR处的DNA甲基化区分正常组织和结肠癌与正常结肠。(,b条)M(M)将4401个区域的所有组织的值(FDR<0.05)对应于R-DMR(iPS细胞与亲代成纤维细胞相比),用于无监督的层次聚类比较()正常大脑、脾脏和肝脏(分别表示为Br、Sp和Lv)和(b条)结直肠癌和匹配的正常结肠粘膜(分别表示为T和N)。值得注意的是,iPS细胞和成纤维细胞(R-DMR)之间不同的区域完全区分了所有正常的脑、脾和肝组织。树状图中的主要分支与组织类型完全对应。此外,大多数结直肠癌样本通过R-DMRs与匹配的正常结肠粘膜进行区分。

我们将R-DMR与大肠癌和来自相同个体的匹配正常结肠粘膜(C-DMR)DNA甲基化的基因组规模比较中获得的结果进行了比较8我们之前发现C-DMR的数量远小于T-DMR(2707个,而16379个),并且45%的C-DMR与T-DMR重叠。本研究中约16%的R-DMR与之前研究中的C-DMR重叠,而置换分析预测平均只有4.5%重叠(P(P)<0.0001(基于10000个排列)(补充表9). 值得注意的是,低甲基化的R-DMR(iPS与成纤维细胞相比)与高甲基化的C-DMR(癌症与正常相比,P(P)<0.0001(基于10000个排列)(补充表9). 在发现的294个DMR中,低甲基化R-DMR和高甲基化C-DMR重叠,251个(85%)也重叠了二价染色质标记。相反,高甲基化的R-DMR与低甲基化的C-DMR相关(P(P)<0.0001(基于10000个排列)(补充表9). 在293个高甲基化R-DMR和低甲基化C-DMR重叠的DMR中,只有37个(13%)也重叠了二价染色质标记。由于双价染色质标记与Polycomb组蛋白的招募相关,这些数据表明细胞重编程和肿瘤发生有两种独立的表观遗传机制。一种机制涉及重编程期间DNA甲基化和双价位点染色质修饰减少以及癌症甲基化增加。另一种机制涉及重编程过程中甲基化增加和癌症中甲基化丢失。

总之,我们发现人类成纤维细胞向iPS细胞的表观遗传重编程涉及DNA甲基化的实质性变化,主要影响T-DMR中标志正常分化的相同CpG岛海岸。值得注意的是,R-DMR完全区分了脑、肝和脾组织,并在很大程度上区分了结肠癌和正常结肠组织。这些结果有力地证明了CpG岛海岸和T-DMR在正常发育和体细胞重编程中的重要性。事实上,正常组织编程、表观遗传重编程到多能性和癌症异常编程的目标基因座在很大程度上是重叠的。第二个发现是,iPS细胞中的某些基因座仍不完全重新编程,而其他基因座则异常重新编程,从而确定iPS细胞的甲基化模式与亲本体细胞和人类ES细胞不同。

我们的结果与之前的研究形成了对比,这些研究主要针对开发强大的新工具来分析靶向基因组区域的DNA甲基化,而不是iPS细胞甲基化的基因组规模研究。我们对九对iPS细胞和亲代成纤维细胞进行了更广泛的基因组分析,检测到大致相同水平的低甲基化和高甲基化,并揭示了CpG岛海岸对岛屿本身的主要影响。我们研究的局限性包括CHARM阵列的基因组覆盖仍然不完整,尽管包括岛屿和海岸,但仍然没有检测单个或非常低密度的CpG甲基化;使用源自单一细胞类型的iPS细胞;以及用于比较仅涉及三种正常组织类型的T-DMR和仅涉及一种癌症类型的C-DMR的数据库仍然相对有限。然而,本研究揭示了一系列代表表观遗传重构目标的基因座,这些表观遗传重塑目标对体细胞重编程至关重要。这些R-DMR包括低甲基化和高甲基化区域,是之前描述的T-DMR和C-DMR的子集,表明CpG岛海岸的这些R-DMRs是确定细胞命运的关键表观遗传靶点。

最后,低甲基化R-DMR在iPS细胞中的共定位与癌症和双价染色质标记中的高甲基化C-DMR,以及高甲基化R-DMAR与低甲基化C-DMAR的共定位以及这些标记的缺失,表明了iPS细胞和癌症中表观遗传重编程的两种平行机制,其中一个涉及iPS中DNA甲基化的缺失和癌症中染色质依赖的DNA甲基化增加,另一个涉及到iPS中甲基化的增加和癌症中不依赖染色质的DNA甲基化度的丢失。

方法

方法和任何相关参考可在论文的在线版本中找到,网址为http://www.nature.com/naturegenetics网站/.

补充材料

补充信息

单击此处查看。(120万,pdf)

表S3

单击此处查看。(1.3M,xls)

表S4

单击此处查看。(425K,xls)

表S5

单击此处查看。(32K,xls)

表S6

单击此处查看。(131K,xls)

致谢

这项研究得到了美国国立卫生研究院(A.P.F.和G.Q.D.)的支持。G.Q.D附属机构包括哈佛医学院生物化学和分子药理学系;布里格姆女子医院血液科;哈佛干细胞研究所;和曼顿孤儿病研究中心。

脚注

接入代码。NCBI GEO:基因表达微阵列数据和CHARM微阵列数据已以登录号GSE18111提交。

注:补充信息可在自然遗传学网站上找到。

作者贡献

A.D.进行了CHARM、亚硫酸氢盐焦磷酸测序和数据分析;B.W.进行了初步实验,并帮助设计和分析研究;I.-H.P.、J.R.、S.L.、J.M.和T.S.进行细胞培养并制备核酸;P.M.、M.J.A.、R.I.、B.H.和C.L.-A.进行了统计分析;G.Q.D.和A.P.F.设计了这项研究,监督实验,并与A.D.和B.W.一起写论文。

重印和权限信息可在线获取,网址为http://npg.nature.com/reprintsandpermissions/.

工具书类

1.Takahashi K,Yamanaka S.通过特定因子从小鼠胚胎和成年成纤维细胞培养物中诱导多能干细胞。单元格。2006;126:663–676.[公共医学][谷歌学者]
2Takahashi K等。通过特定因子从成人成纤维细胞诱导多能干细胞。单元格。2007;131:861–872.[公共医学][谷歌学者]
三。Park IH等。用特定因子将人体体细胞重新编程为多能性。自然。2008;451:141–146.[公共医学][谷歌学者]
4于杰,等。从人体体细胞诱导多能干细胞系。科学。2007;318:1917–1920.[公共医学][谷歌学者]
5Park IH等人,疾病特异性诱导多能干细胞。单元格。2008;134:877–886. [PMC免费文章][公共医学][谷歌学者]
6Ball MP等人。靶向和基因组规模策略揭示了人类细胞中的基因-体甲基化特征。国家生物技术。2009;27:485. [PMC免费文章][公共医学][谷歌学者]
7Deng J等。靶向亚硫酸氢盐测序揭示了与核重编程相关的DNA甲基化变化。国家生物技术。2009;27:353–360. [PMC免费文章][公共医学][谷歌学者]
8Irizarry RA等。在保守的组织特异性CpG岛海岸,人类结肠癌甲基组表现出类似的低甲基化和高甲基化。自然遗传学。2009;41:178–186. [PMC免费文章][公共医学][谷歌学者]
9Irizarry RA等人,相对甲基化的综合高通量阵列(CHARM)基因组研究。2008;18:780–790. [PMC免费文章][公共医学][谷歌学者]
10Bernstein BE等人。双价染色质结构标志着胚胎干细胞中的关键发育基因。单元格。2006;125:315–326.[公共医学][谷歌学者]
11Pan G等。人类胚胎干细胞组蛋白H3赖氨酸4和赖氨酸27甲基化的全基因组分析。细胞干细胞。2007;1:299–312.[公共医学][谷歌学者]
12Boyer LA等。人类胚胎干细胞的核心转录调控电路。单元格。2005;122:947–956. [PMC免费文章][公共医学][谷歌学者]