介绍
肝细胞癌(HCC)是世界上最常见、最致命的癌症之一。由于缺乏有效的治疗,该疾病对我们的社区造成了巨大的健康负担[1],[2]慢性乙型肝炎病毒(HBV)和丙型肝炎病毒(HCV)感染、酗酒、环境和职业毒素以及某些代谢和免疫紊乱是HCC的危险因素[3],[4].
正常肝细胞向恶性细胞的顺序性变化与反映累积遗传改变的基因表达改变有关,如染色体不稳定(CIN)和DNA重排,这些已被广泛研究[5]然而,肝癌的分子发病机制仍不清楚。胞嘧啶-鸟嘌呤二核苷酸(CpG位点)中碳5位(5 mC)的DNA胞嘧啶残基甲基化是真核生物DNA中常见的表观遗传机制,在基因活性调控中起着重要作用。在包括肝癌在内的许多人类癌症中观察到异常的DNA甲基化[6],[7],[8],其中全局低甲基化和特异性启动子高甲基化已被发现分别是与基因组不稳定和肿瘤抑制基因沉默有关的典型表观遗传学变化[9],[10]此外,胞嘧啶甲基化的变化也可作为预测肿瘤进展的分子标记物[11]在HCC中,候选基因异常甲基化,如GSTP1标准,RASSF1A公司,空气污染指数和CDH-1型已使用甲基化特异性聚合酶链反应(MSP)、亚硫酸氢盐限制性联合分析(COBRA)和亚硫酸氢盐测序技术进行检测[12],[13],[14]然而,由于全基因组甲基化分析技术是最近才引进的,尽管癌症中有更多的基因和DNA序列可能发生异常甲基化,但大多数研究的范围都很有限,分析的重点是抑癌基因的高甲基化或癌基因的低甲基化或重复元素(如LINE1)的甲基化。最近,使用Illumina HumanMethylation27 BeadChip进行了肝癌全基因组DNA甲基化分析[14],[15]这两项研究确定了许多以前未知的区域和基因在肝癌中存在差异甲基化。然而,为了更好地了解肝癌发生过程中的异常甲基化,仍需要对DNA甲基化进行更高分辨率的全基因组分析。
在本研究中,我们使用最新版本的Illumina甲基化微阵列芯片HumanMethylation450 BeadChip(methylation 450 BeadChap)定量分析了27例肝癌样本和20例邻近正常组织中485000多个CpG位点。该分析使我们能够确认各种已知差异甲基化区域(DMR)中的差异甲基化,如重编程特异性DMR(rDMR)、癌症特异性DMRs(cDMR)[7]和配件(电子版以及寻找潜在的新HCC DM基因座。我们还确定了启动子CpG岛周围基因组区域的差异甲基化,如海岸和大陆架。
材料和方法
患者标本
该研究由夏威夷大学马诺分校人类研究委员会(机构审查委员会)审查和批准。所有参与研究的患者都出具了书面知情同意书。作为肝部分切除术或肝移植术的一部分,从患者身上切除肝组织,肝部分切除术或肝移植术由肝胆/肝移植外科医生(LW)对肝细胞癌进行。除了每个患者的临床指示外,没有进行其他操作。2009年至2011年间,所有手术均在夏威夷医疗中心进行。共获得27个肝癌组织和20个邻近正常(非恶性)组织,包括19对配对。对每位患者进行组织病理学评估,以确认组织中的肿瘤含量。相关的人口统计学和临床信息,包括患者年龄、HCC AJCC分期、性别、HBV和HCV感染状态以及饮酒情况,见.
表1
27例肝癌的临床和病理特征。
临床病理特征 | |
总病例数 | 27 |
中位年龄(范围) | 66 (52–88) |
阶段 | |
我 | 18 (67%) |
二 | 3 (11%) |
四、 | 1 (4%) |
不适用 | 5 (18%) |
性别 | |
男性 | 20 (74%) |
女性 | 7 (26%) |
病毒状态 | |
HBV阳性 | 9 (33%) |
HCV阳性 | 10 (37%) |
非HBV、非HCV | 8 (30%) |
频繁饮酒*
| 5 (19%) |
DNA提取和亚硫酸氢盐转化
使用AllPrep DNA/RNA Mini试剂盒(加利福尼亚州巴伦西亚Qiagen Inc)从组织样本中提取DNA。提取的DNA的质量和数量由NanoDrop-2000(Thermo Scientific,Wilmington,DE)检测。根据制造商关于使用EZ DNA甲基化试剂盒(加利福尼亚州欧文市Zymo Research)的甲基化450珠芯片的建议,对每个样品进行500 ng DNA的亚硫酸氢盐转化。治疗方案包括16个周期,在95°C下变性30秒,在50°C下孵育60分钟,以及最后一个步骤,在4°C下保持。
甲基化分析
使用HumanMethylation450 BeadChip(Illumina,San Diego,CA)分析485577个基因座的全基因组DNA甲基化谱。这些位点覆盖了96%的已知CpG岛和99%的NCBI参考序列(RefSeq)基因,每个基因平均17个CpG位点分布在转录起始位点(TSS)1500、TSS200、5′非翻译区(UTR)、第一外显子、基因体和3′UTR的上游。基因组中485577个胞嘧啶位点包括482421个(99.35%)CpG二核苷酸、3091个(0.64%)CNG靶点和65个(0.01%)SNP位点。按照Illumina Infinium HD甲基化协议,使用4µl亚硫酸氢转化DNA杂交到甲基化450珠芯片上。这包括一个全基因组扩增步骤,然后是酶的终点裂解、沉淀和再悬浮。将重悬的样品在48°C下与珠芯片杂交16小时。杂交后,将未杂交和非特异性杂交的DNA洗掉,然后使用杂交的亚硫酸氢处理的DNA作为模板进行单核苷酸延伸。使用Illumina iScan SQ扫描仪创建单个阵列的图像,并使用GenomeStudio(v.2011.1)甲基化模块(v.1.9.0)软件提取图像的强度。
使用Genome Studio软件提供的“背景减法”和“内部控制标准化”方法对数据进行标准化。首先,从每个通道的内置阴性对照珠类型的信号中导出背景减法值,将背景水平设置为给定通道中阴性对照的5%百分位。然后从同一通道中的探针强度中减去背景。如果强度变为负值,则设置为0。其次,利用甲基化450珠芯片上的内部控制探针对进行归一化。标准化控制探针对(其中超过90个)设计用于定位家政基因中的同一区域,并且探针中没有潜在的CpG位点。对于归一化,将给定样本中的探针强度乘以恒定归一化因子(对于所有样本),再除以给定样本中探针通道中归一化控制的平均值。
每个CpG位点的甲基化得分由根据甲基化和非甲基化信号之间的标准化探针荧光强度比计算的β值表示。β值在0(完全非甲基化)和1(完全甲基化)之间变化。甲基化450珠片上的每个β值都伴随着一个检测p值,指示信号明显大于背景值,这些检测p值用于从数据中去除噪声。通过从合并的相邻正常组织中减去合并的HCC样本的平均beta值,计算表明HCC和相邻正常组织之间差异甲基化的平均Delta-beta值。
通过甲基化450 BeadChip分析发现的差异甲基化(DM)基因座子集(n=8)被选择用于Pyrosequencing验证。按照建议的方案,首先使用PyroMark PCR试剂盒(Qiagen)在感兴趣的区域通过PCR扩增亚硫酸氢盐处理的DNA。有关预先设计和自定义焦深测序分析的信息,请参阅表S5其中一个PCR引物被生物素化,以便在方案中稍后被链霉亲和素Sepharose捕获。使用PyroMark Gold Q24试剂(Qiagen)在PyroMark Q24仪器(Qiagen)上进行Pyro测序测定。根据制造商的建议,对生物素化单链DNA进行纯化和后续处理。使用PyroMark Q24软件(Qiagen)分析测序结果。
差异甲基化的统计分析
Partek Genomics Suite(Partek Inc.,密苏里州圣路易斯)用于差异甲基化的统计分析。首先,对GenomeStudio生成的归一化平均β值进行数据质量控制(QC)分析。其中包括主成分分析(PCA)(图S1A) ,并绘制信号分布的样本直方图(未显示数据)。对于实际的差异甲基化分析,进行了多变量方差分析,包括组织(肿瘤与正常)、性别(男性与女性)、病毒感染(HBV或HCV阳性与均阴性)、饮酒和扫描日期等因素,以评估这些因素对差异甲基化的贡献(图S1B) ●●●●。由于6向方差分析表明组织类型是差异甲基化的主要影响因素,因此我们通过对比合并的肿瘤样本与合并的正常人,对组织类型使用1向方差分析,以确定显著差异甲基化(DM)未调整p值截止值<1.03e-07的位点(对应于Bonferroni调整后的p值<0.05)。热图是使用Partek Genomics Suite创建的。通过平均链接计算两组样本(肿瘤和正常人)之间的欧几里得距离。
结果
甲基化分析
为了探讨肝癌中异常DNA甲基化的情况,我们使用甲基化450芯片分析了27例肝癌和20例邻近正常组织(19对匹配)。共使用五个芯片对三批47个样本进行分析,并在同一芯片上分析肿瘤-正常样本对,以最大限度地减少实验变化。在使用内部控制和背景减法对数据进行标准化后,对485577个基因座的β值进行主成分分析(PCA),以显示样本的甲基化信号按组织类型的聚类(在图S1A) ●●●●。结果显示肝癌和邻近正常人之间存在明显的整体甲基化模式。此外,肿瘤组的聚集性不如正常组紧密,这表明HCC中的甲基化谱存在一些异质性。接下来,我们对组织类型(HCC或邻近正常组织)、年龄、性别、酒精、病毒状态和扫描日期作为变量进行了6向方差分析,以评估甲基化分析中的变异来源。在485577个位点的全部数据中,这些变量中最显著的变异来源是组织类型,其他因素具有疏忽效应(图S1B) ●●●●。基于这些结果,采用组织类型的单因素方差分析进行最终分析。
肝癌的全球甲基化概况
13%的CpG位点(62692/485577)在HCC和邻近正常组织之间观察到显著的DM位点(未经调整的p<1.03e-07)。在这些重要的DM基因座中,61058(97%)被低甲基化(),相比之下,1634个(3%)基因座是超甲基化的。我们进一步分析了高甲基化或低甲基化组中DM基因座的功能位置,认为CpG位点可以位于多个功能位置,因为一个基因座可以位于同一基因的多个转录变体或不同基因中(因此,高甲基化或低甲基化位点的总数和不同功能位置的位点总和在). 在1634个高甲基化DM基因座中,大多数(37%,有显著差异)定位于与TSS1500、TSS200、5′UTR和1标准外显子,其次是基因体和基因间区,分别为32%和29%(). 相反,低甲基化DM基因座(61058)大多位于基因间区(43%)和基因体(33%),而不太可能位于启动子区(21%)(). 对高甲基化位点的另一个有趣观察是,它们往往位于多个功能位置。1634个高甲基化基因组位点位于3000个可能的功能位点上,每个基因组位点平均有1.84个功能位点。低甲基化基因座的功能/基因组基因座比率仅为1.03。
全基因组甲基化450珠芯片DNA甲基化图谱。
A.左侧:485577个CpG基因座之间的显著差异甲基化(DM),截止值为Bonferroni调整的p值<0.05(红色)具有统计显著性(蓝色;p值>0.05)。A.右侧:在62692个DM CpG基因座中,低甲基化(亚甲基化,蓝色)和高甲基化(高甲基化,红色)基因座的百分比。B。1634个高甲基化位点的功能定位及其在启动子区的亚定位,包括TSS1500、TSS200或第一外显子和5′UTR。C、。61058个低甲基化位点的功能定位及其在启动子区的亚定位。
为了了解观察到的DM分布如何依赖于DNA甲基化的基本正常模式,我们分别对肝癌和邻近正常组织中的DNA甲基化模式进行了表征(图S2). 通过无监督的层次聚类生成了一个显示62692个DM基因座甲基化水平的热图(图S2A) 62692个DM基因座的甲基化事件通过功能定位(启动子、体、3′UTR或基因间)进一步表征(图S2B) ●●●●。当查看所有DM基因座(热图)或功能性DM基因座时,除启动子CpG岛外,正常组织DM基因座的甲基化水平始终高于肿瘤,这导致肿瘤中97%的DM基因座出现明显的普遍低甲基化。
启动子CpG岛及其周围地区的一般甲基化模式
10775个DM基因座位于CpG岛及其周边地区。已发现启动子以及邻近区域中的CpG岛,如海岸(启动子CpG岛屿的0–2kb)和陆架(启动子PpG岛的2–4kb)在癌症和干细胞中存在不同的甲基化[7],[16],[17]虽然本研究中发现的大多数DM基因座位于公海,但有趣的是,差异甲基化发生在海岸的频率是启动子的两倍(1952或18%,而982或9%)(). 每个启动子CpG岛及其周围区域的实际甲基化水平由相邻正常簇中的分支长度通常比HCC簇中的支长度短,这表明肿瘤组织中甲基化水平的异质性更强,证实了PCA的发现。肝癌组织中启动子CpG岛内的低甲基化和高甲基化事件数量相似(分别为45%和55%),但在海岸(8%的DM事件)、大陆架(1%)和公海(7%)观察到的高甲基化明显较少;低甲基化是这些区域的主要事件。
10775个启动子区DM基因座的DMRs甲基化谱及其与CpG岛的关系。
A。DM基因座在CpG岛及其周边海岸(启动子CpG岛屿0–2kb)、陆架(启动子PpG岛2–4kb)和外海(启动子中的其他区域)DM区域的分布。B。肝癌中已知差异甲基化区域(DMR)、重编程特异性DMR(rDMRs)、癌症特异性DMRs(cDMR)和潜在新DMRs的DM位点分布。C、。在47个样本(列)中,对702个架子、1952个海岸、982个CpG岛和7139个公海位点(行)的β值进行无监督分层聚类。地图顶部的蓝色和红色区块分别代表20个相邻的正常组织和27个肝癌组织,而位点的红色代表高甲基化和蓝色低甲基化。
增强子和已知及新的DM位点的甲基化模式
在10775个启动子相关的DM基因座中,4%(460个基因座)位于结肠癌中已知的DMR、rDMR和cDMR中[7]。其余10315个DM位点位于4106个基因中,平均每个基因2.5个DM位点,是新发现的,可能是肝癌特异性的(和表S1). 这些肝癌相关的DM基因座由可能在肝癌中具有重要生物学功能的基因所包涵。我们对4106个基因的IPA分析显示,参与“细胞间信号传递和细胞死亡”的基因显著富集(p=1.0e-27)。最经典的途径包括“G蛋白偶联受体信号传导基因”(166个基因)、“cAMP介导的信号传导”(70个基因)和“介导免疫细胞之间通讯的细胞因子”(25个基因)。肝毒性的最高功能包括“肝炎”(31个基因)、“肝胆汁淤积”(11个基因),“肝损伤”(2个基因)和“肝坏死/细胞死亡”(4个基因)以及“肝硬化”(33个基因)(表S2).
由于对肝癌启动子区表观遗传调控所涉及的基因组区域的大小和内容的了解仍然有限,我们接下来重点研究10775个启动子相关DM基因座的亚定位甲基化水平,包括已知的DMR、cDMR、rDMR、,以及由启动子CpG岛、海岸、陆棚和增强子分层的潜在新DMR位点,但不包括公海中的位点。基因组区域进一步分为N_shelf(CpG岛上游2-4kb)、N_shorse(CpG-岛上游0-2kb),CpG岛屿、S_shorse(PpG-岛屿下游0-2kb的)和S_helf(PpG岛下游2-4KB的)。该分析分别在邻近的正常组织和肿瘤组织中进行(和表S3). 使用每个区域内DM基因座合并样本的平均β值检查甲基化水平。如中所示在邻近的正常组织中,对于所有已知的cDMR(9.2倍)、rDMR(4.9倍)和潜在的新HCC DMR位点(2倍),甚至对于增强子内的DM位点(1.3倍),在海岸观察到的DM位点密度(数量)高于启动子CpG岛,但对于148个普通DMR则没有。cDMR、rDMR和增强子的CpG岛的平均甲基化水平(β值)大约只有海岸基因座水平的一半(). 相反,在肝癌组织中,CpG岛、海岸和陆架的甲基化水平相似,尽管CpG岛屿的平均甲基化水平似乎略高于周围地区().
启动子甲基化水平的分布。显示了10775个启动子DM基因座(不包括外海)的基因组环境A。法线和B。肝癌肿瘤中。示例性方框图通过方框中的一条线显示了中值,其中包括第25百分位、第75百分位和Beta值的范围。异常值显示为范围标记上方或下方延伸的黄色圆点。每个基因组区域上的功能位点密度显示在图的顶部。贝塔值的平均值显示在每个方框图上*先前已知的DMR、cDMR、rDMR、增强子。
Promoter CpG岛的DM基因座
为了进一步研究差异甲基化的可能生物学意义,我们重点研究了982个启动子DM位点(437个低甲基化和545个高甲基化)的子集,这些位点位于启动子内的CpG岛上。肝癌和邻近正常组织982个位点的平均Beta和Delta-Beta值如所示表S4在这些位点中,80%(348/437)的低甲基化位点和91%(494/545)的高甲基化位点的Delta-beta值≥|0.2|,这意味着肿瘤和正常组织之间的甲基化差异大于或等于20%。Methylation450 BeadChip可以可靠地检测到0.2的Delta-beta值,假阳性率低于1%(http://www.illumina.com网站),对具有中等Delta-beta值的调查结果也有信心。
437个低甲基化和545个高甲基化启动子基因座分别与211个和279个基因共定位(表S4). 按最大Delta-beta值排列的DM基因座位于,表示每个位点对应的基因、甲基化450 BeadChip提供的TargetID、基因组位置(GRCh37/hg19)、功能位置、Delta-beta值和Bonferroni调整的p值。基因C15或60,DCAF4L2型,GAB4型,OR2B11型,ACP1型,SH3YL1型、和C2CD4D型被多个轨迹覆盖。此外,TargetIDs cg06792448、cg10749741、cg25945732、cg03468349和cg02339682定位于多个基因。在前20个高甲基化位点中,TSS内的位点频率较高(TSS1500或TSS200,20个位点中有12个(60%))。相反,在前20个低甲基化位点中,20个位点中只有6个(30%)位于TSS200内。有趣的是,在前20个超甲基化位点中,有三个(基因RIMS2公司,MYADM公司,和ZNF397操作系统)在已知的DMR中(地铁7号线,LPAR2,福克斯3、和SNX31系列)位于增强子区域。T1L令吉(调整后的p=6.9e-14)和福克斯3(调整后p=9.0e-10)分别是肝癌组织和邻近正常组织中最显著的低甲基化和高甲基化基因,而NFATC1(Delta-beta−0.6)和边缘2(Delta-beta 0.55)显示,两组之间的甲基化水平差异最大,分别是低甲基化基因和高甲基化基因。总的来说,肝癌组织和正常组织之间的差异甲基化具有高度的个体间一致性。在前20个糖尿病基因座中,随机选择的5个低甲基化和高甲基化基因座的β值显示在点图显示,除少数异常样本外,所有患者HCC和邻近正常组织中这些基因座的甲基化差异一致。
基于肿瘤的δ-β值(n=27,红色)与相邻正常对照(n=20,蓝色),20个顶部中5个低甲基化和高甲基化基因座的β值点图。每个点代表个人的Beta值。每个位点和组织类型的中位β值由图中每个盒子和胡须内的一条线表示。成对样本通过一条线连接。
表2
基于Delta-beta值的肝癌中前20个低甲基化和高甲基化位点。
肝癌中20个前20个基因座的低甲基化 | 肝癌前20位基因座的高甲基化 |
基因 | 目标ID | 基因组位置(GSCh37/hg19) | 功能位置 | Delta-beta值 | P值一
| 基因 | 目标ID | 基因组位置(GSCh37/hg19) | 功能位置 | Delta-beta值 | P值一
|
NFATC1
| cg02714192号 | 1972年8月7日 | 5英尺UTR | −0.60 | 4.8E-06段 |
RIMS2公司
| cg01566592号 | 色谱号:8:104512858 | TSS200型 | 0.55 | 3.6E-08年 |
HRNBP3型
| cg14715697号 | 第17章:77127487 | 5英尺UTR | −0.59 | 2.3E-12号机组 |
C2CD4D型
| cg08703872号 | 第151812435页 | 5英尺UTR | 0.54 | 第2.5页至第05页 |
C15或60
| cg17366808号 | 第15:73735476页 | 5英尺UTR | −0.57 | 1.0E-11号机组 |
ACP1、SH3YL1
| 计算20749741 | 第2章:264178 | TSS1500、TSS200 | 0.53 | 2.0E-05年 |
DCAF4L2型
| cg02310286号 | 合同编号:88886432 | TSS200型 | −0.56 | 1.7E-10号机组 |
福克斯3c(c)
| cg19809499号 | 第147882265页 | 第一外显子 | 0.51 | 9.0E-10年 |
DCAF4L2型
| cg11498870 | 邮政编码:8:88886243 | 5′UTR,第一外显子 | −0.54 | 4.2电子-10 |
FZD7型
| cg23246885号 | 第202899877页 | 第一外显子 | 0.51 | 3.4E-08年 |
FTMT公司
| cg21588562号 | 章5:121187589 | TSS200型 | −0.53 | 6.9E-12段 |
ZNF397操作系统b条
| cg16657538号 | 查尔18:32847566 | 5英尺UTR | 0.51 | 1.6E-08年 |
C15或60
| 计算10480461 | 第15:73735509章 | TSS200型 | −0.52 | 2008年7月7日 |
ACP1、SH3YL1
| cg25945732号 | 第2章:264204 | TSS1500、TSS200 | 0.50 | 1.0E-05年 |
3月1日
| cg13078134号 | 第4章:165109478 | 5英尺UTR | −0.51 | 1.9E-08年 |
RNF135号机组
| cg13204512号 | 第17章29298184 | 第一外显子 | 0.49 | 2008年2月2日 |
DCAF4L2型
| cg21181391号 | 合同编号:88886411 | TSS200型 | −0.50 | 1.5E-14号机组 |
C2CD4D型
| cg24425838号 | 第151812421页 | 5英尺 | 0.49 | 3.2E-05年 |
ARHGAP8号机组
| cg26523649 | 第22:45182193页 | 5英尺UTR | −0.47 | 5.3E-05号机组 |
弯曲6
| cg05022673号 | 章6:56819429 | 1500坦桑尼亚先令 | 0.48 | 1.7E-09年 |
T1L令吉
| cg19740859号 | 第2章:193641 | 5英尺UTR | −0.46 | 6.9E-14号机组 |
LPAR2号机组c(c)
| cg19306047号 | 第19章19739407 | 1500坦桑尼亚先令 | 0.47 | 1.7E-03(电子版) |
DLGAP1
| cg26598649 | 查尔18:3880086 | 5′UTR,第一外显子 | −0.46 | 1.1E-05 |
中期报告7c(c)
| cg12296772号 | 色谱图8:17271067 | TSS200型 | 0.47 | 1.9E-09年 |
GAB4型
| cg02432860号 | 第22:17489187页 | TSS200型 | −0.46 | 1.2E-05 |
骨形态发生蛋白8A
| 计算10523966 | 色谱:39957535 | 1500坦桑尼亚先令 | 0.47 | 7.2E-04日 |
GAB4型
| cg05945275号 | 第22:17489130页 | TSS200型 | −0.45 | 5.1E-06段 |
SNX31系列c(c)
| cg26440289号 | 色谱号:8:101661921 | TSS200型 | 0.46 | 1.7E-05年 |
OR2B11型
| cg05777962号 | 色谱号:247614860 | 第一外显子 | −0.45 | 3.7E-11号机组 |
ST8SIA3型
| cg13096208号 | 章18:55019843 | 5′UTR,第一外显子 | 0.46 | 4.2E-05年 |
PMEPA1项目
| cg26681770号 | 时间20:56247302 | 5英尺UTR | −0.45 | 5.0E-03年5月 |
骨形态发生蛋白4
| cg08162372号 | 第14:54422925页 | TSS200型 | 0.46 | 7.2E-04日 |
ZBTB46型
| cg01548777号 | 时间20:62433998 | 5英尺UTR | −0.44 | 3.4E-05 |
ZNF154号
| cg21790626号 | 第19:58220494页 | 5′UTR,第一外显子 | 0.45 | 2014年4月14日 |
OR2B11型
| cg14422922号 | 第147614727页 | 第一外显子 | −0.44 | 3.1E-10段 |
ACP1、SH3YL1
| cg03468349号 | 第2章:264164 | TSS1500、TSS200 | 0.45 | 5.6E-05年 |
GML公司
| cg01972576号 | 章8:143916273 | 5′UTR,第一外显子 | −0.44 | 4.0E-10型 |
MYADM公司b条
| cg03585419号 | 时间19:54369681 | TSS1500、TSS200 | 0.45 | 2.4至05 |
RTL1、mir-136、mir-432
| cg06792448号 | 第14章101349632 | 第一外显子 | −0.44 | 3.7E-03型 |
弯管6,DST
| cg02339682 | 章6:56819432 | TSS1500、TSS200 | 0.45 | 1.1E-08年 |
为了探索982个启动子DM位点的生物学意义,我们使用IPA对相关基因进行了表征(). 二十六个基因,包括骨形态发生蛋白4,CDKN2A型和GSTP1标准参与与“细胞发育、基因表达和细胞死亡”相关的顶级IPA网络(p=1.0e-38)。此外,发现15个基因参与“细胞运动、细胞周期、细胞妥协和细胞介导的免疫反应”(p=1.0e-17),另外15个基因在“细胞发育、细胞功能和维持”(p=1.0e-17)中被鉴定,所有这些都被认为是IPA的顶级网络。细胞周期、增殖和癌症相关基因也得到了鉴定().
表3
启动子CpG岛上含有982个差异甲基化(DM)位点的基因的10个IPA网络的生物学功能。
网络中的分子 | 分数 | 聚焦分子 | 顶级功能 |
1
| 阿克特,弧,BMP4、CDKN2A,CTBP2号机组,CYP24A1、DRD2、E2f、ERK、,FOXD3系列,FTH1(飞行时间1),GFI1、GNA11、GSTP1,H19型、Hdac、,HIST1H3A公司,HIST1H4A公司、组蛋白3、,HMGA1、OXA11,ICAM1公司,IRS1公司,日本,MGAT3公司,MT1F型,第一个多年电价,NFATC1、NFkB、,PAK1、PI3K、RNA聚合酶II、,运行NX3,TCL1A公司,TRPC3号机组
| 38 | 26 | 细胞发育、基因表达、细胞死亡 |
2
| ABCB1,ACP1、ADRB1、AKAP5、CDH1、CLDN7、,COTL1号机组、CXCL2、,CYB5R2年、DKK1、DNMT3A、,DNMT3B,DUOX1型、EED、,ELF4级、EPHA2、EZH2、FCGR2A、FOSL1、IL8、,IQSEC1公司,6月,81韩元,LPAR2号机组,MC5R(最大持续功率),第一个多年电价,NETO2公司、Pkc(s)、RAP1B、,销售人员3,SDK1系列,SF3B14钢、SMARCA4、SYK、Tgfβ | 17 | 15 | 细胞运动、细胞周期、细胞损伤 |
三
|
AKR1B1型、ANXA2、AR、AZGP1、CEBPB、,DST、FOXG1、FOXO3、,FRG1系列、GADD45B、HAS1、IL1B、,ITGB4,KCNQ1号机组、KLF4、,图4,LRFN4、LRRK1,mir-1型,NEDD4L、PFKP、PGR、,PMEPA1项目、PRKDC、,PTGS2、RPS19、SCNN1A、,SFMBT2型,SLC22A16型、TAL1、TRAF6、TREM1、UGCG、XRCC4、XRCC6 | 17 | 15 | 细胞介导的免疫反应、细胞发育、细胞功能和维持 |
4
| 26s蛋白酶体,BIRC5,半胱氨酸蛋白酶3/7,CHST2型、CXCL1、CXCL2、Disheveled、,DSC3、FZD1、GNB4,35加仑,Hsp90,不确定因素1、Igm、IL13、免疫球蛋白、JAK1、,JAKMIP1号机组,mir-154型,p70 S6k,PDPN(PDPN)、Pka、PML、RPS6、,SARM1系列,SCO2公司,SMPD3公司,SOCS5系列、STAT6、TICAM1、TNF、TNFSF11、,TRPS1型、TYK2、VCL | 15 | 14 | 细胞死亡、细胞发育、造血 |
5
| AGTR1,ATP2B4型、AURKA、半胱氨酸天冬氨酸蛋白酶、CBY1、CCND1、,CDKN2A型,CTNNB1,细胞周期蛋白A,DDX20,E2F8型,尾端1,雌激素受体,FZD7型、GEMIN2、GEMIN4、Hdac、,hist2hbe、HMGA1、LDHB、NCOA1、NRG1、,PABPC3、PCDH11X/PCDH11Y、PPP3CA、,PRDM2、RASSF1、SMN1/SMN2、SNRPD1、SNRP D2、,SNRPF公司、SOX2、,TSC22D1次、TUB2A、,YWHAE公司
| 15 | 14 | 细胞周期,细胞组装和组织,RNA转录后修饰 |
6
| ABCB1,AFAP1公司、APH1A、,亚太H1B,ASCL2、BMP4、Calpain、CDK7、,CDKN2A型、CTSD、DDIT4、,
DLGAP1,EBF1(EBF1)、ESR1、ITGB1、,MAGEB1(刀库1)、mir-21、mir-145、mir-21/mir-590-5p、MLL2、,MREG公司,NEK2公司,槽口1,PDE6B型、PML、PRDM5、PSEN2、Ras、RBBP5、SNAI2、,TMOD1(TMOD1)、TP53、TRIM28、TSG101、,ZNF274型
| 14 | 13 | 细胞死亡、细胞发育、骨骼和肌肉系统发育和功能 |
7
| ACTA2、ANXA2、ARHGAP1、ATP2A2、,骨形态发生蛋白4、BMP6、BMPR1A、,CCNJ公司、CREM、DHCR7、,DLX5(DLX5),ERK1/2,全球导航卫星系统、GNB1、GPR56、hCG、IgG、ILK、,吉尔吉斯斯坦共和国18、Lh、MED1、,净现值3、P38 MAPK、PMAIP1、PTPase、PTPN1、,RAB31型,RANBP1公司,RAP1B,RGS20、SRD5A2、STAR、,TACSTD2系统,TRIM29阀内件
| 12 | 12 | 内分泌系统发育与功能,小分子生物化学,脂质代谢 |
8
| BCL2L11、CALML3、,CBFA2T3型、CCND2、CCND3、CDK2、CDKN1B、CHI3L1、,第16A1列,DLL4,EFNB2、FSCN1、FZD8,GLTSCR2号机组、IGFBP5、,IRS1系统、套件、MMP3、,2010年10月PRKCA NOTCH1,PSMA1型,私人,PTPRN2型,SERPINE1、SMAD2、SNAI1、SNAI2、SPDEF,SPDIA、SPINT2、TGFB1、Vegf、VEGFA、VIM | 12 | 12 | 细胞运动、细胞生长和增殖、癌症 |
9
| ABL1、,ANK1型,骨形态发生蛋白4、CEBPD、DDIT4、,FKBP4型、GADD45B、GNAI2、,通用处理器X1,HNF4A,IGFBP1,IRF4、,MIXL1、MTHFD2、NANOG、NR3C1、,ONECUT1,OTX1、POU5F1、PPARD、,PRKAR1B公司、PTGES3、RARG、,第17页、RORA、RORC、,SCT公司、Smad2/3、SOX2、SP1、TCF7、TRIB3、VIM、YY1、,ZNF148型
| 12 | 12 | 细胞发育、基因表达、组织发育 |
10
| ACO1、ADORA2A、,APBB2型、应用程序、,ARHGAP8/PRR5-ARHGAP第8页,CELSR1级、FUT1、IFNG、,IGFBP7型,INSR、IRF7、JAK1、MAPK1、MAPK14、,移动10L1,第2RX7页,PAK1,PDE3B型、PIM1、PMAIP1、PML、RAC1、Ras、,RTN1型,第1节、SELE、SOD2、SPHK1、TCR、,三角波,UCP2、UGCG、VCL、VDR、ZAP70 | 12 | 12 | 自由基清除,细胞运动,细胞死亡 |
有趣的是,我们在一个已知的印迹基因中发现两个相邻的CpG岛之间一致的相反甲基化模式(全球导航卫星系统,鸟嘌呤核苷酸结合蛋白,α刺激)。该基因中有两个独立的CpG岛,5个低甲基化基因座位于CpG岛1(chr20:57428473–57429858),3个高甲基化基因座位于CpG岛2(chr20:57465695–57465691)(图S3)在我们的HCC样本中。
通过焦测序验证DM基因座
使用焦磷酸测序法,选择了甲基化450珠芯片鉴定的8个DM基因座进行验证。四个基因包含的五个高甲基化位点(GSTP1标准,TACSTD2系统,骨形态发生蛋白4和RASSF1系统)三个基因中的三个低甲基化位点(ARHGAP8号机组,35加仑和DLGAP1型)使用本研究中12对肿瘤正常组织进行的7次检测进行验证。验证了两个DM基因座GSTP1标准通过预先设计的焦磷酸测序分析。由于GC含量高,在设计甲基化位点分析时存在局限性,因此预先设计的分析并不总是适用于分析与甲基化450 BeadChip评估的完全相同的位点。尽管如此,由于在基因中观察到多个具有显著p值的基因座,我们选择了与感兴趣的DM基因座距离最近的分析,以关联Pyrosequencing和Methylation450 BeadChip之间的甲基化结果。如果检测未覆盖感兴趣的位点,则使用焦磷酸测序分析的CpG位点的平均甲基化值进行相关性分析。使用了Qiagen预先设计的五种分析方法和其他组之前使用的两种分析方法。每个分析的基因组区域的详细信息、通过焦磷酸测序分析的CpG位点的数量以及珠芯片上特定基因甲基化显著差异但无法进行技术验证的位点如所示表S5对于其中的5个基因,在两个完全匹配的CpG位点的Pyrosequencing和Methylation450 BeadChip结果之间发现了0.86到0.99的高度相关性(GSTP1标准,RASSF1系统和骨形态发生蛋白4)和最近的CpG站点(DLGAP1和35加仑) (,近端验证位点)。骨形态发生蛋白4显示了焦磷酸测序和甲基化450珠片之间的最高一致性(r=0.99)。我们还观察到,当焦磷酸测序分析的位点远离甲基化450珠芯片发现的DM位点时(约0.9kbTACSTD2系统,31 kbARHGAP8号机组),甲基化状态没有很好的相关性,表明位置特异性(,远程验证基因座)。
通过焦磷酸测序对8个DM基因座的验证结果。给出了基因名称、Illumina的目标ID(位点)和相关系数(r)。每个单独HCC(红色)和正常(蓝色)样本的β值用圆点表示。x轴和y轴分别表示甲基化450珠片分析的β值和焦平测序的甲基化水平。
讨论
在包括肝癌在内的许多恶性肿瘤中,DNA甲基化异常在肿瘤发生和癌症进展中起着重要作用[18],[19]以前的一项研究主要关注肝癌中几个特定的抑癌基因和癌基因位点的DNA甲基化谱,发现9个癌相关基因的启动子甲基化发生了变化,包括SOCS-1系统,全球服务贸易伙伴关系,空气污染指数,E-钙粘蛋白,RAR-贝塔,第14页,第15页,第16页(CDKN2A)、和第73页
[19]利用微阵列进行DNA甲基化分析的新技术现在为在基因组尺度上研究甲基化提供了巨大的机会。这种方法可以提高我们对表观遗传机制以及DNA甲基化对疾病相关分子网络和通路的影响的理解,而不仅仅是单个基因。
在这项研究中,我们测量了99%RefSeq基因485577个位点的DNA甲基化水平,包括27例肝癌组织和20例邻近正常人中96%的已知CpG岛。在Bonferroni校正后,我们发现62692个基因座的甲基化水平存在显著差异,其中97%(61058个基因座)为低甲基化,表现为普遍(或“全球”)低甲基化。众所周知,异常的全基因组低甲基化与肿瘤发生有关,我们的发现与这一概念相一致。先前的研究也显示肝癌组织中全基因组5′-甲基胞嘧啶含量较低[20]肝癌患者血液中LINE-1低甲基化[21]此外,我们发现基因间区域和基因体(而不是启动子)的低甲基化事件过度富集,这与之前的结肠癌全基因组研究的结果相似[7].
尽管最近发表了几项关于HCC的全基因组甲基化研究[15],[22],[23]这些研究使用了Illumina HumanMethylation27 BeadChip,该芯片包含的CpG基因座数量远低于我们在本研究中使用的Methylation 450 BeadChip。Shen等人最近的一项研究发现,62例台湾HCC患者(大多为HBV阳性)2324个CpG基因座(代表548个高甲基化基因和1290个低甲基化基因)的甲基化与邻近正常组织相比存在显著差异[15]在他们名单上排名前20位的基因中,有14个超甲基化基因(DAB2IP(数字音频广播),骨形态发生蛋白4,CDKN2A型,TSPYL5型,CDKL2型,ZNF154号,ZNF540型,CCDC37公司,NKX6-2型,FOXD2系列,HIST1H3E公司,LYPD3年,DNM3(DNM3)和RASSF1系统)和18个低甲基化基因(CCL20型,AKT3型,SCGB1D1标准,WFDC6型,PAX4型,GCET2测试,CD300E型,CD1B型,MNDA公司,CD1E公司,塞浦路斯11B1,KRTAP13-1型,KLK9公司,KPNA-1型,SPRR1B型,SPRR1A公司,中央控制室6和OR51B4型)在我们的研究中也发现了DM基因座。此外,Ammerpohl等人还鉴定了上述高甲基化基因中的14个。[22]由于甲基化450 BeadChip比早期版本的BeadChip覆盖更多的CpG位点,我们分析的位点大约是之前研究的16倍,并且每个基因都被更多的Cp位点覆盖(表S6). 在我们排名靠前的20个启动子内的低甲基化位点和20个高甲基化位点中(),两个高甲基化基因(FTMT公司和格林威治标准时间)和六个低甲基化基因(福克斯3,sh3基,RNF135号机组,BMP4、ZNF154和MYADM公司)Shen等人也发现了。[15]。与Illumina HumanMethylation27 BeadChip发现的1490个DM基因座的总数相比,我们使用HumanMethilation450 BeadChips鉴定了62692个DM基因位点。就地理位置而言,我们的数据与Ammerpohl等人之前的研究一致,分别为49%(735/1490)、46%(685/1490和57%(852/1490)。[22],Hernandez-Vargas等人。[23]和Shen等人。[15]分别为。重叠位点在甲基化变化方向上100%一致(数据未显示)。
先前的研究报告了HCC和正常组织之间具有统计学意义的DM基因座,但没有扩大分析范围,以便更深入地研究DM基因组位置的结构。然而,目前对不同基因组亚区(即启动子CpG岛、海岸、搁板和增强子)之间甲基化变化的意义知之甚少。Irizarry等人最近对结肠癌进行了全基因组甲基化研究,令人惊讶的是,在海岸观察到的甲基化改变事件是启动子CpG岛的13倍[7].
在本研究中,我们观察到肝癌和邻近正常组织中启动子区的差异启动子甲基化水平,包括TSS1500、TSS200、5′UTR和1标准根据目前的假设,外显子位点的甲基化可以直接调节基因表达。虽然启动子CpG岛中的DM基因座数量在低甲基化(45%)和高甲基化(55%)方面非常相似,但与相邻正常组织相比,肝癌的海岸(8%的DM事件)和货架(1%)中发现的高甲基化事件明显较少。这表明大多数启动子区超甲基化事件发生在肝癌的启动子CpG岛。适当地,从甲基化水平来看,正常组织的启动子CpG岛的甲基化水平低于海岸和大陆架。相反,启动子CpG岛甲基化水平高于肿瘤组织中海岸和货架的水平。在本研究中发现的10315个启动子相关的DM基因座中,那些不属于已知DMR的基因座可能是肝癌的新DMR基因座。对于所有已知的rDMRs、cDMRs,以及增强子内的DM基因座和潜在的新DMR基因座,海岸中的DM基因座(大多是低甲基化的)数量高于启动子CpG岛,这与Irizarry在海岸而不是启动子CpG岛富集结肠癌DM事件的发现相似[7].
在发育和致癌过程中,每个CpG位点的甲基化都是以区域特定的方式建立的,一些区域保持非甲基化,而另一些区域则变得高甲基化[24]同样,我们观察到大多数共定位基因启动子CpG岛内CpG位点的区域一致甲基化模式(数据未显示)。有趣的是,我们发现了一个基因(全球导航卫星系统)在两个不同的启动子CpG岛上有不同的甲基化模式。次甲基化CpG岛位于全球导航卫星系统反义RNA(全球导航卫星系统AS1)这表明印迹过程可能受到这些不同的甲基化模式的调节[25],[26].
为了评估HCC肿瘤中异常甲基化的可能生物学意义,我们使用IPA来确定可能被受影响基因的差异甲基化所干扰的途径和细胞过程。我们发现,本研究中观察到的甲基化变化可能与“细胞发育、基因表达和细胞死亡”的信号网络有关(p=1.0e-38)。这些网络包括骨形态发生蛋白4
[27],CDKN2A型
[28]和GSTP1标准
[29],这些基因以前在肝癌中已经被很好地研究过。我们的IPA分析也显示了与“细胞周期、增殖和癌症”相关的基因。启动子CpG岛上的甲基化已被证明与基因表达直接相关[10],[30]我们对7个带有启动子DM位点的基因进行了初步表达分析,并试图通过焦磷酸测序进行验证,结果显示,在16个配对样本中,启动子甲基化与表达水平之间至少存在部分相关性(数据未显示)。在HCC中具有推测的高甲基化启动子基因座的16对肿瘤-正常配对中(在基因中BMP4、RASSF1、GSTP1、和TACSTD2系统)16例HCC中,5例、6例、14例和16例分别降低了该基因的表达。在具有假定的低甲基化启动子位点的配对中(在ARHGAP8、GPR35和DLGAP1)16例肝癌中,10例、11例和12例分别表达增加。这些结果反映了表观遗传调控的复杂性,因为即使这些特定基因的差异甲基化模式在肿瘤和正常人之间也是一致的(参见5个基因);甲基化与表达模式并不总是直接相关。
直到最近,甲基化变化在TSS和CpG岛之外的重要性,例如在其他基因区域,如基因体中,一直被忽视,即使在这些区域观察到动态甲基化模式[31]由于我们拥有来自甲基化450珠芯片的丰富数据,该芯片可以在全基因组范围内同时分析480000多个基因座,因此我们拥有肝癌中CpG岛、TSS、基因体等甲基化的详细信息。然而,肝癌组织成分的可能异质性和肝癌的各种风险因素可能对甲基化有重大影响。因此,评估HCC不同危险因素(如HBV和HCV感染)分层的甲基化变化非常重要。为了更全面地了解HCC甲基化特征,我们未来的分析将包括HCC的特定风险因素,如病毒感染、饮酒习惯、疾病分期、组织学以及肝硬化与非肝硬化周围组织的存在。我们还旨在将DM发现与当前教条以外的基因表达相关联,即包括不在启动子CpG岛上的DM位点。
总之,这是我们所知的第一份将甲基化450珠芯片应用于肝癌评估全基因组甲基化的报告。我们目前的分析侧重于基因组不同区域的差异甲基化模式,特别是在基因启动子或其附近。我们的主要观察结果是:(1)在肝癌中观察到普遍或“整体”低甲基化,集中在基因间区域和基因体;(2) 发现10315个潜在的肝癌新DMR基因座,其在启动子海岸的密度高于CpG岛;(3) 启动子CpG岛的高甲基化事件频率高于海岸和陆架;(4) 启动子CpG岛DM基因座在“细胞发育、基因表达、细胞死亡和癌症”基因网络中的富集。我们对肝癌全基因组图谱的研究结果可能有助于确定肝癌中异常DNA甲基化的情况,并为观察启动子CpG岛和其他相关基因调控区的甲基化改变提供更深入的信息。了解HCC的表观遗传变化将有助于阐明其发病机制,并最终可能导致识别用于疾病诊断、治疗和预后的分子标记物。