Elucidating the Landscape of Aberrant DNA Methylation in Hepatocellular Carcinoma

Min-Ae Song; Maarit Tiirikainen; Sandi Kwee; Gordon Okimoto; Herbert Yu; Linda L. Wong

doi:10.1371/journal.pone.0055761

公共科学图书馆一号。2013; 8（2）：e55761。

2013年2月20日在线发布。数字对象标识：10.1371/日记本.0055761

PMCID公司：项目经理3577824

PMID：23437062

阐明肝细胞癌中DNA甲基化异常的情况

民歌,^1,² Maarit Tiirikainen公司,^1,² 桑迪奎,^三,⁵ 冈本高登,⁴ 于赫伯特（Herbert Yu）,⁴和琳达·L·王^三,^*

亚历杭德罗·科瓦兰，编辑器

作者信息文章注释版权和许可证信息 PMC免责声明

关联数据

补充资料: 图S1： 主成分分析（PCA）和变异源。 A。肝癌（红色）和辅助正常组织（蓝色）之间DNA甲基化数据的二维PCA。x轴，第一主分量（PC1）；y轴，第二主分量（PC2）。B。甲基化数据中不同变异来源的统计显著性由6向方差分析模型估计。每个因子（源）的F-比率表示因子的F-统计信息/误差（噪声）的F--统计信息。
（畅通节能法）
第0055761.s01.tif部分（110万）
GUID:F0233599-78E2-40F7-A1F5-6A58B1ED3AD1
图S2： 相邻正常组织和肝癌组织中DNA甲基化的特征。 A。通过无监督的层次聚类分析，显示了62692个DM基因座的β值（范围：0-1）。地图顶部的红色和蓝色块分别代表20个相邻的正常组织和27个肝癌组织。B。62692个DM基因座的功能分布显示了相邻正常组织和肝癌组织的β值（y轴）。方框图显示了平均甲基化结果，以及中间值（用方框中的一条线表示）、第25百分位、第75百分位和Beta值的范围。异常值显示为范围标记上方或下方延伸的黄色圆点。
（畅通节能法）
电话：0055761.s002.tif（93.9万）
制导：4BF14ABB-1CA4-47FA-B9FA-26CA728590DA
图S3： 糖尿病基因座的基因组定位 全球导航卫星系统 发起人。CpG岛1内五个低甲基化位点和CpG岛内三个高甲基化位点的基因组位置全球导航卫星系统启动子用平均贝塔值图表示。未调整和Bonferroni调整的p值显示在图的下半部分的表格中。
（畅通节能法）
第0055761.s03.tif部分（170万）
GUID:CFE967BC-8481-44B0-B0D3-B1A91695777E
表S1： 肝癌中潜在的10315个DM基因座。
（XLS）
电话：0055761.s004.xls（170万）
GUID:9A1A815B-7F8C-40A0-B6B5-5B64FF0C4BAF
表S2： 肝癌中潜在10315个DM位点的顶级典型途径。
（XLS）
电话：0055761.s005.xls（4.6万）
GUID:8C819ECD-2954-47DD-9BC0-375BE913E6EA
表S3： 10775个启动子DM位点的DMR、rDMR、cDMR、增强子和新DMR(没有公海基地).
（XLS）
电话：0055761.s006.xls（396000）
GUID:2F24009B-E894-4ED2-9411-843D3FA1584E
表S4： 肝癌中982个CpG岛DM启动子位点列表。
（XLS）
电话：0055761.s007.xls（225K）
制导：1478FCC6-C666-460F-9257-395BFA4FD498
表S5： 有关验证的CpG基因座和焦磷酸测序分析的信息。
（XLSX）
电话：0055761.s008.xlsx（16000）
GUID:F23AFC29-1014-4EFF-BEE8-0398130AB396
表S6： 与Shen等人共享CpG基因座。
（XLS）
电话：0055761.s009.xls（57K）
GUID:FAF24BC7-9ED6-40B1-93B1-F92999810B26

摘要

背景

肝细胞癌（HCC）是最常见的癌症之一，在诊断时常伴有晚期疾病。目前对肝癌基因组甲基化变化的了解有限。

方法和发现

我们使用Illumina HumanMethylation450 BeadChip对总共47个样本（包括27个肝癌和20个相邻的正常肝组织）进行了全基因组甲基化分析。我们重点研究了启动子CpG岛以及各种研究较少的基因组区域的差异甲基化模式，如CpG岛周围的区域，即海岸和大陆架。在研究的485577个基因座中，肝癌和邻近正常组织之间的差异甲基化（DM）显著，为62692个基因座或13%（p<1.03e-07）。其中，61058个位点（97%）发生了低甲基化，大多数位点位于基因间区域（43%）或基因体（33%）。我们的分析还发现10775个差异甲基化（DM）位点（62692个位点中的17%）位于基因启动子内或周围，其中4%位于已知的差异甲基化区域（DMR），包括重编程特异性DMR和癌症特异性DMRs，而其余的（10315）涉及4106个基因可能是潜在的肝癌DMR新基因座。有趣的是，与启动子相关的DM基因座在海岸的出现频率是实际CpG岛屿的两倍。我们进一步对启动子CpG岛上的982个DM基因座进行了特征分析，以评估其潜在的生物学功能，并发现甲基化变化可能会影响细胞发育、基因表达和细胞死亡的信号网络（p=1.0e-38）骨形态发生蛋白4,CDKN2A型,GSTP1标准、和NFATC1在基因列表的顶部。

结论

肝癌患者在全基因组水平上观察到DNA甲基化的实质性变化。了解HCC的表观遗传变化将有助于阐明其发病机制，并可能最终导致识别肝癌诊断、治疗和预后的分子标记物。

介绍

肝细胞癌（HCC）是世界上最常见、最致命的癌症之一。由于缺乏有效的治疗，该疾病对我们的社区造成了巨大的健康负担[1],[2]慢性乙型肝炎病毒（HBV）和丙型肝炎病毒（HCV）感染、酗酒、环境和职业毒素以及某些代谢和免疫紊乱是HCC的危险因素[3],[4].

正常肝细胞向恶性细胞的顺序性变化与反映累积遗传改变的基因表达改变有关，如染色体不稳定（CIN）和DNA重排，这些已被广泛研究[5]然而，肝癌的分子发病机制仍不清楚。胞嘧啶-鸟嘌呤二核苷酸（CpG位点）中碳5位（5 mC）的DNA胞嘧啶残基甲基化是真核生物DNA中常见的表观遗传机制，在基因活性调控中起着重要作用。在包括肝癌在内的许多人类癌症中观察到异常的DNA甲基化[6],[7],[8]，其中全局低甲基化和特异性启动子高甲基化已被发现分别是与基因组不稳定和肿瘤抑制基因沉默有关的典型表观遗传学变化[9],[10]此外，胞嘧啶甲基化的变化也可作为预测肿瘤进展的分子标记物[11]在HCC中，候选基因异常甲基化，如GSTP1标准,RASSF1A公司,空气污染指数和CDH-1型已使用甲基化特异性聚合酶链反应（MSP）、亚硫酸氢盐限制性联合分析（COBRA）和亚硫酸氢盐测序技术进行检测[12],[13],[14]然而，由于全基因组甲基化分析技术是最近才引进的，尽管癌症中有更多的基因和DNA序列可能发生异常甲基化，但大多数研究的范围都很有限，分析的重点是抑癌基因的高甲基化或癌基因的低甲基化或重复元素（如LINE1）的甲基化。最近，使用Illumina HumanMethylation27 BeadChip进行了肝癌全基因组DNA甲基化分析[14],[15]这两项研究确定了许多以前未知的区域和基因在肝癌中存在差异甲基化。然而，为了更好地了解肝癌发生过程中的异常甲基化，仍需要对DNA甲基化进行更高分辨率的全基因组分析。

在本研究中，我们使用最新版本的Illumina甲基化微阵列芯片HumanMethylation450 BeadChip（methylation 450 BeadChap）定量分析了27例肝癌样本和20例邻近正常组织中485000多个CpG位点。该分析使我们能够确认各种已知差异甲基化区域（DMR）中的差异甲基化，如重编程特异性DMR（rDMR）、癌症特异性DMRs（cDMR）[7]和配件(电子版以及寻找潜在的新HCC DM基因座。我们还确定了启动子CpG岛周围基因组区域的差异甲基化，如海岸和大陆架。

材料和方法

患者标本

该研究由夏威夷大学马诺分校人类研究委员会（机构审查委员会）审查和批准。所有参与研究的患者都出具了书面知情同意书。作为肝部分切除术或肝移植术的一部分，从患者身上切除肝组织，肝部分切除术或肝移植术由肝胆/肝移植外科医生（LW）对肝细胞癌进行。除了每个患者的临床指示外，没有进行其他操作。2009年至2011年间，所有手术均在夏威夷医疗中心进行。共获得27个肝癌组织和20个邻近正常（非恶性）组织，包括19对配对。对每位患者进行组织病理学评估，以确认组织中的肿瘤含量。相关的人口统计学和临床信息，包括患者年龄、HCC AJCC分期、性别、HBV和HCV感染状态以及饮酒情况，见表1.

表1

27例肝癌的临床和病理特征。

临床病理特征
总病例数	27
中位年龄（范围）	66 (52–88)
阶段
我	18 (67%)
二	3 (11%)
四、	1 (4%)
不适用	5 (18%)
性别
男性	20 (74%)
女性	7 (26%)
病毒状态
HBV阳性	9 (33%)
HCV阳性	10 (37%)
非HBV、非HCV	8 (30%)
频繁饮酒^*	5 (19%)

在单独的窗口中打开

^*一个人在10年或更长的时间里每天喝两杯以上。

DNA提取和亚硫酸氢盐转化

使用AllPrep DNA/RNA Mini试剂盒（加利福尼亚州巴伦西亚Qiagen Inc）从组织样本中提取DNA。提取的DNA的质量和数量由NanoDrop-2000（Thermo Scientific，Wilmington，DE）检测。根据制造商关于使用EZ DNA甲基化试剂盒（加利福尼亚州欧文市Zymo Research）的甲基化450珠芯片的建议，对每个样品进行500 ng DNA的亚硫酸氢盐转化。治疗方案包括16个周期，在95°C下变性30秒，在50°C下孵育60分钟，以及最后一个步骤，在4°C下保持。

甲基化分析

使用HumanMethylation450 BeadChip（Illumina，San Diego，CA）分析485577个基因座的全基因组DNA甲基化谱。这些位点覆盖了96%的已知CpG岛和99%的NCBI参考序列（RefSeq）基因，每个基因平均17个CpG位点分布在转录起始位点（TSS）1500、TSS200、5′非翻译区（UTR）、第一外显子、基因体和3′UTR的上游。基因组中485577个胞嘧啶位点包括482421个（99.35%）CpG二核苷酸、3091个（0.64%）CNG靶点和65个（0.01%）SNP位点。按照Illumina Infinium HD甲基化协议，使用4µl亚硫酸氢转化DNA杂交到甲基化450珠芯片上。这包括一个全基因组扩增步骤，然后是酶的终点裂解、沉淀和再悬浮。将重悬的样品在48°C下与珠芯片杂交16小时。杂交后，将未杂交和非特异性杂交的DNA洗掉，然后使用杂交的亚硫酸氢处理的DNA作为模板进行单核苷酸延伸。使用Illumina iScan SQ扫描仪创建单个阵列的图像，并使用GenomeStudio（v.2011.1）甲基化模块（v.1.9.0）软件提取图像的强度。

使用Genome Studio软件提供的“背景减法”和“内部控制标准化”方法对数据进行标准化。首先，从每个通道的内置阴性对照珠类型的信号中导出背景减法值，将背景水平设置为给定通道中阴性对照的5%百分位。然后从同一通道中的探针强度中减去背景。如果强度变为负值，则设置为0。其次，利用甲基化450珠芯片上的内部控制探针对进行归一化。标准化控制探针对（其中超过90个）设计用于定位家政基因中的同一区域，并且探针中没有潜在的CpG位点。对于归一化，将给定样本中的探针强度乘以恒定归一化因子（对于所有样本），再除以给定样本中探针通道中归一化控制的平均值。

每个CpG位点的甲基化得分由根据甲基化和非甲基化信号之间的标准化探针荧光强度比计算的β值表示。β值在0（完全非甲基化）和1（完全甲基化）之间变化。甲基化450珠片上的每个β值都伴随着一个检测p值，指示信号明显大于背景值，这些检测p值用于从数据中去除噪声。通过从合并的相邻正常组织中减去合并的HCC样本的平均beta值，计算表明HCC和相邻正常组织之间差异甲基化的平均Delta-beta值。

通过甲基化450 BeadChip分析发现的差异甲基化（DM）基因座子集（n=8）被选择用于Pyrosequencing验证。按照建议的方案，首先使用PyroMark PCR试剂盒（Qiagen）在感兴趣的区域通过PCR扩增亚硫酸氢盐处理的DNA。有关预先设计和自定义焦深测序分析的信息，请参阅表S5其中一个PCR引物被生物素化，以便在方案中稍后被链霉亲和素Sepharose捕获。使用PyroMark Gold Q24试剂（Qiagen）在PyroMark Q24仪器（Qiagen）上进行Pyro测序测定。根据制造商的建议，对生物素化单链DNA进行纯化和后续处理。使用PyroMark Q24软件（Qiagen）分析测序结果。

差异甲基化的统计分析

Partek Genomics Suite（Partek Inc.，密苏里州圣路易斯）用于差异甲基化的统计分析。首先，对GenomeStudio生成的归一化平均β值进行数据质量控制（QC）分析。其中包括主成分分析（PCA）(图S1A），并绘制信号分布的样本直方图（未显示数据）。对于实际的差异甲基化分析，进行了多变量方差分析，包括组织（肿瘤与正常）、性别（男性与女性）、病毒感染（HBV或HCV阳性与均阴性）、饮酒和扫描日期等因素，以评估这些因素对差异甲基化的贡献(图S1B） ●●●●。由于6向方差分析表明组织类型是差异甲基化的主要影响因素，因此我们通过对比合并的肿瘤样本与合并的正常人，对组织类型使用1向方差分析，以确定显著差异甲基化（DM）未调整p值截止值<1.03e-07的位点（对应于Bonferroni调整后的p值<0.05）。热图是使用Partek Genomics Suite创建的。通过平均链接计算两组样本（肿瘤和正常人）之间的欧几里得距离。

灵巧路径分析（IPA）

创新路径分析（IPA）计划(http://www.intenuity.com/index.html)用于识别与肝癌和肝功能相关的可能受影响的基因网络、功能类别和典型途径。IPA根据分数（-log（p-value））对基因网络进行排名，该分数考虑了焦点基因的数量和网络的大小。

结果

甲基化分析

为了探讨肝癌中异常DNA甲基化的情况，我们使用甲基化450芯片分析了27例肝癌和20例邻近正常组织（19对匹配）。共使用五个芯片对三批47个样本进行分析，并在同一芯片上分析肿瘤-正常样本对，以最大限度地减少实验变化。在使用内部控制和背景减法对数据进行标准化后，对485577个基因座的β值进行主成分分析（PCA），以显示样本的甲基化信号按组织类型的聚类（在图S1A） ●●●●。结果显示肝癌和邻近正常人之间存在明显的整体甲基化模式。此外，肿瘤组的聚集性不如正常组紧密，这表明HCC中的甲基化谱存在一些异质性。接下来，我们对组织类型（HCC或邻近正常组织）、年龄、性别、酒精、病毒状态和扫描日期作为变量进行了6向方差分析，以评估甲基化分析中的变异来源。在485577个位点的全部数据中，这些变量中最显著的变异来源是组织类型，其他因素具有疏忽效应(图S1B） ●●●●。基于这些结果，采用组织类型的单因素方差分析进行最终分析。

肝癌的全球甲基化概况

13%的CpG位点（62692/485577）在HCC和邻近正常组织之间观察到显著的DM位点（未经调整的p<1.03e-07）。在这些重要的DM基因座中，61058（97%）被低甲基化(图1A)，相比之下，1634个（3%）基因座是超甲基化的。我们进一步分析了高甲基化或低甲基化组中DM基因座的功能位置，认为CpG位点可以位于多个功能位置，因为一个基因座可以位于同一基因的多个转录变体或不同基因中（因此，高甲基化或低甲基化位点的总数和不同功能位置的位点总和在图1). 在1634个高甲基化DM基因座中，大多数（37%，有显著差异）定位于与TSS1500、TSS200、5′UTR和1^标准外显子，其次是基因体和基因间区，分别为32%和29%(图1B). 相反，低甲基化DM基因座（61058）大多位于基因间区（43%）和基因体（33%），而不太可能位于启动子区（21%）(图1C). 对高甲基化位点的另一个有趣观察是，它们往往位于多个功能位置。1634个高甲基化基因组位点位于3000个可能的功能位点上，每个基因组位点平均有1.84个功能位点。低甲基化基因座的功能/基因组基因座比率仅为1.03。

保存图片、插图等的外部文件。对象名称为pone.0055761.g001.jpg

在单独的窗口中打开

图1

全基因组甲基化450珠芯片DNA甲基化图谱。

A.左侧：485577个CpG基因座之间的显著差异甲基化（DM），截止值为Bonferroni调整的p值<0.05（红色）具有统计显著性（蓝色；p值>0.05）。A.右侧：在62692个DM CpG基因座中，低甲基化（亚甲基化，蓝色）和高甲基化（高甲基化，红色）基因座的百分比。B。1634个高甲基化位点的功能定位及其在启动子区的亚定位，包括TSS1500、TSS200或第一外显子和5′UTR。C、。61058个低甲基化位点的功能定位及其在启动子区的亚定位。

为了了解观察到的DM分布如何依赖于DNA甲基化的基本正常模式，我们分别对肝癌和邻近正常组织中的DNA甲基化模式进行了表征(图S2). 通过无监督的层次聚类生成了一个显示62692个DM基因座甲基化水平的热图(图S2A） 62692个DM基因座的甲基化事件通过功能定位（启动子、体、3′UTR或基因间）进一步表征(图S2B） ●●●●。当查看所有DM基因座（热图）或功能性DM基因座时，除启动子CpG岛外，正常组织DM基因座的甲基化水平始终高于肿瘤，这导致肿瘤中97%的DM基因座出现明显的普遍低甲基化。

启动子CpG岛及其周围地区的一般甲基化模式

10775个DM基因座位于CpG岛及其周边地区。已发现启动子以及邻近区域中的CpG岛，如海岸（启动子CpG岛屿的0–2kb）和陆架（启动子PpG岛的2–4kb）在癌症和干细胞中存在不同的甲基化[7],[16],[17]虽然本研究中发现的大多数DM基因座位于公海，但有趣的是，差异甲基化发生在海岸的频率是启动子的两倍（1952或18%，而982或9%）(图2A). 每个启动子CpG岛及其周围区域的实际甲基化水平由图2C相邻正常簇中的分支长度通常比HCC簇中的支长度短，这表明肿瘤组织中甲基化水平的异质性更强，证实了PCA的发现。肝癌组织中启动子CpG岛内的低甲基化和高甲基化事件数量相似（分别为45%和55%），但在海岸（8%的DM事件）、大陆架（1%）和公海（7%）观察到的高甲基化明显较少；低甲基化是这些区域的主要事件。

保存图片、插图等的外部文件。对象名称为pone.0055761.g002.jpg

在单独的窗口中打开

图2

10775个启动子区DM基因座的DMRs甲基化谱及其与CpG岛的关系。

A。DM基因座在CpG岛及其周边海岸（启动子CpG岛屿0–2kb）、陆架（启动子PpG岛2–4kb）和外海（启动子中的其他区域）DM区域的分布。B。肝癌中已知差异甲基化区域（DMR）、重编程特异性DMR（rDMRs）、癌症特异性DMRs（cDMR）和潜在新DMRs的DM位点分布。C、。在47个样本（列）中，对702个架子、1952个海岸、982个CpG岛和7139个公海位点（行）的β值进行无监督分层聚类。地图顶部的蓝色和红色区块分别代表20个相邻的正常组织和27个肝癌组织，而位点的红色代表高甲基化和蓝色低甲基化。

增强子和已知及新的DM位点的甲基化模式

在10775个启动子相关的DM基因座中，4%（460个基因座）位于结肠癌中已知的DMR、rDMR和cDMR中[7]。其余10315个DM位点位于4106个基因中，平均每个基因2.5个DM位点，是新发现的，可能是肝癌特异性的(图2B和表S1). 这些肝癌相关的DM基因座由可能在肝癌中具有重要生物学功能的基因所包涵。我们对4106个基因的IPA分析显示，参与“细胞间信号传递和细胞死亡”的基因显著富集（p=1.0e-27）。最经典的途径包括“G蛋白偶联受体信号传导基因”（166个基因）、“cAMP介导的信号传导”（70个基因）和“介导免疫细胞之间通讯的细胞因子”（25个基因）。肝毒性的最高功能包括“肝炎”（31个基因）、“肝胆汁淤积”（11个基因），“肝损伤”（2个基因）和“肝坏死/细胞死亡”（4个基因）以及“肝硬化”（33个基因）(表S2).

由于对肝癌启动子区表观遗传调控所涉及的基因组区域的大小和内容的了解仍然有限，我们接下来重点研究10775个启动子相关DM基因座的亚定位甲基化水平，包括已知的DMR、cDMR、rDMR、，以及由启动子CpG岛、海岸、陆棚和增强子分层的潜在新DMR位点，但不包括公海中的位点。基因组区域进一步分为N_shelf（CpG岛上游2-4kb）、N_shorse（CpG-岛上游0-2kb），CpG岛屿、S_shorse（PpG-岛屿下游0-2kb的）和S_helf（PpG岛下游2-4KB的）。该分析分别在邻近的正常组织和肿瘤组织中进行(图3和表S3). 使用每个区域内DM基因座合并样本的平均β值检查甲基化水平。如中所示图3在邻近的正常组织中，对于所有已知的cDMR（9.2倍）、rDMR（4.9倍）和潜在的新HCC DMR位点（2倍），甚至对于增强子内的DM位点（1.3倍），在海岸观察到的DM位点密度（数量）高于启动子CpG岛，但对于148个普通DMR则没有。cDMR、rDMR和增强子的CpG岛的平均甲基化水平（β值）大约只有海岸基因座水平的一半(图3A). 相反，在肝癌组织中，CpG岛、海岸和陆架的甲基化水平相似，尽管CpG岛屿的平均甲基化水平似乎略高于周围地区(图3B).

保存图片、插图等的外部文件。对象名称为pone.0055761.g003.jpg

在单独的窗口中打开

图3

启动子甲基化水平的分布。

显示了10775个启动子DM基因座（不包括外海）的基因组环境A。法线和B。肝癌肿瘤中。示例性方框图通过方框中的一条线显示了中值，其中包括第25百分位、第75百分位和Beta值的范围。异常值显示为范围标记上方或下方延伸的黄色圆点。每个基因组区域上的功能位点密度显示在图的顶部。贝塔值的平均值显示在每个方框图上*先前已知的DMR、cDMR、rDMR、增强子。

Promoter CpG岛的DM基因座

为了进一步研究差异甲基化的可能生物学意义，我们重点研究了982个启动子DM位点（437个低甲基化和545个高甲基化）的子集，这些位点位于启动子内的CpG岛上。肝癌和邻近正常组织982个位点的平均Beta和Delta-Beta值如所示表S4在这些位点中，80%（348/437）的低甲基化位点和91%（494/545）的高甲基化位点的Delta-beta值≥|0.2|，这意味着肿瘤和正常组织之间的甲基化差异大于或等于20%。Methylation450 BeadChip可以可靠地检测到0.2的Delta-beta值，假阳性率低于1%(http://www.illumina.com网站)，对具有中等Delta-beta值的调查结果也有信心。

437个低甲基化和545个高甲基化启动子基因座分别与211个和279个基因共定位(表S4). 按最大Delta-beta值排列的DM基因座位于表2，表示每个位点对应的基因、甲基化450 BeadChip提供的TargetID、基因组位置（GRCh37/hg19）、功能位置、Delta-beta值和Bonferroni调整的p值。基因C15或60,DCAF4L2型,GAB4型,OR2B11型,ACP1型,SH3YL1型、和C2CD4D型被多个轨迹覆盖。此外，TargetIDs cg06792448、cg10749741、cg25945732、cg03468349和cg02339682定位于多个基因。在前20个高甲基化位点中，TSS内的位点频率较高（TSS1500或TSS200，20个位点中有12个（60%））。相反，在前20个低甲基化位点中，20个位点中只有6个（30%）位于TSS200内。有趣的是，在前20个超甲基化位点中，有三个（基因RIMS2公司,MYADM公司，和ZNF397操作系统)在已知的DMR中(地铁7号线,LPAR2,福克斯3、和SNX31系列)位于增强子区域。T1L令吉（调整后的p=6.9e-14）和福克斯3（调整后p=9.0e-10）分别是肝癌组织和邻近正常组织中最显著的低甲基化和高甲基化基因，而NFATC1（Delta-beta−0.6）和边缘2（Delta-beta 0.55）显示，两组之间的甲基化水平差异最大，分别是低甲基化基因和高甲基化基因。总的来说，肝癌组织和正常组织之间的差异甲基化具有高度的个体间一致性。在前20个糖尿病基因座中，随机选择的5个低甲基化和高甲基化基因座的β值显示在图4点图显示，除少数异常样本外，所有患者HCC和邻近正常组织中这些基因座的甲基化差异一致。

保存图片、插图等的外部文件。对象名称为pone.0055761.g004.jpg

在单独的窗口中打开

图4

基于肿瘤的δ-β值（n=27，红色）与相邻正常对照（n=20，蓝色），20个顶部中5个低甲基化和高甲基化基因座的β值点图。

每个点代表个人的Beta值。每个位点和组织类型的中位β值由图中每个盒子和胡须内的一条线表示。成对样本通过一条线连接。

表2

基于Delta-beta值的肝癌中前20个低甲基化和高甲基化位点。

肝癌中20个前20个基因座的低甲基化						肝癌前20位基因座的高甲基化
基因	目标ID	基因组位置（GSCh37/hg19）	功能位置	Delta-beta值	P值^一	基因	目标ID	基因组位置（GSCh37/hg19）	功能位置	Delta-beta值	P值^一
NFATC1	cg02714192号	1972年8月7日	5英尺UTR	−0.60	4.8E-06段	RIMS2公司	cg01566592号	色谱号：8:104512858	TSS200型	0.55	3.6E-08年
HRNBP3型	cg14715697号	第17章：77127487	5英尺UTR	−0.59	2.3E-12号机组	C2CD4D型	cg08703872号	第151812435页	5英尺UTR	0.54	第2.5页至第05页
C15或60	cg17366808号	第15:73735476页	5英尺UTR	−0.57	1.0E-11号机组	ACP1、SH3YL1	计算20749741	第2章：264178	TSS1500、TSS200	0.53	2.0E-05年
DCAF4L2型	cg02310286号	合同编号：88886432	TSS200型	−0.56	1.7E-10号机组	福克斯3^c（c）	cg19809499号	第147882265页	第一外显子	0.51	9.0E-10年
DCAF4L2型	cg11498870	邮政编码：8:88886243	5′UTR，第一外显子	−0.54	4.2电子-10	FZD7型	cg23246885号	第202899877页	第一外显子	0.51	3.4E-08年
FTMT公司	cg21588562号	章5:121187589	TSS200型	−0.53	6.9E-12段	ZNF397操作系统^b条	cg16657538号	查尔18:32847566	5英尺UTR	0.51	1.6E-08年
C15或60	计算10480461	第15:73735509章	TSS200型	−0.52	2008年7月7日	ACP1、SH3YL1	cg25945732号	第2章：264204	TSS1500、TSS200	0.50	1.0E-05年
3月1日	cg13078134号	第4章：165109478	5英尺UTR	−0.51	1.9E-08年	RNF135号机组	cg13204512号	第17章29298184	第一外显子	0.49	2008年2月2日
DCAF4L2型	cg21181391号	合同编号：88886411	TSS200型	−0.50	1.5E-14号机组	C2CD4D型	cg24425838号	第151812421页	5英尺	0.49	3.2E-05年
ARHGAP8号机组	cg26523649	第22:45182193页	5英尺UTR	−0.47	5.3E-05号机组	弯曲6	cg05022673号	章6:56819429	1500坦桑尼亚先令	0.48	1.7E-09年
T1L令吉	cg19740859号	第2章：193641	5英尺UTR	−0.46	6.9E-14号机组	LPAR2号机组^c（c）	cg19306047号	第19章19739407	1500坦桑尼亚先令	0.47	1.7E-03（电子版）
DLGAP1	cg26598649	查尔18:3880086	5′UTR，第一外显子	−0.46	1.1E-05	中期报告7^c（c）	cg12296772号	色谱图8:17271067	TSS200型	0.47	1.9E-09年
GAB4型	cg02432860号	第22:17489187页	TSS200型	−0.46	1.2E-05	骨形态发生蛋白8A	计算10523966	色谱：39957535	1500坦桑尼亚先令	0.47	7.2E-04日
GAB4型	cg05945275号	第22:17489130页	TSS200型	−0.45	5.1E-06段	SNX31系列^c（c）	cg26440289号	色谱号：8:101661921	TSS200型	0.46	1.7E-05年
OR2B11型	cg05777962号	色谱号：247614860	第一外显子	−0.45	3.7E-11号机组	ST8SIA3型	cg13096208号	章18:55019843	5′UTR，第一外显子	0.46	4.2E-05年
PMEPA1项目	cg26681770号	时间20:56247302	5英尺UTR	−0.45	5.0E-03年5月	骨形态发生蛋白4	cg08162372号	第14:54422925页	TSS200型	0.46	7.2E-04日
ZBTB46型	cg01548777号	时间20:62433998	5英尺UTR	−0.44	3.4E-05	ZNF154号	cg21790626号	第19:58220494页	5′UTR，第一外显子	0.45	2014年4月14日
OR2B11型	cg14422922号	第147614727页	第一外显子	−0.44	3.1E-10段	ACP1、SH3YL1	cg03468349号	第2章：264164	TSS1500、TSS200	0.45	5.6E-05年
GML公司	cg01972576号	章8:143916273	5′UTR，第一外显子	−0.44	4.0E-10型	MYADM公司^b条	cg03585419号	时间19:54369681	TSS1500、TSS200	0.45	2.4至05
RTL1、mir-136、mir-432	cg06792448号	第14章101349632	第一外显子	−0.44	3.7E-03型	弯管6，DST	cg02339682	章6:56819432	TSS1500、TSS200	0.45	1.1E-08年

在单独的窗口中打开

^一Bonferroni校正p值^b条DMR公司^c（c）增强器。

为了探索982个启动子DM位点的生物学意义，我们使用IPA对相关基因进行了表征(表3). 二十六个基因，包括骨形态发生蛋白4,CDKN2A型和GSTP1标准参与与“细胞发育、基因表达和细胞死亡”相关的顶级IPA网络（p=1.0e-38）。此外，发现15个基因参与“细胞运动、细胞周期、细胞妥协和细胞介导的免疫反应”（p=1.0e-17），另外15个基因在“细胞发育、细胞功能和维持”（p=1.0e-17）中被鉴定，所有这些都被认为是IPA的顶级网络。细胞周期、增殖和癌症相关基因也得到了鉴定(表3).

表3

启动子CpG岛上含有982个差异甲基化（DM）位点的基因的10个IPA网络的生物学功能。

网络中的分子		分数	聚焦分子	顶级功能
1	阿克特，弧,BMP4、CDKN2A,CTBP2号机组,CYP24A1、DRD2、E2f、ERK、，FOXD3系列,FTH1（飞行时间1）,GFI1、GNA11、GSTP1,H19型、Hdac、，HIST1H3A公司,HIST1H4A公司、组蛋白3、，HMGA1、OXA11,ICAM1公司,IRS1公司,日本,MGAT3公司,MT1F型,第一个多年电价,NFATC1、NFkB、，PAK1、PI3K、RNA聚合酶II、，运行NX3,TCL1A公司,TRPC3号机组	38	26	细胞发育、基因表达、细胞死亡
2	ABCB1，ACP1、ADRB1、AKAP5、CDH1、CLDN7、，COTL1号机组、CXCL2、，CYB5R2年、DKK1、DNMT3A、，DNMT3B，DUOX1型、EED、，ELF4级、EPHA2、EZH2、FCGR2A、FOSL1、IL8、，IQSEC1公司，6月，81韩元,LPAR2号机组,MC5R（最大持续功率）,第一个多年电价,NETO2公司、Pkc（s）、RAP1B、，销售人员3,SDK1系列,SF3B14钢、SMARCA4、SYK、Tgfβ	17	15	细胞运动、细胞周期、细胞损伤
三	AKR1B1型、ANXA2、AR、AZGP1、CEBPB、，DST、FOXG1、FOXO3、，FRG1系列、GADD45B、HAS1、IL1B、，ITGB4，KCNQ1号机组、KLF4、，图4,LRFN4、LRRK1,mir-1型,NEDD4L、PFKP、PGR、，PMEPA1项目、PRKDC、，PTGS2、RPS19、SCNN1A、，SFMBT2型,SLC22A16型、TAL1、TRAF6、TREM1、UGCG、XRCC4、XRCC6	17	15	细胞介导的免疫反应、细胞发育、细胞功能和维持
4	26s蛋白酶体，BIRC5，半胱氨酸蛋白酶3/7，CHST2型、CXCL1、CXCL2、Disheveled、，DSC3、FZD1、GNB4,35加仑，Hsp90，不确定因素1、Igm、IL13、免疫球蛋白、JAK1、，JAKMIP1号机组,mir-154型，p70 S6k，PDPN（PDPN）、Pka、PML、RPS6、，SARM1系列,SCO2公司,SMPD3公司,SOCS5系列、STAT6、TICAM1、TNF、TNFSF11、，TRPS1型、TYK2、VCL	15	14	细胞死亡、细胞发育、造血
5	AGTR1，ATP2B4型、AURKA、半胱氨酸天冬氨酸蛋白酶、CBY1、CCND1、，CDKN2A型，CTNNB1，细胞周期蛋白A，DDX20，E2F8型,尾端1，雌激素受体，FZD7型、GEMIN2、GEMIN4、Hdac、，hist2hbe、HMGA1、LDHB、NCOA1、NRG1、，PABPC3、PCDH11X/PCDH11Y、PPP3CA、，PRDM2、RASSF1、SMN1/SMN2、SNRPD1、SNRP D2、，SNRPF公司、SOX2、，TSC22D1次、TUB2A、，YWHAE公司	15	14	细胞周期，细胞组装和组织，RNA转录后修饰
6	ABCB1，AFAP1公司、APH1A、，亚太H1B,ASCL2、BMP4、Calpain、CDK7、，CDKN2A型、CTSD、DDIT4、， DLGAP1,EBF1（EBF1）、ESR1、ITGB1、，MAGEB1（刀库1）、mir-21、mir-145、mir-21/mir-590-5p、MLL2、，MREG公司,NEK2公司，槽口1，PDE6B型、PML、PRDM5、PSEN2、Ras、RBBP5、SNAI2、，TMOD1（TMOD1）、TP53、TRIM28、TSG101、，ZNF274型	14	13	细胞死亡、细胞发育、骨骼和肌肉系统发育和功能
7	ACTA2、ANXA2、ARHGAP1、ATP2A2、，骨形态发生蛋白4、BMP6、BMPR1A、，CCNJ公司、CREM、DHCR7、，DLX5（DLX5）,ERK1/2，*全球导航卫星系统、GNB1、GPR56、hCG、IgG、ILK、，吉尔吉斯斯坦共和国18、Lh、MED1、，净现值3、P38 MAPK、PMAIP1、PTPase、PTPN1、，RAB31型,RANBP1公司，RAP1B，RGS20、SRD5A2、STAR、，TACSTD2系统,TRIM29阀内件*	12	12	内分泌系统发育与功能，小分子生物化学，脂质代谢
8	BCL2L11、CALML3、，CBFA2T3型、CCND2、CCND3、CDK2、CDKN1B、CHI3L1、，第16A1列，DLL4，EFNB2、FSCN1、FZD8,GLTSCR2号机组、IGFBP5、，IRS1系统、套件、MMP3、，2010年10月PRKCA NOTCH1，PSMA1型，私人，PTPRN2型，SERPINE1、SMAD2、SNAI1、SNAI2、SPDEF，SPDIA、SPINT2、TGFB1、Vegf、VEGFA、VIM	12	12	细胞运动、细胞生长和增殖、癌症
9	ABL1、，ANK1型,骨形态发生蛋白4、CEBPD、DDIT4、，FKBP4型、GADD45B、GNAI2、，通用处理器X1，HNF4A，IGFBP1，IRF4、，MIXL1、MTHFD2、NANOG、NR3C1、，ONECUT1，OTX1、POU5F1、PPARD、，PRKAR1B公司、PTGES3、RARG、，第17页、RORA、RORC、，SCT公司、Smad2/3、SOX2、SP1、TCF7、TRIB3、VIM、YY1、，ZNF148型	12	12	细胞发育、基因表达、组织发育
10	ACO1、ADORA2A、，APBB2型、应用程序、，ARHGAP8/PRR5-ARHGAP第8页,CELSR1级、FUT1、IFNG、，IGFBP7型,INSR、IRF7、JAK1、MAPK1、MAPK14、，移动10L1，第2RX7页，PAK1,PDE3B型、PIM1、PMAIP1、PML、RAC1、Ras、，RTN1型,第1节、SELE、SOD2、SPHK1、TCR、，三角波，UCP2、UGCG、VCL、VDR、ZAP70	12	12	自由基清除，细胞运动，细胞死亡

在单独的窗口中打开

斜体基因和粗体基因分别代表低甲基化和高甲基化基因，粗体斜体基因(全球导航卫星系统)在网络7中同时存在低甲基化和高甲基化位点。其他基因通常在其他研究的这些网络中发现，但在我们的数据集中没有发现。

有趣的是，我们在一个已知的印迹基因中发现两个相邻的CpG岛之间一致的相反甲基化模式(全球导航卫星系统，鸟嘌呤核苷酸结合蛋白，α刺激）。该基因中有两个独立的CpG岛，5个低甲基化基因座位于CpG岛1（chr20:57428473–57429858），3个高甲基化基因座位于CpG岛2（chr20:57465695–57465691）(图S3)在我们的HCC样本中。

通过焦测序验证DM基因座

使用焦磷酸测序法，选择了甲基化450珠芯片鉴定的8个DM基因座进行验证。四个基因包含的五个高甲基化位点(GSTP1标准,TACSTD2系统,骨形态发生蛋白4和RASSF1系统)三个基因中的三个低甲基化位点(ARHGAP8号机组,35加仑和DLGAP1型)使用本研究中12对肿瘤正常组织进行的7次检测进行验证。验证了两个DM基因座GSTP1标准通过预先设计的焦磷酸测序分析。由于GC含量高，在设计甲基化位点分析时存在局限性，因此预先设计的分析并不总是适用于分析与甲基化450 BeadChip评估的完全相同的位点。尽管如此，由于在基因中观察到多个具有显著p值的基因座，我们选择了与感兴趣的DM基因座距离最近的分析，以关联Pyrosequencing和Methylation450 BeadChip之间的甲基化结果。如果检测未覆盖感兴趣的位点，则使用焦磷酸测序分析的CpG位点的平均甲基化值进行相关性分析。使用了Qiagen预先设计的五种分析方法和其他组之前使用的两种分析方法。每个分析的基因组区域的详细信息、通过焦磷酸测序分析的CpG位点的数量以及珠芯片上特定基因甲基化显著差异但无法进行技术验证的位点如所示表S5对于其中的5个基因，在两个完全匹配的CpG位点的Pyrosequencing和Methylation450 BeadChip结果之间发现了0.86到0.99的高度相关性(GSTP1标准,RASSF1系统和骨形态发生蛋白4)和最近的CpG站点(DLGAP1和35加仑) (图5，近端验证位点）。骨形态发生蛋白4显示了焦磷酸测序和甲基化450珠片之间的最高一致性（r=0.99）。我们还观察到，当焦磷酸测序分析的位点远离甲基化450珠芯片发现的DM位点时（约0.9kbTACSTD2系统，31 kbARHGAP8号机组)，甲基化状态没有很好的相关性，表明位置特异性(图5，远程验证基因座）。

保存图片、插图等的外部文件。对象名称为pone.0055761.g005.jpg

在单独的窗口中打开

图5

通过焦磷酸测序对8个DM基因座的验证结果。

给出了基因名称、Illumina的目标ID（位点）和相关系数（r）。每个单独HCC（红色）和正常（蓝色）样本的β值用圆点表示。x轴和y轴分别表示甲基化450珠片分析的β值和焦平测序的甲基化水平。

讨论

在包括肝癌在内的许多恶性肿瘤中，DNA甲基化异常在肿瘤发生和癌症进展中起着重要作用[18],[19]以前的一项研究主要关注肝癌中几个特定的抑癌基因和癌基因位点的DNA甲基化谱，发现9个癌相关基因的启动子甲基化发生了变化，包括SOCS-1系统,全球服务贸易伙伴关系,空气污染指数,E-钙粘蛋白,RAR-贝塔,第14页,第15页,第16页（CDKN2A）、和第73页 [19]利用微阵列进行DNA甲基化分析的新技术现在为在基因组尺度上研究甲基化提供了巨大的机会。这种方法可以提高我们对表观遗传机制以及DNA甲基化对疾病相关分子网络和通路的影响的理解，而不仅仅是单个基因。

在这项研究中，我们测量了99%RefSeq基因485577个位点的DNA甲基化水平，包括27例肝癌组织和20例邻近正常人中96%的已知CpG岛。在Bonferroni校正后，我们发现62692个基因座的甲基化水平存在显著差异，其中97%（61058个基因座）为低甲基化，表现为普遍（或“全球”）低甲基化。众所周知，异常的全基因组低甲基化与肿瘤发生有关，我们的发现与这一概念相一致。先前的研究也显示肝癌组织中全基因组5′-甲基胞嘧啶含量较低[20]肝癌患者血液中LINE-1低甲基化[21]此外，我们发现基因间区域和基因体（而不是启动子）的低甲基化事件过度富集，这与之前的结肠癌全基因组研究的结果相似[7].

尽管最近发表了几项关于HCC的全基因组甲基化研究[15],[22],[23]这些研究使用了Illumina HumanMethylation27 BeadChip，该芯片包含的CpG基因座数量远低于我们在本研究中使用的Methylation 450 BeadChip。Shen等人最近的一项研究发现，62例台湾HCC患者（大多为HBV阳性）2324个CpG基因座（代表548个高甲基化基因和1290个低甲基化基因）的甲基化与邻近正常组织相比存在显著差异[15]在他们名单上排名前20位的基因中，有14个超甲基化基因(DAB2IP（数字音频广播）,骨形态发生蛋白4,CDKN2A型,TSPYL5型,CDKL2型,ZNF154号,ZNF540型,CCDC37公司,NKX6-2型,FOXD2系列,HIST1H3E公司,LYPD3年,DNM3（DNM3）和RASSF1系统)和18个低甲基化基因(CCL20型,AKT3型,SCGB1D1标准,WFDC6型,PAX4型,GCET2测试,CD300E型,CD1B型,MNDA公司,CD1E公司,塞浦路斯11B1,KRTAP13-1型,KLK9公司,KPNA-1型,SPRR1B型,SPRR1A公司,中央控制室6和OR51B4型)在我们的研究中也发现了DM基因座。此外，Ammerpohl等人还鉴定了上述高甲基化基因中的14个。[22]由于甲基化450 BeadChip比早期版本的BeadChip覆盖更多的CpG位点，我们分析的位点大约是之前研究的16倍，并且每个基因都被更多的Cp位点覆盖(表S6). 在我们排名靠前的20个启动子内的低甲基化位点和20个高甲基化位点中(表2)，两个高甲基化基因(FTMT公司和格林威治标准时间)和六个低甲基化基因(福克斯3,sh3基,RNF135号机组,BMP4、ZNF154和MYADM公司)Shen等人也发现了。[15]。与Illumina HumanMethylation27 BeadChip发现的1490个DM基因座的总数相比，我们使用HumanMethilation450 BeadChips鉴定了62692个DM基因位点。就地理位置而言，我们的数据与Ammerpohl等人之前的研究一致，分别为49%（735/1490）、46%（685/1490和57%（852/1490）。[22]，Hernandez-Vargas等人。[23]和Shen等人。[15]分别为。重叠位点在甲基化变化方向上100%一致（数据未显示）。

先前的研究报告了HCC和正常组织之间具有统计学意义的DM基因座，但没有扩大分析范围，以便更深入地研究DM基因组位置的结构。然而，目前对不同基因组亚区（即启动子CpG岛、海岸、搁板和增强子）之间甲基化变化的意义知之甚少。Irizarry等人最近对结肠癌进行了全基因组甲基化研究，令人惊讶的是，在海岸观察到的甲基化改变事件是启动子CpG岛的13倍[7].

在本研究中，我们观察到肝癌和邻近正常组织中启动子区的差异启动子甲基化水平，包括TSS1500、TSS200、5′UTR和1^标准根据目前的假设，外显子位点的甲基化可以直接调节基因表达。虽然启动子CpG岛中的DM基因座数量在低甲基化（45%）和高甲基化（55%）方面非常相似，但与相邻正常组织相比，肝癌的海岸（8%的DM事件）和货架（1%）中发现的高甲基化事件明显较少。这表明大多数启动子区超甲基化事件发生在肝癌的启动子CpG岛。适当地，从甲基化水平来看，正常组织的启动子CpG岛的甲基化水平低于海岸和大陆架。相反，启动子CpG岛甲基化水平高于肿瘤组织中海岸和货架的水平。在本研究中发现的10315个启动子相关的DM基因座中，那些不属于已知DMR的基因座可能是肝癌的新DMR基因座。对于所有已知的rDMRs、cDMRs，以及增强子内的DM基因座和潜在的新DMR基因座，海岸中的DM基因座（大多是低甲基化的）数量高于启动子CpG岛，这与Irizarry在海岸而不是启动子CpG岛富集结肠癌DM事件的发现相似[7].

在发育和致癌过程中，每个CpG位点的甲基化都是以区域特定的方式建立的，一些区域保持非甲基化，而另一些区域则变得高甲基化[24]同样，我们观察到大多数共定位基因启动子CpG岛内CpG位点的区域一致甲基化模式（数据未显示）。有趣的是，我们发现了一个基因(全球导航卫星系统)在两个不同的启动子CpG岛上有不同的甲基化模式。次甲基化CpG岛位于全球导航卫星系统反义RNA(全球导航卫星系统AS1)这表明印迹过程可能受到这些不同的甲基化模式的调节[25],[26].

为了评估HCC肿瘤中异常甲基化的可能生物学意义，我们使用IPA来确定可能被受影响基因的差异甲基化所干扰的途径和细胞过程。我们发现，本研究中观察到的甲基化变化可能与“细胞发育、基因表达和细胞死亡”的信号网络有关（p=1.0e-38）。这些网络包括骨形态发生蛋白4 [27],CDKN2A型 [28]和GSTP1标准 [29]，这些基因以前在肝癌中已经被很好地研究过。我们的IPA分析也显示了与“细胞周期、增殖和癌症”相关的基因。启动子CpG岛上的甲基化已被证明与基因表达直接相关[10],[30]我们对7个带有启动子DM位点的基因进行了初步表达分析，并试图通过焦磷酸测序进行验证，结果显示，在16个配对样本中，启动子甲基化与表达水平之间至少存在部分相关性（数据未显示）。在HCC中具有推测的高甲基化启动子基因座的16对肿瘤-正常配对中（在基因中BMP4、RASSF1、GSTP1、和TACSTD2系统)16例HCC中，5例、6例、14例和16例分别降低了该基因的表达。在具有假定的低甲基化启动子位点的配对中（在ARHGAP8、GPR35和DLGAP1)16例肝癌中，10例、11例和12例分别表达增加。这些结果反映了表观遗传调控的复杂性，因为即使这些特定基因的差异甲基化模式在肿瘤和正常人之间也是一致的（参见图55个基因）；甲基化与表达模式并不总是直接相关。

直到最近，甲基化变化在TSS和CpG岛之外的重要性，例如在其他基因区域，如基因体中，一直被忽视，即使在这些区域观察到动态甲基化模式[31]由于我们拥有来自甲基化450珠芯片的丰富数据，该芯片可以在全基因组范围内同时分析480000多个基因座，因此我们拥有肝癌中CpG岛、TSS、基因体等甲基化的详细信息。然而，肝癌组织成分的可能异质性和肝癌的各种风险因素可能对甲基化有重大影响。因此，评估HCC不同危险因素（如HBV和HCV感染）分层的甲基化变化非常重要。为了更全面地了解HCC甲基化特征，我们未来的分析将包括HCC的特定风险因素，如病毒感染、饮酒习惯、疾病分期、组织学以及肝硬化与非肝硬化周围组织的存在。我们还旨在将DM发现与当前教条以外的基因表达相关联，即包括不在启动子CpG岛上的DM位点。

总之，这是我们所知的第一份将甲基化450珠芯片应用于肝癌评估全基因组甲基化的报告。我们目前的分析侧重于基因组不同区域的差异甲基化模式，特别是在基因启动子或其附近。我们的主要观察结果是：（1）在肝癌中观察到普遍或“整体”低甲基化，集中在基因间区域和基因体；（2）发现10315个潜在的肝癌新DMR基因座，其在启动子海岸的密度高于CpG岛；（3）启动子CpG岛的高甲基化事件频率高于海岸和陆架；（4）启动子CpG岛DM基因座在“细胞发育、基因表达、细胞死亡和癌症”基因网络中的富集。我们对肝癌全基因组图谱的研究结果可能有助于确定肝癌中异常DNA甲基化的情况，并为观察启动子CpG岛和其他相关基因调控区的甲基化改变提供更深入的信息。了解HCC的表观遗传变化将有助于阐明其发病机制，并最终可能导致识别用于疾病诊断、治疗和预后的分子标记物。

支持信息

图S1

主成分分析（PCA）和变异源。 A。肝癌（红色）和辅助正常组织（蓝色）之间DNA甲基化数据的二维PCA。x轴，第一主分量（PC1）；y轴，第二主分量（PC2）。B。甲基化数据中不同变异来源的统计显著性由6向方差分析模型估计。每个因子（源）的F-比率表示因子的F-统计信息/误差（噪声）的F--统计信息。

（畅通节能法）

单击此处查看其他数据文件。^{（1.1M，tif）}

图S2

相邻正常组织和肝癌组织中DNA甲基化的特征。 A。通过无监督分层聚类分析显示了62692个DM基因座的贝塔值（范围：0-1）。地图顶部的红色和蓝色块分别代表20个相邻的正常组织和27个肝癌组织。B。62692个DM基因座的功能分布显示了相邻正常组织和肝癌组织的β值（y轴）。方框图显示了平均甲基化结果，以及中间值（用方框中的一条线表示）、第25百分位、第75百分位和Beta值的范围。异常值显示为范围标记上方或下方延伸的黄色圆点。

（畅通节能法）

单击此处查看其他数据文件。^{（939K，tif）}

图S3

糖尿病基因座的基因组定位 全球导航卫星系统 发起人。CpG岛1内五个低甲基化位点和CpG岛内三个高甲基化位点的基因组位置全球导航卫星系统启动子用平均贝塔值图表示。未调整和Bonferroni调整的p值显示在图的下半部分的表格中。

（畅通节能法）

单击此处查看其他数据文件。^{（1.7M，tif）}

表S1

肝癌中潜在的10315个DM基因座。

（XLS）

单击此处查看其他数据文件。^{（1.7M，xls）}

表S2

肝癌中潜在10315个DM位点的顶级典型途径。

（XLS）

单击此处查看其他数据文件。^{（46K，xls）}

表S3

10775个启动子DM位点的DMR、rDMR、cDMR、增强子和新DMR(没有公海基地).

（XLS）

单击此处查看其他数据文件。^{（396K，xls）}

表S4

肝癌中982个CpG岛DM启动子位点列表。

（XLS）

单击此处查看其他数据文件。^{（225K，xls）}

表S5

有关验证的CpG基因座和焦磷酸测序分析的信息。

（XLSX）

单击此处查看其他数据文件。^{（16K，xlsx）}

表S6

与Shen等人共享CpG基因座。

（XLS）

单击此处查看其他数据文件。^{（57K，xls）}

致谢

作者感谢Mike Loomis先生开发了用于分析Methylation450 BeadChip数据的基因图谱程序。

资金筹措表

本研究部分由以下国家卫生研究院拨款资助：3P30CA071789-12S6和P30CA0071789-12S8。资助者在研究设计、数据收集和分析、决定出版或编写手稿方面没有任何作用。

工具书类

1Parkin DM（2001年）2000年全球癌症统计.柳叶刀Oncol 2: 533–543. [公共医学][谷歌学者]

2马萨诸塞州费特尔森（2006）肝炎病毒相关肝细胞癌发病机制中的表观遗传学和遗传学平行变化.癌症快报 239: 10–20. [公共医学][谷歌学者]

三。Fattovich G、Strofolini T、Zagni I、Donato F（2004）肝硬化中的肝细胞癌：发病率和危险因素.胃肠病学 127：S35–50。[公共医学][谷歌学者]

4Gomaa AI、Khan SA、Toledano MB、Waked I、Taylor-Robinson SD（2008）肝细胞癌：流行病学、危险因素和发病机制.世界胃肠病杂志 14: 4300–4308.[PMC免费文章][公共医学][谷歌学者]

5Herath NI、Leggett BA、MacDonald GA（2006年）肝癌发生中的遗传和表观遗传学改变.胃肠肝素杂志 21: 15–21. [公共医学][谷歌学者]

6Jones PA，Baylin SB（2002）表观遗传事件在癌症中的基本作用.Nat Rev基因三: 415–428. [公共医学][谷歌学者]

7Irizarry RA、Ladd-Acosta C、Wen B、Wu Z、Montano C等（2009）在保守的组织特异性CpG岛海岸，人类结肠癌甲基组表现出类似的低甲基化和高甲基化.自然基因 41: 178–186.[PMC免费文章][公共医学][谷歌学者]

8Rakyan VK、Down TA、Balding DJ、Beck S（2011）常见人类疾病的表观基因组关联研究.Nat Rev基因 12: 529–541.[PMC免费文章][公共医学][谷歌学者]

9Issa JP（2004）癌症中的CpG岛甲基化表型.Nat Rev癌症 4: 988–993. [公共医学][谷歌学者]

10Matsuzaki K、Deng G、Tanaka H、Kakar S、Miura S等（2005）散发性结直肠癌中整体甲基化水平、杂合性缺失和微卫星不稳定性之间的关系.临床癌症研究 11: 8564–8569. [公共医学][谷歌学者]

11Kwee S、Song MA、Cheng I、Loo L、Tiirikainen M（2012）晚期前列腺癌化疗后循环游离DNA与18F-氟胆碱PET/CT显像的相关性研究.临床翻译科学 5: 65–70.[PMC免费文章][公共医学][谷歌学者]

12钟S、唐兆伟、杨伟、刘C、罗勇等（2002）HBV相关性肝癌中CpG岛DNA高甲基化沉默GSTP1基因.临床癌症研究 8: 1087–1092. [公共医学][谷歌学者]

13Moribe T、Iizuka N、Miura T、Kimura N、Tamatsukuri S等（2009）多基因甲基化作为诊断小分化肝癌的分子标记.国际癌症杂志 125: 388–397. [公共医学][谷歌学者]

14陶瑞、李杰、辛杰、吴杰、郭杰等（2011）乙型肝炎病毒相关性肝癌单个肝细胞的甲基化特征.公共科学图书馆一号 6：e19862。[PMC免费文章][公共医学][谷歌学者]

15沈J，王S，张英杰，卡普尔M，吴慧聪，等（2012）肝细胞癌基因组DNA甲基化谱.肝病学 55: 1799–1808.[PMC免费文章][公共医学][谷歌学者]

16Doi A、Park IH、Wen B、Murakami P、Aryee MJ等（2009）组织和癌症特异性CpG岛岸的差异甲基化区分了人类诱导多能干细胞、胚胎干细胞和成纤维细胞.自然基因 41: 1350–1353.[PMC免费文章][公共医学][谷歌学者]

17Sandoval J、Heyn H、Moran S、Serra-Musach J、Pujana MA等人（2011）人类基因组中450000个CpG位点的DNA甲基化微阵列的验证.表观遗传学 6: 692–702. [公共医学][谷歌学者]

18Tischoff I，Tannapfe A（2008）肝细胞癌中的DNA甲基化.世界胃肠病杂志 14: 1741–1748.[PMC免费文章][公共医学][谷歌学者]

19Yang B、Guo M、Herman JG、Clark DP（2003）肝细胞癌抑癌基因启动子甲基化异常.美国病理学杂志 163: 1101–1107.[PMC免费文章][公共医学][谷歌学者]

20Lin CH、Hsieh SY、Sheen IS、Lee WC、Chen TC等（2001）肝细胞癌发生中的全基因组低甲基化.癌症研究 61: 4238–4243. [公共医学][谷歌学者]

21Tangkijvanich P、Hourpai N、Rattanatanyong P、Wisedopas N、Mahachai V等人（2007）血清LINE-1低甲基化作为肝细胞癌潜在预后标志物.临床医学杂志 379: 127–133. [公共医学][谷歌学者]

22.Ammerpohl O、Pratschke J、Schafmayer C、Haake A、Faber W等人（2012）肝硬化和肝细胞癌中不同的DNA甲基化模式.国际癌症杂志 130: 1319–1328. [公共医学][谷歌学者]

23.Hernandez-Vargas H、Lambert议员、Le Calvez-Kelm F、Gouysse G、McKay-Chopin S等人（2010）肝细胞癌表现出明显的DNA甲基化特征，有可能成为临床预测因子.公共科学图书馆一号 5：e9749。[PMC免费文章][公共医学][谷歌学者]

24Clark SJ、Melki J（2002）癌症中的DNA甲基化和基因沉默：哪一方有罪？癌基因 21: 5380–5387. [公共医学][谷歌学者]

25Peters J，Williamson CM（2007）Gnas集群压印控制.表观遗传学 2: 207–213. [公共医学][谷歌学者]

26Peters J，Williamson CM（2008）Gnas集群压印控制.高级实验医学生物 626: 16–26. [公共医学][谷歌学者]

27Maegdefrau U、Amann T、Winklmeier A、Braig S、Schubert T等人（2009）缺氧诱导肝细胞癌中的骨形态发生蛋白4并促进肿瘤进展.病理学杂志 218: 520–529. [公共医学][谷歌学者]

28Galacteros F，Guilloud-Bataille M，Feingold J（1991）正常新生儿成人血红蛋白浓度的性别、孕龄和体重依赖性.血液 78: 1121–1124. [公共医学][谷歌学者]

29王杰、秦毅、李波、孙Z、杨波（2006）中国人原发性肝癌患者肿瘤和血清中GSTP1启动子异常甲基化的检测.临床生物化学 39: 344–348. [公共医学][谷歌学者]

30.Deaton AM，Bird A（2011年）CpG岛与转录调控.基因开发 25: 1010–1022.[PMC免费文章][公共医学][谷歌学者]

31Jones PA（2012）DNA甲基化的功能：岛、起始位点、基因体及其他.Nat Rev基因 13: 484–492. [公共医学][谷歌学者]

文章来自PLOS ONE系列由以下人员提供普洛斯