跳到主要内容
访问密钥 NCBI主页 MyNCBI主页 主要内容 主导航
基因组研究。2013年9月;23(9): 1363–1372.
数字对象标识:10.1101/克.154187.112
PMCID公司:项目经理3759714
PMID:23908385

DNA甲基化导致人类自然变异

摘要

DNA甲基化模式对建立细胞、组织和生物体表型很重要,但对其对人类自然变异的贡献知之甚少。为了确定它们对变异性的贡献,我们生成了三个人类群体(高加索裔美国人、非洲裔美国人和汉族华裔美国人)的基因组DNA甲基化谱,并检测了差异甲基化的CpG位点。明确的甲基化基因表明DNA甲基化对表型差异的影响,例如对某些疾病和病原体的敏感性,以及对药物和环境因素的反应。DNA甲基化差异可以部分追溯到遗传变异,这表明差异甲基化的CpG位点是遗传密码和表型变异之间进化建立的介体。值得注意的是,三分之一的DNA甲基化差异与任何遗传变异无关,这表明特定人群位点的变异发生在遗传和表观遗传水平上,突出了表观遗传修饰对人类自然变异的贡献。

个体之间的表型差异不能完全用遗传差异来解释。将转录组视为调节事件总和的反映表明,非遗传机制对表型有着深远的影响。表观遗传学负责这一额外控制层的一部分(范伯格2007;Portela和Esteller 2010). 例如,基因相同的个体,如单卵双胞胎(Fraga等人,2005年;Kaminsky等人,2009年),克隆动物(Rideout等人,2001年)和Agouti小鼠(Michaud等人,1994年;Waterland和Jirtle 2003),显示DNA甲基化和表型差异。因此,表观遗传变异,尤其是DNA甲基化,可能不仅参与个体之间的差异,也参与人类群体之间的差异。这可能会导致观察到的不同外表、行为以及对环境因素和药物的反应的差异。在这方面,以前曾报道过使用27000-CpG位点微阵列平台在非洲和欧洲人群中存在DNA甲基化差异(弗雷泽等人,2012年).

基因启动子处的DNA甲基化对转录调控很重要,转录起始位点周围的高密度启动子甲基化与基因抑制有关(范伯格2007;Portela和Esteller 2010). 事实上,情况更为复杂,最近,基因内甲基化与转录和剪接活动有关(琼斯2012)表明这种表观遗传修饰具有复杂的调控潜力。DNA甲基化水平与基因组背景密切相关,位于基因5′端的富含CpG区域(CpG岛)主要为非甲基化。不同CpG位点DNA甲基化的个体间变异一直与单核苷酸多态性(SNP)的遗传变异有关,并被定义为甲基化数量性状位点(meQTL)(Bell等人,2011年,2012). 然而,建立DNA甲基化变异性的事件因果链(目前仍在讨论中)可能在基因组背景、转录活性和其他表观遗传调控层的网络中介导,如组蛋白修饰、DNA结合和修饰因子、核小体定位、,和非编码RNA。

许多全基因组关联研究(GWAS)试图建立不同群体间差异的遗传关联(Li等人2008a;Lachance等人,2012年)、疾病(Kamatani等人,2009年)以及对外部刺激的反应(Li等人2008b;Niu等人,2010年). 然而,观察到的关联比预期的要少,而且直接的基因型-表型关系不容易解释,因为大多数变异位点位于非编码位点(Kilpinen and Dermitzakis 2012年). 在这种情况下,表观遗传网络有望增加调控层,这表明基因型和表型在基因调控和表型变异中相互作用(2012年ENCODE项目联合会).

在这项研究中,我们对来自三个人群的大约300名个体进行了差异DNA甲基化分析。特别是,我们分析了从高加索裔美国人、非洲裔美国人和汉族华裔美国人中获得的B淋巴细胞,其基因组分辨率约为450000个CpG位点(Dedeurwaerder等人,2011年;Sandoval等人2011). 不同位点的DNA甲基化水平使得它们能够根据地理起源进行分离,并有助于解释人类的自然变异。随后对基因型数据的整合使其能够精确分离为遗传依赖性和独立性变异。

结果

DNA甲基化差异存在于不同的人群中

我们根据单核苷酸多态性(SNP)和基因表达确定了人类变异小组中广泛描述的三个人群之间DNA甲基化的差异(Li等人2008b;Niu等人,2010年). 对代表96名高加索裔美国人(CA)、96名非洲裔美国人(AF)和96名华裔美国人(AS)个体的288个B细胞淋巴母细胞系(LCL)的DNA甲基化谱进行了评估。样本随机化后,DNA样本在Infinium DNA甲基化BeadChip平台(Illumina)上进行杂交,该平台分析了基因组中超过450000个CpG位点(Dedeurwaerder等人,2011年;Sandoval等人,2011年). 归一化后,我们筛选出质量较差的探针和含有单核苷酸多态性(SNP;>1%)的探针(2010年1000基因组计划联盟)拷贝数变化(CNV;>5%)(Redon等人,2006年)在检测序列中:根据这些筛选,从最初在微阵列中打印的485577个CpG位点中,我们保留了406021个探针用于后续分析。通过对10份高加索人、10份亚洲人和10份非洲原始外周血细胞样本中变异CpG位点的阳性筛选,排除了由EB病毒(EBV)引起的LCL永生化引起的任何DNA甲基化变异。尽管如此,仅从LCL样本中单独生成的1373个差异甲基化CpG位点(δ平均β值≥0.12;ANOVA,FDR<0.01)能够根据其地理来源完美地聚类原始血样,强调LCL样本确定种族间表观遗传差异的能力(补充图S1)。在此,我们在LCL和原始血样中确定439个CpG位点在人群之间存在差异甲基化(δ平均β值≥0.12;用Tukey HSD事后检验进行方差分析,FDR<0.01)(图1A; 补充表S1),并能够分别对其进行聚类(多尺度自举重采样,n个=10000,近似无偏P(P)-值>0.99)(图1B). DNA甲基化分类产生了AF的一个单独分支,而在集群的另一个分支中,获得了与CA和AS相对应的两个分支,这与先前公认的遗传定义的邻近性一致(图1A;Li等人2008a). 这些具有人群特异性差异甲基化的CpG位点被称为pop-CpG。特别是,172、129和138个CpG位点显示DNA甲基化在AF、CA和AS样本中分别存在显著差异。439个随机选择的探针无法根据个体的群体身份将其分离(多尺度bootstrap重采样,n个= 10,000).

保存图片、插图等的外部文件。对象名为1363fig1.jpg

DNA甲基化分离非洲裔美国人(AF,棕色)、白人美国人(CA,粉红色)和汉族华裔美国人(AS,黄色)个体。(A类)439个pop-CpG位点的层次聚类使用绝对DNA甲基化水平(低:绿色;高:红色)将三个群体分开。(B类)多尺度引导重采样(n个=10000)在非洲、亚洲和高加索个体之间显著差异甲基化的439个流行CpG位点。这三个种群分别聚集在一起,并与先前的遗传定义的亲缘关系一致(近似无偏P(P)-值>0.99)。(C类)pop-CpG的主成分分析(PCA)显示前两个主成分。(D类)流行CpG的ADMIXTURE分析确定了祖先DNA甲基化状态。每个个体都由一条垂直线表示,其长度对应于最多三个推断祖先群体的祖先系数。

利用流行CpG来分配大部分变异的主成分分析清楚地将样本与其群体身份区分开来,并将种族关系确定为最强的组成部分(图1C). 我们还进行了替代变量分析(SVA),以排除导致样本分离的协变量,而不是群体关联。SVA没有检测到任何替代变量,例如批处理效应,排除了影响结果的未知、未建模或潜在噪声源。为了确认群体中常见的祖先DNA甲基化状态,我们进行了混合,应用了三种DNA甲基化场景(非甲基化:<0.33;半甲基化:≥0.33,≤0.66;甲基化>0.66)。在这里,被分析的个体被分离到他们指定的群体中,显示出群体中共同的祖先DNA甲基化水平和群体之间不同的水平(图1D).

在439个pop-CpG中,178个位于基因启动子区域(包括51个非编码RNA启动子,GENCODE v13)(补充表S2),147个位于基因组中,114个位于遗传间区域(补充图S2A;补充表S1)。考虑到区域CpG组成和密度,104个pop-CpG映射到CpG岛屿,124个映射到Cp G岛屿海岸,36个映射到C pG岛屿陆架,175个映射在岛外(“公海”)(补充图S2B)。此外,我们分析了从439个pop-CpG的ENCODE项目中确定的LCL(GM12878)的全基因组表观遗传作图中提取的组蛋白占有率(Ernst等人,2011年). 分别分析启动子、基因体和基因间频率发现,pop-CpG在基因内区域增强子标记H3K27ac和H3K4me1以及基因间位点异染色质标记H3K9me3的阵列平台上的表达丰富(Fisher精确检验;P(P)<0.05)(补充表S3)。除了基因内增强子区域外,pop-CpG还揭示了CTCF标记的绝缘体位点的富集,并强调了启动子上下文以外的调控元件对人类自然变异的重要性。多假设检验强调了基因内区域H3K4me1(FDR=0.0324)和CTCF(FDR=0.0378)的pop-CpG显著富集(补充表S3)。

为了进一步剖析与差异甲基化pop-CpG位点相关的功能后果,我们对DNA序列基序进行了富集分析(补充图S3)。在启动子上下文之外,我们确定了与转录因子RREB1(ras反应元件结合蛋白1)相关的DNA模体在DNA甲基化阵列上的表达丰富(超几何检验;P(P)< 0.01). 有趣的是,基因内pop-CpG还揭示了增强子相关因子TFAP2A(转录因子激活增强子结合蛋白2α)等的结合位点的富集,突显了之前在基因体中发现的增强子关联组蛋白标记H3K27ac和H3K4me1的富集。在基因启动子区域,我们发现造血转录因子IRF1和SPIB显著富集(超几何检验;P(P)<0.01)等。因此,pop-CpG与积极调节基因表达的组蛋白修饰和转录因子结合相关,表明调节网络有助于观察到种群间的差异。

此外,我们旨在确定DNA甲基化和转录调控之间的关系。因此,我们整合了DNA甲基化和基因表达水平,并观察到在分析背景下12.9%(101个基因中的13个)pop-CpG相关基因中与启动子高甲基化相关的基因表达显著降低(皮尔逊相关检验;FDR<0.01)(补充图S4A)。这与先前报道的启动子DNA甲基化和基因表达之间总体关联性很低的研究一致(Kulis等人,2012年). 值得注意的是,基因体甲基化与23.9%的基因内pop-CpG的基因表达显著相关(113例中有27例;皮尔逊相关检验;FDR<0.01)(补充图S4B)。这里,DNA甲基化的增加分别与63.0%(27例中的17例)和37.0%(27例之中的10例)的基因抑制和激活相关。

人群特异性差异甲基化导致人类自然变异

我们预计基因启动子中的DNA甲基化与基因表达直接相关,因此我们提取了启动子相关的pop-CpG。我们想知道在其启动子中含有pop-CpG的基因是否有助于解释CA、AS和AF人群之间众所周知的表型变异。在这方面,pop-CpG位于与人类自然变异相关的基因中,例如异种代谢和转运(GSTT1号机组,GSTM5公司,ABCB11型,SPATC1L系列),味觉传感器(TAS1R3号机组)、环境信息处理和适应(ARNTL公司,减贫战略3,CNR2型),免疫反应因子(CERK公司,LCK公司,CD226型,9月8日),生长因子(FGFR2型),角朊细胞相关基因(KRTCAP3号机组)和黑色素生成(CREB3L3级). 我们还观察到,在不同人群(如糖尿病)中,与疾病不同外显率相关的基因中存在pop-CpG(HLA-B/C型,PRKCZ公司),帕金森氏病发作(PM20D1项目)、HIV感染(HIVEP3公司,HTATIP2型,川东北11B),肠致病性大肠杆菌和麻疹病毒感染(FYN公司)和乙型肝炎病毒感染(HLA-DPA1抗原). 这些基因及其DNA甲基化差异在人类群体中的示例如所示图2.

保存图片、插图等的外部文件。对象名为1363fig2.jpg

不同甲基化基因启动子KRTCAP3号机组(A类),TNNT1公司(B类),9月8日(C类),CD226型(D类),PM20D1型(电子)、和FGFR2型(F类)在汉族华裔美国人(黄色)、白人美国人(粉红色)和非裔美国人(棕色)个体中。显示单个个体基因启动子中群体特异性CpG位点的绝对DNA甲基化水平(低:绿色;高:红色)(n个= 269). 指示到基因转录起始位点的距离。样本根据其平均DNA甲基化水平进行排序(中间的面板)。人口富集(正确的面板)在10个样本窗口中使用绝对样本数进行说明。

为了区分中性位点的随机漂移和可能因局部选择而加速分化的CpG位点,我们纳入了来自三个亚种的14只黑猩猩个体的数据(非洲中西部的黑猩猩,Pan troglodytes verus公司,黑猩猩)作为分析中的外群体,因为这是我们最亲近的在世亲属。阳性选择的CpG位点通过确定人类和具有单个人类异常群体的黑猩猩之间的共同祖先位点进行评估(ANOVA和Tukey HSD事后检验,P(P)<0.05)(补充表S4)。我们确定了39个可能在当地选择压力下进化的CpG位点。这些CpG局部适应位点包括免疫(CERK公司,川东北11B,HTATIP2型)和外来生物(GSTT1号机组,SPATC1L系列)反应因子,表明它们可能是由当地病原体和环境压力的差异驱动的。特别地,SPATC1L系列(精子发生和中心粒相关1样)是一个有趣的例子,因为它以前与烷基化剂的反应有关,这表明表观变异导致了化疗的可变反应(Fry等人,2008年). 人们还很容易推测,导致多态性的选择压力源自亚硝胺等致癌物,亚硝胺在鸟嘌呤碱上引入烷基,而这是烷基化药物使用的机制。

群体特异性表观遗传和遗传变异之间的相互对话

我们想知道潜在遗传变异对特征pop-CpG的影响。基因就是与种族相关的表观遗传和遗传标记之间联系的一个例子SPATC1L系列:之前在使用约鲁巴人进行的低分辨率(27000个CpG位点)筛查中,它被确定为CpG甲基化数量性状位点(meQTL)和表达数量性状位点(Bell等人,2011年). QTL描述了单核苷酸多态性(SNP)与甲基化或表达事件之间的直接关联。因此,基因表达或CpG位点甲基化(外显型)与潜在遗传序列(基因型)直接相关。在本研究中,我们不仅验证了甲基化和SPATC1L系列,但也证实了非洲裔美国人的整个启动子区域存在差异甲基化,基因表达与潜在基因型之间存在高度相关性(图3). 为此,我们鉴定了四个位于5′端的pop-CpG,它们在非洲裔美国人中甲基化程度不同,并与基因表达直接相关(图3; 补充图S5A)。所有四个启动子相关的流行CpGSPATC1L系列被指定为与单个SNP位点相关的meQTL(rs8133082)(图3; 补充图S6A)。有趣的是,我们在CpG岛上发现了三个与SPATC1L系列DNA甲基化、基因表达和基因型与启动子区的相关性完全相反(图3; 补充图S5B、S6B)。具有低甲基化和活性启动子的个体在TES处表现出高甲基化(皮尔逊的产物-分子相关性,rho=0.89)(补充图S7)。活性转录的TES的超甲基化SPATC1L系列可能会削弱先前确定的发生在终止位点的反义转录的高频率(He等人,2008年).

保存图片、插图等的外部文件。对象名为1363fig3.jpg

基因型和DNA甲基化调节SPATC1L系列在转录起始点(TSS)和终止点(TES)以连合的方式和负相关。(A类)基因结构示意图SPATC1L系列. (B类)AF患者启动子DNA甲基化水平高,rs8133082中TT表型丰富SPATC1L系列图中显示了非洲裔美国人(棕色)、高加索裔美国人(粉红色)和汉族华裔美国人(黄色)个体的四种与启动子相关的pop-CpG的绝对DNA甲基化水平(低:绿色;高:红色);单个样本的rs8133082基因型(GG、GT、TT);DNA甲基化(cg08742575)与基因型(rs8133082)的相关性;和基因表达水平(SPATC1L系列). 样本根据平均CpG甲基化值进行排序。(C类)与启动子不同,AF个体具有CpG低甲基化,这与SPATC1L系列基因表达(cg11766577)。

根据最初的观察SPATC1L系列,我们将meQTL的搜索扩展到439个pop-CpG的整个集合。我们发现68%(439个差异甲基化CpG位点中的298个)与潜在遗传变异显著相关(596个SNP,随机森林选择频率,FDR<0.05)(补充表S5)。由于随机选择的439个CpG位点中只有13%显示出遗传关联,因此我们排除了本研究中询问的CpG基因位点的表型-基因型关联的常见事件(Fisher精确检验,P(P)< 0.01). 为了排除基于群体间遗传差异的混杂效应导致pop-CpG甲基化水平与潜在基因型相关的观点,我们分别对这三个群体进行了meQTL分析。重要的是,我们证实了三个群体中至少一个群体的遗传背景与meQTL中91.6%(298个群体中的273个)的关联,表明检测到的关联主要独立于种族变异。此外,我们旨在通过分析159个代表三种不同实体组织类型的正常原代标本,来探讨表型-基因型关联的组织特异性。利用癌症基因组图谱(TCGA)提供的基因型和DNA甲基化数据,我们确定了60.7%(298个组织类型中的181个)meQTL中pop-CpG位点与潜在遗传背景的关联,这表明两层之间的相互作用部分独立于细胞类型上下文。特别是,我们确认40.6%的乳房、38.9%的结肠和32.6%的肺组织样本中存在与血液相关的meQTL。值得注意的是,meQTL位于相关SNP位点附近,69%(596个中的412个)存在于15kb窗口内,38%(596个中的227个)存在于5kb窗口内(补充图S8)。

然而,对于其余32%的pop-CpG,在CpG位点的遗传背景和变异性之间没有检测到直接关系。我们排除了遗传关联的缺失是由于pop CpG周围±1-Mb区域SNPs数量不均匀造成的可能性,因为这表明两组在分析的区域中都有相似数量的SNPs(补充图S9)。所分析的窗口还具有相同的重复元素覆盖率(正弦、直线、LTR),因此具有相同的识别SNP的能力(补充图S10)。有趣的是,与潜在表观遗传CpG位点相关的基因启动子与免疫反应成分有关(FYN公司,CD226型,HIVEP3公司)(补充表S1)并针对NFKB的转录因子结合位点进行了富集(z(z)-测试;传输:FDR=0.0195;JASPAR:FDR=0.0057),一种参与免疫防御系统的转录因子,可防止病毒(即乙型肝炎)和细菌(即志贺氏菌病)病原体感染。这就增加了环境中的病原体在人类宿主的表观基因组中留下稳定指纹的可能性。

值得注意的是,当我们询问上述三种主要组织类型时,我们在66.0%的病例(141例中有93例)中没有发现潜在表观遗传CpG位点的进一步遗传关联,这支持了它们的遗传独立性。在这方面,比例分析检测到初始LCL样本集和主要样本之间检测基因型-外显型关联的能力没有差异(χ2检验;OR:1.13,P(P)=0.51),强调了研究设计的可靠性。

群体特异性差异甲基化可能在遗传变异的全基因组关联研究中有用

与差异甲基化pop-CpG相关的SNP中只有13%(596个中有79个)位于外显子区域,因此可以与功能基因改变直接相关(补充表S6)。因此,我们假设DNA甲基化在解释人类个体之间的遗传变异时呈现出一个很少被认识但信息量很大的水平。全基因组关联研究(GWAS)中对遗传变异的综合分析经常揭示基因型-表型的联系。这些包括许多与表型直接相关的多态性,但位于功能未知的基因间或内含子区域。研究遗传和表观遗传调控之间的密切相互作用可以帮助解释这些联系,否则很难解释。在这方面,DNA甲基化可能显示出一个强有力的中间事件,这可能有助于解释GWAS结果。因此,我们进行了基于模型的基因集分析(Bauer等人,2011年)比较与GWASdb提供的pop-CpG和GWA研究直接相关的SNP(Li等人,2012年). 我们发现一些与初潮年龄和艾滋病毒控制有关的有趣联系;特别是,我们通过检测与CpG位点直接相关的6个SNP,确定了乙型肝炎感染的高度显著富集,这些SNP在人群之间存在差异甲基化(富集分数:0.99)(补充表S7;Bauer等人,2011年). 这六个SNP位于HLA-DPA1抗原HLA-DPB1型与慢性乙型肝炎病毒(HBV)感染密切相关的基因座(Kamatani等人,2009年). 同时,HBV感染风险等位基因在发病率较高的人群中更为丰富,例如亚洲人或非洲血统的人群。然而,没有一个SNPs位于编码环境中,这使得很难将遗传变异和风险表型联系起来。功能上HLA-DPA1抗原-和HLA-DPB1型-相关SNPs被定义为eQTL,因此与基因表达直接相关(O'Brien等人,2011年),尽管监管机制仍然难以捉摸。

在这里,我们将GWAS结果整合到差异DNA甲基化分析中,确定基因变异和位于HLA-DPA1抗原轨迹。特别是,10个HBV感染相关SNP(Kamatani等人,2009年)与17个CpG位点显著相关HLA-DPA1抗原位点(皮尔逊相关,ρ>0.6)(图4; 补充表S8)。风险等位基因与CpG甲基化改变有关,在亚洲和非洲人群中发生频率较高。具体来说,风险等位基因与基因启动子中的DNA超甲基化有关HLA-DPA1抗原与基因表达呈负相关(图4; 补充图S11)。基因启动子的超甲基化HLA-DPA1抗原与基因体内的DNA低甲基化有关,这也与较低水平的基因表达有关(琼斯2012). 因此,我们发现DNA甲基化与HLA-DPA1抗原亚洲和非洲个体的基因抑制,确定介导DNA甲基化变异和基因抑制的风险等位基因。这些导致细胞表面受体呈现的变化以及HBV结合和感染风险的改变。因此,我们认为DNA甲基化可能是连接基因型(风险等位基因)、基因表达(eQTL)和表型(感染发生率)的未知调控事件。

保存图片、插图等的外部文件。对象名为1363fig4.jpg

HBV感染相关的遗传多态性影响DNA甲基化和基因表达HLA-DPA1抗原轨迹。使用马戏团(Krzywinski等人,2009年),该图显示了HLA-DPA1抗原来自非洲裔美国人(棕色)、白人裔美国人(粉红色)和汉族华裔美国人(黄色)个体的基因座和DNA甲基化、基因型和表达数据:CpG位点的DNA甲基化水平(低:绿色;高:红色)(n个=17)与HBV感染相关SNP的基因型显著相关(n个= 10) (Kamatani等人,2009年). 样本根据平均CpG甲基化值进行排序。SNP-CpG关系用彩色线显示。SNPs在HLA-DPA1抗原显示了基因座,它与CpG甲基化水平显著相关(灰色方框;危险等位基因以红色突出显示)(Kamatani等人,2009年). 表达水平的分布HLA-DPA1抗原显示在蓝色框中。

讨论

表观遗传修饰,特别是DNA甲基化,提供了一层对表型有很大影响的基因调控。它在人类癌症中得到了广泛的研究。然而,在疾病背景之外,很少有与表型差异直接相关的表观遗传变异的例子。有趣的是,最近一项针对不同类型蜜蜂的全基因组表观遗传学分析揭示了哺乳蜜蜂和觅食蜜蜂在不同基因组位点上的DNA甲基化差异,这表明尽管基因相同,但蜜蜂的社会行为与它们的表观遗传学特征直接相关(Herb等人,2012年). 虽然这项研究是在另一物种中进行的,但它揭示了DNA甲基化变化对疾病背景以外的不同人类表型的潜在影响。我们一直致力于确定人类群体之间的DNA甲基化差异及其与人类物种中发生的自然表型变异的关联。在这里,使用高加索-美国、非洲-美国和汉族-华裔个体之间差异甲基化的439个CpG位点,我们能够根据地理起源完美地分离不同的人群,并将其与不同的表型特征联系起来,例如外表、药物代谢、,对外部刺激、感觉和疾病易感性的反应。重要的是,局部选择压力可以诱导表观遗传变异的表现,例如免疫和外源性反应因子,以及它们通过局部病原体和环境压力的差异而进行的潜在正选择。

利用分析样本在遗传水平上的综合特征,我们能够查询基因型-外显型关联,以进一步区分遗传-基因型依赖和独立的两种类型。尽管如此,DNA甲基化通常显示出对基因型的低依赖性(Bell等人,2011年,2012),三分之二的人群特异性CpG位点与潜在遗传背景直接相关,表明进化设定的遗传背景影响DNA甲基化,而DNA甲基化随后作为介导群体间表型差异的中间调节事件发挥作用。在这里,与潜在基因型和表型直接相关的乙型肝炎感染风险以及这些基因型和外型在受影响人群中的富集是两个组织层之间紧密相互作用的一个例证。Feinberg和Irizarry从正常人和小鼠组织的高分辨率DNA甲基化分析结果中得出了类似的因果关系(范伯格和伊里扎里2010). 这些研究人员认为,随着时间的推移,区域CpG密度的变化是物种间DNA甲基化变化的原因。在非洲和欧洲人群的LCL样本中也观察到甲基化数量性状位点的基因型-外显型关联(Bell等人,2011年;弗雷泽等人,2012年)和人脑样本(Gibbs等人,2010年;Zhang等人,2010年)强调了他们的密切联系。因此,群体特异性基因座的DNA甲基化变异遵循与遗传变异研究中所见相似的趋势,表明这两个水平具有相似的变异模式和潜在的相关选择标准(Li等人2008a).

有趣的是,三分之一的差异甲基化基因座与遗传变异没有直接关系,这表明表观变异可能独立于编码序列(Rando 2012年). 在这方面,外部刺激,如有毒异种生物(Anway等人,2005年;Zeybel等人,2012年)以及饮食或激素暴露的差异(de Assis等人,2012年)或压力(Seong等人,2011年)已知它们会诱导表观遗传变化,对后代产生影响,也可能是此处观察到的种群差异的来源。检测富含潜在表观遗传CpG位点的免疫系统相关基因表明,病原体对宿主DNA图谱的影响(Paschos和Allday 2010)随后在其后代的表观基因组中留下足迹。然而,我们不能完全排除这些潜在表观遗传pop-CpG位点缺乏遗传关联是基于本研究中未建模或未测量的成分。尽管我们应用了多元方法并研究了大基因组区域,反式-作用多态性或SNP阵列平台上不存在的多态性可能揭示未报告为meQTL的外显型关联。在此,使用严格的阈值来确定群体间差异甲基化CpG位点,研究设计倾向于选择高频变量,因此未测量的低频多态性不属于本研究的范围,它们的缺失只会对meQTL的识别产生最小的影响。值得注意的是,种群之间的环境差异(例如饮食偏好)可能会影响生殖系细胞的外显类型,但也可能直接影响此处分析的体细胞类型的DNA甲基化水平。

总之,我们已经确定了区分三个主要人类种族的DNA甲基化差异。尽管其中许多基因与潜在的遗传变化有关,表明遗传和表观遗传密码之间存在直接关系,但其他基因单独作为表观遗传标记和与我们物种自然变异相关的CpG甲基化数量性状位点。因此,DNA甲基化可能是导致不同表型特征的原因之一,例如人类群体之间发生的药物反应和疾病频率的差异。从调控的角度来看,我们提出了一种假设,即遗传和表观遗传背景设定了进化上确定的蓝图,从而导致表型变异。检测人群中不同的pop-CpG位点表明,差异和选择压力不仅影响遗传密码,还影响DNA甲基化景观。

方法

样品描述

从人类变异小组(样本集HD100AA、HD100CAU、HD100CHI、Coriell细胞库)中包含的淋巴母细胞系中获得了96个非血缘健康白人美国人、96个非洲美国人和96个亚裔美国人的DNA样本。这些样本由国家普通医学科学研究所(NIGMS)收集并匿名,所有受试者都提供了实验使用的书面同意书。样品处理以随机方式进行,以避免批量效应。高加索裔美国人的性别分布(男性频率)和平均年龄(±标准差)分别为0.5和37.3±16.2岁,非裔美国人为0.2和29.4±9.9岁,汉族美国人为0.5和36.2±15.7岁。从无血缘关系的健康白人和亚洲献血者的外周血单个核细胞中提取原始血样的DNA。这些样本由Bellvitge生物医学研究所(IDIBELL)和国家儿童健康与发展研究所(NRICHD)收集并匿名,所有受试者都提供了实验使用的书面同意书。此前已经公布了来自非洲个体原始血液样本的DNA甲基化数据(Alisch等人,2012年). 白种人样本各种族的性别分布(男性频率)和平均年龄(±标准差)分别为0.5岁和27.7±2.8岁,非洲人样本为1.0岁和3.8±3.7岁,亚洲人样本为0.3岁和33.0±3.4岁。

正常乳腺原始样本的基因型和DNA甲基化数据(n个=78),冒号(n个=38)和肺(n个=32)组织取自癌症基因组图谱(TCGA)数据门户(https://tcga-data.nci.nih.gov/tcga网站).

Infinium HumanMethylation450珠片

通过1.3%琼脂糖凝胶电泳、皮绿定量和纳米液滴测量来评估所有DNA样品的完整性、数量和纯度。所有样本均随机分配到96个平板中。按照制造商的说明,使用EZ DNA甲基化试剂盒(Zymo Research)进行500 ng基因组DNA的亚硫酸氢盐转化。200毫微克的亚硫酸氢盐转化DNA被用于人类甲基化450珠芯片(Illumina)上的杂交。简单地说,对样品进行全基因组扩增,然后进行酶终点裂解、沉淀和再悬浮。将再悬浮样品在48°C的温度下与珠片杂交16小时,然后清洗。用标记的二脱氧核苷酸进行单核苷酸延伸,并用区分生物素和DNP的标记抗体组合进行重复染色。

使用lumi进行三步归一化程序(Du等人,2008年)可用于Bioconductor的软件包(绅士等人2004),在R统计环境中(R开发核心团队2009),包括颜色偏差调整、背景水平调整和跨数组的分位数规范化(Du等人,2008年). 485577个CpG位点中每个位点的甲基化水平(β值)计算为甲基化信号除以甲基化和非甲基化信号之和再加100的比率。在归一化步骤后,我们删除了与X和Y染色体相关的探针,以及那些SNP频率>1%的探针(2010年1000基因组计划联盟)在探针序列中或被询问的CpG位点。所有分析均在人类基因组版本18或19(hg18/19)中进行。然而,为了排除潜在拷贝数变化的区域,我们集成了一个数据集(Redon等人,2006年)这只在hg17版本中可用。因此,我们使用UCSC的LiftOver工具将阵列平台上表示的位点转换为旧基因组版本(hg19到hg17)的坐标。随后,所有与CNV相关且频率高于5%的探针均被排除在研究之外。

分层聚类

样本采用曼哈顿距离的完全聚集法通过层次聚类进行组织。使用pvclust从10000个引导样本中评估集群的强度(铃木和岛岛一郎2006)包可用于R统计环境。我们还使用439个随机CpG位点计算了10000个聚类,以确保该聚类不是基于样本和群体之间的全基因组差异生成的。

替代变量标识

为了确定可能影响甲基化水平的潜在因素,我们进行了替代变量分析,如韭菜和故事(2007)我们使用这些研究人员提供的SVA11 R包,并运行两步协议,以确定需要估计的潜在因素的数量,并确定替代变量。

外加剂

为了描述每个个体的祖先等位基因甲基化状态,我们将β值离散为三个阶段,模拟人类基因组的二倍体结构。β值<0.33的位点注释为具有AA等位基因。β值>0.66的人被指定为BB等位基因。所有其他基因座都被认为是AB等位基因。我们运行了PLINK软件(Purcell等人,2007年)使用这些数据以PLINK格式存储系谱/表型信息,然后使用ADMIXTURE程序根据多位点SNP(离散化β值)对个体祖先进行最大似然估计,如Alexander等人(2009年).

人群特异性DNA甲基化的鉴定(pop-CpGs位点)

为了确定群体间差异甲基化的CpG位点,我们排除了具有异常全基因组DNA甲基化特征的异常样本,以避免未建模来源对结果的影响。通过对不重叠SNP或CNV或位于特定性别染色体上的CpG位点进行主成分分析(前两个主成分解释了27%的变异),我们排除了11个高加索和8个非洲样本,这些样本不在95%置信区间内。通过选择CpG位点来测量三个群体的单个CpG部位的差异甲基化分析,两个群体之间的平均甲基化绝对差异在0.12以上,β值(范围从0到1)。采用Tukey HSD事后检验进行方差分析,CpG位点显示FDR调整P(P)-值<0.01被认为是种群间的差异甲基化。随后,使用来自10名白人、10名非洲人和10名亚洲人的一组原始血液样本作为过滤器,以排除EB病毒永生化淋巴母细胞系带来的副作用。因此,阵列是分位数标准化的,群体间平均甲基化绝对差异>0.12的CpG位点被认为是群体特异性CpG部位(pop-CpG)。

局部选择性压力下pop-CpGs位点的鉴定

为了定义局部选择性压力产生的pop-CpG位点,我们整合了14只黑猩猩(4只)全血DNA的DNA甲基化数据(Infinium HumanMethylation450 BeadChip)P.t.schweinfurthii公司; P.t.verus公司; P.t.三角石; 三个来源不明),将其作为外群。

因为Infinium HumanMethylation450珠芯片设计用于人类参考基因组,我们首先使用BWA将探针映射到黑猩猩基因组(Pan_troglodytes-2.1.4)(李和杜宾2009)并允许三个编辑距离。我们只保留了在参考黑猩猩基因组中明确定位到单个位置的常染色体探针,以及在5′45 bp中具有完美匹配或一个不匹配且在3′5 bp中没有不匹配的探针(最接近正在分析的CpG位点)。我们还排除了带有检测功能的探针P(P)-至少一个人的值>0.01。此过滤步骤导致299924个探针保留(66.6%)。使用这个CpG位点的保守子集,我们对来自两个通道的混合信号进行了双色通道信号调整和人类和黑猩猩样本的分位数归一化,并重新计算了平均β值(Du等人,2008年). 具有单个人类异常群体的CpG位点(用Tukey HSD事后检验进行方差分析,P(P)<0.05)被认为是在局部选择性压力下进化的。

表达式分析

使用GEO数据库(GSE24277)中的人类基因组U133 Plus 2.0表达微阵列(Affymetrix)获得分析样本的表达数据。由于没有表达数据,总共排除了24名白人美国人、6名非洲裔美国人和1名汉族华裔美国人样本。使用affy将表达式数组加载到R统计环境中(Gautier等人,2004年)包,并使用RMA方法进行规范化,如中所述Irizarry等人(2003年)使用Pearson相关系数计算DNA甲基化与表达之间的相关性。P(P)-经多假设检验校正后,低于0.01的值被认为是显著的。

meQTL识别

分析样本的基因型信息来自一组HumanHap550k和HumanHab650k SNP阵列(Illumina),可在GEO数据库(GSE24260、GSE24274)中获得。数据集被合并成一个包含660919个独特SNPs的单一表格。由于基因分型数据不可用,共有24名白种人、7名非洲裔美国人和2名汉族人样本被排除在后续分析之外。

439个差异甲基化位点的meQTL是通过询问位于CpG位点侧翼的±1-Mb窗口中的SNPs来鉴定的。如果该窗口包含1000个以上的SNP,则会以100-kb的间隔缩小。我们使用了随机森林选择频率(RFSF)多元方法,如Michaelson等人(2010年),以确定单个CpG位点上的独特SNP或多个SNP的加性效应。与其他方法相比,该方法性能良好,能够识别作用于特征的多个SNP(迈克尔森等人,2009年,2010).

randomForest算法在randomForest包的R中实现(Liaw和Wiener 2002). 首先,我们调用随机森林算法生成2000棵树进行回归,并计算回归模型构建中使用的变量(SNP)的选择频率(SF)。然后,通过减去零假设下变量的SF(SNP和甲基化值之间没有关联)与零假设下所有变量的平均SF之间的偏差,对频率进行偏差校正;我们使用10棵树的1000个森林来获得零假设下的SF,从随机分布中生成甲基化矩阵,并对原始SF进行校正。最后,为了获得多态位点的SF与外显型的关联程度,我们通过排列样本的SNP值,从2000棵树的10个森林的SF构建了一个经验分布,报告了一个-通过将其SF与原假设下的SF进行比较,得出每个SNP的值。

GWAS相关多态性的富集分析

为了建立遗传变异性、DNA甲基化水平和不同表型之间的因果关系,我们确定了GWASdb可用的整套GWA研究中meQTL相关SNP的富集(Li等人,2012年)使用基于模型的基因集分析(Bauer等人,2011年). 该方法通过将所有类别嵌入贝叶斯网络,一次分析所有类别。概率推理用于识别活动类别,给出分数,即将自然权重与每个术语关联的概率,反映其参与过程的确定性。

序列基序富集分析

使用GADEM软件从头发现启动子相关、基因内或基因间pop-CpG的基序(李2009),在感兴趣的CpG两侧使用最大50 bp的窗口(电子-值<0.05)。随后,使用JASPAR将序列基序指定给人类转录因子结合位点(Bryne等人,2008年),同时使用Motif识别和验证(Motif Identification and Validation)去除人造和背景图案(Mercier等人,2011年). 我们计算了浓缩P(P)-基于pop-CpG位点基序超几何分布的值,相对于它们在搜索空间中的丰度(DNA甲基化BeadChip)。超几何测试报告了与BeadChip上表示的所有CpG位点中存在的数字相比,获得pop-CpG集合中模体点击数的概率。这个P(P)-分别计算启动子、基因体相关和基因间CpG位点的值。

使用PSCAN对启动子中无遗传关联的pop-CpG位点进行转录因子富集分析(赞贝利等人,2009年). 由TRANSFAC或JASPAR定义的转录因子结合注释被独立使用。基因启动子区域被定义为距离基因转录起始位点的−950和+50 bp。Z试验P(P)-使用Bonferroni方法对多假设测试的值进行了校正。

数据访问

为本研究生成的DNA甲基化数据已提交给NCBI基因表达综合数据库(GEO;网址:http://www.ncbi.nlm.nih.gov/geo/)注册号为GSE36369。

致谢

导致这些结果的研究获得了欧洲研究委员会(ERC)根据协议号268626授予EPINORC的资金,ERC启动拨款(260372),NIH授予CA138461和GM61388(药物基因组学研究网络),MICINN项目SAF2011-22803和BFU2011-28549,Cellex基金会,欧洲共同体第七框架计划(FP7/2007-2013),由HEALTH-F5-2011-282510(BLUEPRINT)拨款,以及加泰罗尼亚共和国卫生和科学部。I.H.H.是加泰罗尼亚将军(FI 2011)的研究员。T.M.B.和M.E.是ICREA的研究教授。

作者贡献:H.H.、S.M.和M.E.构思并设计了实验,分析了数据,并撰写了手稿。I.H.-H.、S.S.、A.G.、J.S.、D.M.、K.H.、T.M.-B.和L.W.提供了分析工具,并选择了受试者进行DNA甲基化分析。所有作者都参与了最后的手稿。

脚注

[本文有补充材料。]

文章印刷前在网上发布。文章、补充材料和发布日期位于http://www.genome.org/cgi/doi/10.1101/gr.154187.112.

通过免费在线提供基因组研究打开Access选项。

工具书类

  • 1000基因组计划联盟2010人群规模测序的人类基因组变异图.自然 467: 1061–1073[PMC免费文章][公共医学][谷歌学者]
  • Alexander DH、Novembere J、Lange K2009.基于模型的无关个体血统快速估计.基因组研究 19: 1655–1664[PMC免费文章][公共医学][谷歌学者]
  • Alisch RS、Barwick BG、Chopra P、Myrick LK、Satten GA、Conneely KN、Warren ST2012儿童人群中与年龄相关的DNA甲基化.基因组研究 22: 623–632[PMC免费文章][公共医学][谷歌学者]
  • Anway MD、Cupp AS、Uzumcu M、Skinner MK2005内分泌干扰物的表观遗传跨代作用与男性生育.科学类 308: 1466–1469[PMC免费文章][公共医学][谷歌学者]
  • Bauer S、Robinson PN、Gagneur J2011基于模型的生物导体基因集分析.生物信息学 27: 1882–1883[PMC免费文章][公共医学][谷歌学者]
  • Bell JT、Pai AA、Pickrell JK、Gaffney DJ、Pique-Regi R、Degner JF、Gilad Y、Pritchard JK2011DNA甲基化模式与HapMap细胞系的遗传和基因表达变异相关.基因组生物学 12:R10。[PMC免费文章][公共医学][谷歌学者]
  • Bell JT、Tsai P-C、Yang T-P、Pidsley R、Nisbet J、Glass D、Mangino M、Zhai G、Zhang F、Valdes A等人。2012表观基因组扫描确定健康老龄人群中年龄和年龄相关表型的差异甲基化区域.PLoS基因 8:e1002629。[PMC免费文章][公共医学][谷歌学者]
  • Bryne JC、Valen E、Tang M-HE、Marstrand T、Winther O、da Piedade I、Krogh A、Lenhard B、Sandelin A2008JASPAR,转录因子结合图谱的开放存取数据库:2008年更新中的新内容和工具.核酸研究 36:D102–D106[PMC免费文章][公共医学][谷歌学者]
  • de Assis S、Warri A、Cruz MI、Laja O、Tian Y、Zhang B、Wang Y、Huang TH-M、Hilakivi-Clarke L2012怀孕期间摄入高脂肪或炔雌醇会增加几代后代患乳腺癌的风险.国家公社 : 1053.[PMC免费文章][公共医学][谷歌学者]
  • Dedeuwaerder S、Defrance M、Calonne E、Denis H、Sotiriou C、Fuks F2011Infinium甲基化450K技术的评估.表观基因组学 : 771–784 [公共医学][谷歌学者]
  • Du P、Kibbe WA、Lin SM2008卢米:处理Illumina微阵列的管道.生物信息学 24: 1547–1548 [公共医学][谷歌学者]
  • ENCODE项目联盟2012人类基因组中DNA元素的综合百科全书.自然 489: 57–74[PMC免费文章][公共医学][谷歌学者]
  • Ernst J、Kheradpour P、Mikkelsen TS、Shoresh N、Ward LD、Epstein CB、Zhang X、Wang L、Issner R、Coyne M等。2011九种人类细胞染色质状态动力学的定位和分析.自然 473: 43–49[PMC免费文章][公共医学][谷歌学者]
  • 范伯格AP2007表型可塑性与人类疾病的表观遗传学.自然 447: 433–440 [公共医学][谷歌学者]
  • Feinberg AP,Irizarry RA2010健康和医学的进化Sackler座谈会:随机表观遗传变异作为发展、进化适应和疾病的驱动力.国家科学院程序(补充1)107: 1757–1764[PMC免费文章][公共医学][谷歌学者]
  • Fraga MF、Ballestar E、Paz MF、Ropero S、Setien F、Ballester ML、Heine-Suñer D、Cigudosa JC、Urioste M、Benitez J等。2005单卵双胞胎一生中出现表观遗传差异.国家科学院程序 102: 10604–10609[PMC免费文章][公共医学][谷歌学者]
  • Fraser HB、Lam L、Neumann S、Kobor MS公司2012人类DNA甲基化的群体特异性.基因组生物学 13:R8。[PMC免费文章][公共医学][谷歌学者]
  • Fry RC、Svensson JP、Valiathan C、Wang E、Hogan BJ、Bhattacharya S、Bugni JM、Whittaker CA、Samson LD2008DNA损伤剂反应个体间差异的基因组预测因子.基因开发 22: 2621–2626[PMC免费文章][公共医学][谷歌学者]
  • Gautier L、Cope L、Bolstad BM、Irizarry RA2004affy分析Affymetrix基因芯片探针级别的数据.生物信息学 20: 307–315 [公共医学][谷歌学者]
  • RC、Carey VJ、Bates DM、Bolstad B、Dettling M、Dudoit S、Ellis B、Gautier L、Ge Y、Gentry J等人。2004生物导体:计算生物学和生物信息学的开放软件开发.基因组生物学 5:R80。[PMC免费文章][公共医学][谷歌学者]
  • Gibbs JR、van der Brug议员、Hernandez DG、Traynor BJ、Nalls MA、Lai S-L、Arepalli S、Dillman A、Rafferty IP、Troncoso J等人。2010人脑中存在大量DNA甲基化和基因表达的数量性状位点.PLoS基因 6:e1000952。[PMC免费文章][公共医学][谷歌学者]
  • He Y、Vogelstein B、Velculescu VE、Papadopoulos N、Kinzler KW2008人类细胞的反义转录体.科学类 322: 1855–1857[PMC免费文章][公共医学][谷歌学者]
  • Herb BR、Wolschin F、Hansen KD、Aryee MJ、Langmead B、Irizarry R、Amdam GV、Feinberg AP2012蜜蜂行为亚群表观遗传状态之间的可逆转换.自然神经科学 15: 1371–1373[PMC免费文章][公共医学][谷歌学者]
  • Irizarry RA、Hobbs B、Collin F、Beazer-Barclay YD、Antonellis KJ、Scherf U、Speed TP2003高密度寡核苷酸阵列探针水平数据的探索、规范化和总结.生物统计学 4: 249–264 [公共医学][谷歌学者]
  • 宾夕法尼亚州琼斯2012DNA甲基化的功能:岛、起始位点、基因体及其他.Nat Rev基因 13: 484–492 [公共医学][谷歌学者]
  • Kamatani Y、Wattanapokayakit S、Ochi H、Kawaguchi T、Takahashi A、Hosono N、Kubo M、Tsunoda T、Kamatani-N、Kumada H等。2009.一项全基因组关联研究确定了与亚洲人慢性乙型肝炎相关的HLA-DP位点变异.自然基因 41: 591–595 [公共医学][谷歌学者]
  • Kaminsky ZA、Tang T、Wang S-C、Ptak C、Oh GHT、Wong AHC、Feldcamp LA、Virtanen C、Halfvarson J、Tysk C等。2009.单卵和双卵双胞胎的DNA甲基化特征.自然基因 41: 240–245 [公共医学][谷歌学者]
  • Kilpinen H,Dermitzakis ET公司2012遗传和表观遗传对复杂性状的贡献.人类分子遗传学 21:R24–R28[公共医学][谷歌学者]
  • Krzywinski M、Schein J、Birol I、Connors J、Gascoyne R、Horsman D、Jones SJ、Marra MA2009.马戏团:比较基因组学的信息美学.基因组研究 19: 1639–1645[PMC免费文章][公共医学][谷歌学者]
  • Kulis M、Heath S、Bibikova M、QueiróS AC、Navarro A、Clot G、Martínez-Trillos A、Castellano G、Brun-Heath I、Pinyol M等。2012表观基因组分析检测慢性淋巴细胞白血病中广泛存在的基因体DNA低甲基化.自然基因 44: 1236–1242 [公共医学][谷歌学者]
  • Lachance J、Vernot B、Elbers CC、Ferwerda B、Froment A、Bodo J-M、Lema G、Fu W、Nyambo TB、Rebbeck TR等。2012不同非洲狩猎采集者高覆盖率全基因组序列的进化历史和适应.单元格 150: 457–469[PMC免费文章][公共医学][谷歌学者]
  • Leek JT、Storey JD2007通过替代变量分析捕捉基因表达研究中的异质性.PLoS基因 :e161[PMC免费文章][公共医学][谷歌学者]
  • 李L2009.GADEM:一种遗传算法引导的间隔二元结构的形成,与用于模体发现的EM算法相结合.计算机生物学杂志 16: 317–329[PMC免费文章][公共医学][谷歌学者]
  • 李H,杜宾R2009.使用Burrows-Wheeler变换快速准确地进行短读对齐.生物信息学 25: 1754–1760[PMC免费文章][公共医学][谷歌学者]
  • Li JZ、Absher DM、Tang H、Southwick AM、Casto AM、Ramachandran S、Cann HM、Barsh GS、Feldman M、Cavalli-Sforza LL等。2008年a。从全基因组变异模式推断全球人类关系.科学类 319: 1100–1104 [公共医学][谷歌学者]
  • Li L、Fridley B、Kalari K、Jenkins G、Batzler A、Safgren S、Hildebrandt M、Ames M、Schaid D、Wang L2008年b。吉西他滨和阿糖胞苷的细胞毒性:与淋巴母细胞表达的关系.癌症研究 68: 7050–7058[PMC免费文章][公共医学][谷歌学者]
  • Li MJ、Wang P、Liu X、Lim EL、Wang Z、Yeager M、Wong MP、Sham PC、Chanock SJ、WangJ2012GWASdb:通过全基因组关联研究确定的人类遗传变异数据库.核酸研究 40:D1047–D1054[PMC免费文章][公共医学][谷歌学者]
  • Liaw A、Wiener M2002基于randomForest的分类和回归.R新闻 2: 18–22[谷歌学者]
  • Mercier E、Droit A、Li L、Robertson G、Zhang X、Gottardo R2011ChIP-Seq转录因子结合位点全基因组分析的集成管道.公共科学图书馆 6:e16432。[PMC免费文章][公共医学][谷歌学者]
  • Michaelson JJ、Loguercio S、Beyer A2009.表达量性状基因座(eQTL)的检测和解释.方法 48: 265–276 [公共医学][谷歌学者]
  • Michaelson JJ、Alberts R、Schughart K、Beyer A2010eQTL定位方法的数据驱动评估.BMC基因组学 11: 502.[PMC免费文章][公共医学][谷歌学者]
  • Michaud EJ、van Vugt MJ、Bultman SJ、Sweet HO、Davidson MT、Woychik RP1994.一个新的显性agouti等位基因的差异表达(Aiapy公司)与甲基化状态相关,并受父母血统的影响.基因开发 8: 1463–1472 [公共医学][谷歌学者]
  • 牛N、秦Y、弗里德利BL、侯J、卡拉里KR、朱M、吴T-Y、詹金斯GD、巴特勒A、王L2010辐射药物基因组学:利用人类淋巴母细胞系鉴定辐射反应生物标志物的全基因组关联方法.基因组研究 20: 1482–1492[PMC免费文章][公共医学][谷歌学者]
  • O'Brien TR、Kohaar I、Pfeiffer RM、Maeder D、Yeager M、Schadt EE、Prokunina-Olsson L2011慢性乙型肝炎风险等位基因与正常人肝脏中HLA-DPA1和HLA-DPB1 mRNA表达降低相关.基因免疫 12: 428–433[PMC免费文章][公共医学][谷歌学者]
  • Paschos K、Allday MJ2010病毒和微生物发病机制中宿主基因的表观遗传重编程.微生物趋势 18: 439–447[PMC免费文章][公共医学][谷歌学者]
  • Portela A、Esteller M2010表观遗传修饰与人类疾病.Nat生物技术 28: 1057–1068 [公共医学][谷歌学者]
  • Purcell S、Neale B、Todd-Brown K、Thomas L、Ferreira MAR、Bender D、Maller J、Sklar P、de Bakker PIW、Daly MJ等。2007PLINK:用于全基因组关联和基于人群的连锁分析的工具集.美国人类遗传学杂志 81: 559–575[PMC免费文章][公共医学][谷歌学者]
  • R开发核心团队。2009.R: 统计计算语言和环境.R统计计算基金会,奥地利维也纳。[谷歌学者]
  • Rando OJ公司2012父亲问题:父亲对表型的影响.单元格 151: 702–708[PMC免费文章][公共医学][谷歌学者]
  • Redon R、Ishikawa S、Fitch KR、Feuk L、Perry GH、Andrews TD、Fiegler H、Shapero MH、Carson AR、Chen W等。2006人类基因组拷贝数的全球变异.自然 444: 444–454[PMC免费文章][公共医学][谷歌学者]
  • Rideout WM III、Eggan K、Jaenisch R2001基因组的核克隆和表观遗传重编程.科学类 293: 1093–1098 [公共医学][谷歌学者]
  • Sandoval J、Heyn H、Moran S、Serra Musach J、Pujana MA、Bibikova M、Esteller M2011人类基因组中450000个CpG位点的DNA甲基化微阵列的验证.表观遗传学 6: 692–702 [公共医学][谷歌学者]
  • Seong K-H、Li D、Shimizu H、Nakamura R、Ishii S2011应激诱导的ATF-2依赖性表观遗传变化的遗传.单元格 145: 1049–1061 [公共医学][谷歌学者]
  • 铃木R,岛岛由纪夫H2006Pvclust:用于评估层次聚类中不确定性的R包.生物信息学 22: 1540–1542 [公共医学][谷歌学者]
  • 沃特兰RA,Jirtle RL2003转座因子:表观遗传基因调控的早期营养效应靶点.分子细胞生物学 23: 5293–5300[PMC免费文章][公共医学][谷歌学者]
  • 赞贝利F、佩索尔G、帕韦西G2009.Pscan:在共调控或共表达基因序列中发现过度表达的转录因子结合位点基序.核酸研究 37:W247–W252[PMC免费文章][公共医学][谷歌学者]
  • Zeybel M、Hardy T、Wong YK、Mathers JC、Fox CR、Gackowska A、Oakley F、Burt AD、Wilson CL、Anstee QM等。2012肝脏创伤愈合反应的多代表观遗传适应.自然·医学 18: 1369–1377[PMC免费文章][公共医学][谷歌学者]
  • Zhang D、Cheng L、Badner JA、Chen C、Chen Q、Luo W、Craig DW、Redman M、Gershon ES、Liu C2010人脑基因特异性甲基化个体差异的遗传控制.美国人类遗传学杂志 86: 411–419[PMC免费文章][公共医学][谷歌学者]

文章来自基因组研究由以下人员提供冷泉港实验室出版社