GWAS已确定9p21区间中有8个SNPS与CAD密切相关1–4和其他血管疾病11,12,所有这些都是高度相关的(对2>0.8),位于53-kb连锁不平衡(LD)区块。这一区间内的单倍型多样性在高加索人中是有限的,约25%的个体为风险单倍型纯合子,其心肌梗死风险是非携带者的2倍2独立研究发现在相邻但不同的11-kb LD区又有4个SNP与T2D相关5–7相关CAD和T2D SNP(补充表1)躺在基因沙漠中()两侧有CDKN2B型(上游130kb)和DMRTA1公司(下游370kb)表明关联的功能变体可能存在于调控元件中。CAD区间与功能未知的非编码基因的3′端重叠,CDKN2BAS公司,它与CDKN2A/B型轨迹13.
9p21间隔的功能注释HeLa细胞中核心CAD和T2D相关间隔(轨迹A)以及预测的绝缘体(棕色)、增强子(橙色)和启动子(绿色)的位置14显示(轨道B)。增强器分布在CAD间隔(红色)、T2D间隔(蓝色)或外部(橙色)之间(轨迹C)。MCF7细胞中FoxA1结合位点的位置(D2轨道)29干扰素γ处理和非处理HeLa中的STAT1(轨道D3)18以及ENCODE数据中9p21染色质标记的分布30(轨道E1和E2–补充方法)指示。
在这项研究中,我们使用了一种涉及细胞分析和群体测序的多管齐下的方法来识别9p21与CAD关联的变异并对其进行功能表征(补充图1). 我们最初试图通过检测人类细胞(包括HeLa、K562和人类ES细胞)中转录因子结合和染色质修饰谱来确定9p21基因沙漠中的调节元件14赖氨酸4处三甲基化的组蛋白H3(H3K4me3)与活性基因的启动子相关,寻找这个标记,我们确定CDKN2B型和DMRTA1公司幕间只有发起人(). CTCF-结合现场标记绝缘子15; 根据HeLa细胞中该因子的ChIP-ChIP数据,我们确定了9p21区间中的七个电势绝缘体。一个绝缘体靠近CDKN2B型启动子和另一个位于CAD区间上游130kb处。最后,我们寻找指示增强子的标记;组蛋白H3在赖氨酸4(H3K4me1)处单甲基化的富集,p300和MED1的结合,DNase超敏位点(DHS)的存在和H3K4me3的缺失16根据这些标记,我们预测了33个增强子的位置,其中26个在保守序列中显著富集(p<0.01–补充表2). 6个增强子接近CAD间期;9个增强子位于CAD间期(称为ECAD1-9),2个位于T2D间期(简称为ET2D1-2),16个位于T2C间期远端。33个预测增强子中的大多数位于基因座的近端,在CAD和T2D间期或其附近。这些发现得到了对公开可用的全基因组数据集的分析的进一步支持,这些数据集是通过使用各种细胞类型来预测调控元件而生成的(). 此外,我们使用HeLa细胞中的荧光素酶报告分析验证了ECAD2、ECAD4、ECAD5、ECAD7、ECAD8、ECAD9和1 ET2D元件的增强子活性(数据未显示)。有趣的是,我们确定9p21区间是人类基因组中预测增强子(7.5/100kb)密度第二高的基因座,也是包含最多疾病相关变异体(10个SNPs–补充表3). 这些数据表明9p21基因沙漠具有重要的调控功能。
为了鉴定9p21基因沙漠中的全套DNA变体,我们测序了196 kb的区间(来自CDKN2B型启动子位于T2D间期远端65 kb处),在50名欧洲血统的个体中,并使用这些变体来完善间期LD的模式(). 我们鉴定了765个变体(31个indels和734个SNP),并使用对2识别LD变异与8个CAD或4个T2D相关SNP中任何一个的相关系数。在765个变体中,41个跨44kb的变体与CAD相关的SNP处于完美的LD中,当降低时,增加到131个跨111kb的变体对2阈值为0.5(). 与CAD间隔相比,LD中只有23个变体(对2≥0.5),具有4个T2D相关SNP中的至少一个,跨度为11-kb。LD中没有变异(对2≥0.5)。
9p21间期的LD分析(a)序列间隔显示三个LD块。53-kb CAD区间位于第一块(A)的3′端,第二块(B)跨越11-kb,对应于T2D区间,第三块(C)跨越63-kb。基于50个测序样本中识别的变体的LD图(D′)。(b)不同LD中的变体数量对2阈值(y轴)与任何CAD(红色)或T2D相关变体(蓝色)。显示LD中SNP跨越的距离(x轴)。
9p21与CAD和T2D相关的功能变异很可能是LD中131和23个候选变异的子集(对2≥0.5),分别使用初始CAD或T2D相关SNP。然而,9p21基因座中强大的LD结构为仅使用遗传证据准确识别致病功能变体带来了障碍。因此,我们确定了哪些候选变体位于功能元素中。CAD候选变异体中有5个位于外显子,118个位于CDKN2BAS公司然而,没有一个外显子变异体位于保守元件中,这表明它们不太可能发挥功能。33个CAD候选变体位于ECAD1-9序列中;ECAD9的变异显著增加(11/1700 bp;第页<3.1×10−5). 其余22个变体分布在ECAD1(3个变体)、ECAD2(2)、ECAD3(8)、ECED4(1)、ECACD5(3)、ECAD 6(1),ECAD7(3)和ECAD8(1)中。23个T2D候选变异体中有6个位于T2D增强子中,其中5个位于ET2D1中,1个位于ETD2中。
为了确定候选的调控变体,我们通过计算确定哪些变体破坏了预测增强子中的一致性转录因子结合位点(TFBS)(补充表4和表5). 尽管CAD间期的许多增强子具有破坏TFBS的变体,但包含8个此类变体的ECAD9最为显著。此外,SNP(rs10757278)与CAD风险增加最为相关17在ECAD9中,并破坏参与炎症反应的TFBS(STAT1–补充表4). rs10811656和rs10757278单核苷酸多态性位于非风险单倍型预测的ECAD9 STAT1结合位点中,相距4 bp,在风险单倍体(TTC)中被破坏C类GGTA公司A类>TTC公司T型GGTA公司G公司). STAT1以前被证明在HeLa细胞中结合该位点18当用干扰素γ治疗时,rs10811656/rs10757278等位基因为杂合子。我们观察到在用IFNγ治疗后,在HUVEC杂合子的rs10811656/rs10757278等位基因的同一基因座上STAT1的结合(). 我们检测了IFNγ处理对杂合HeLa和HUVEC细胞表达CDKN2B型和CDKN2BAS公司有趣的是,我们注意到IFNγ治疗可抑制和诱导CDKN2B型和CDKN2BAS,分别是。这种影响在HUVEC中更大,其中CDKN2BAS公司表达被诱导4倍CDKN2B型转录被抑制2倍(). 这些结果与表观遗传转录抑制CDKN2B型由ANRIL诱导,由CDKN2BAS公司19.
体内ECAD9变体的影响(a)通过抗STAT1 ChIP在未经处理或用IFNγ处理的HUVEC细胞中富集ECAD9 STAT1结合位点。(b)表达水平的变化CDKN2B型和CDKN2BAS公司HeLa和HUVEC中IFNγ处理后的基因。(c)通过抗STAT1 ChIP在CAD非风险或CAD风险单倍型的LCL纯合子中富集ECAD9 STAT1结合位点。(d)的表达式级别更改CDKN2BAS公司在STAT1被siRNA敲低后,非风险或风险CAD单倍型的LCL纯合子中。(*)和(**)分别表示双尾Student T检验p<0.05和p<0.01。
为了验证在rs10811656/rs10757278风险等位基因上STAT1占用的中断,我们使用LCL纯合子作为CAD风险单倍型。STAT1在LCL中以高水平组成性表达20我们通过染色质免疫沉淀(ChIP)表明,对于CAD非危险单倍型(2.7倍富集),STAT1在2 LCL纯合子的ECAD9处结合,而对于危险单倍体,STAT12在2 LCL纯合子处不结合(). 为了进一步建立ECAD9中STAT1占用率与CDKN2BAS公司,我们评估了CDKN2BAS公司在LCL中STAT1(状态1)siRNA介导的敲除;表达CDKN2BAS公司在CAD非风险单倍型的LCL纯合子中显著上调(7倍),但在CAD风险单倍型的LCL纯合子中影响很小(). 这些结果与STAT1未能在CAD风险单倍型中结合ECAD9这一事实一致,因此不太可能参与CDKN2BAS公司监管。有趣的是,这些结果表明,在ECAD9上STAT1结合的作用可能对细胞类型特异性差异表达CDKN2BAS公司LCL(抑制)和HUVEC(激活)之间(补充讨论).
为了确定哪些基因与ECAD9增强子相互作用并可能受其调节,我们检测了位于2Mb内的所有基因(20个上游和1个下游)的相互作用。由于长程增强子相互作用通常是组织特异性的21我们选择HUVEC细胞作为血管内皮的模型系统。我们使用在标准条件下生长的交联HUVEC进行染色质构象捕获(3C),然后对染色质进行BamH1消化和稀释重排22。我们使用一种新的方法分析3C,该方法源自3C与DNA选择和连接的结合23(方法称为3D-DSL),并通过高通量测序检查连接的受体和供体BamH1位点。3D-DSL的分辨率受到BamH1位点分布的限制,为了弥补这一点,我们选择了6个位于ECAD9和其他邻近增强子两侧的BamH2位点作为受体位点,以及145个分布在整个2Mb序列中的BamH1-供体位点进行相互作用测试。我们确定了9个与增强子-受体位点强烈相互作用的供体位点()其中7个距离受体位点足够远(>45kb)以被识别为特异性(补充表6). 它们发生在4个区域:1)CDKN2A/B型轨迹,2)MTAP公司基因,3)下游信息21和4)T2D相关区域(DOTAR)下游,一个未知功能区间。考虑到BamH1位点分布导致的分辨率限制,我们没有将连接性受体位点指定为ECAD9,而是将其称为“相关增强子”,并将供体-位点相互作用分组为CDKN2A型和CDKN2B型作为“CDKN2A/B“我们用传统方法证实了3D-DSL方法鉴定的相关增强子与周围基因之间的相互作用。相关增强子和国际食品标准化协会21跨度946 kb,通过荧光分析就地杂交(FISH)。我们研究了IFNγ治疗是否会影响这种长程相互作用,并观察到增强子和国际食品标准化协会21在存在和不存在干扰素γ的HUVEC细胞核中,58%和37%的染色体分别非常接近(p<1.63 10−25
补充图2和补充表7). 这些数据表明,这种相互作用发生在基础上,但在IFNγ治疗后显著重塑。我们通过位点特异性PCR在重新定位的3C DNA上验证了更紧密的相互作用位点,并验证了相关增强子和CDKN2A/B型基因座在IFNγ的存在下得到加强,而与MTAP公司减少了().
与增强子位点的长程相互作用(a)3D-DSL结果的圆形表示。刻度以100kb的增量显示9号染色体的位置(hg18)。RefSeq基因(深蓝色)和HeLa预测增强子(橙色)与CAD(红色)和T2D(蓝色)相关增强子一起显示。直方图表示映射到每个BamH1供体位点的归一化平均读取次数。内圈链接连接了9个相互作用最强的供体位点的BamH1受体位点。(b)PCR验证ECAD9和CDKN2A/B型(上面板)或MTAP公司(下面板)。箭头表示特定产品。
总之,我们的研究表明,IFNγ刺激和ECAD9的STAT1结合在调节CDKN2B型和CDKN2BAS公司我们的研究结果与之前观察到的CAD风险变量与CDKN2A/B型淋巴细胞中的表达10,和的简化表达式CDKN2A/B型在删除了同源CAD间期的小鼠模型心脏和其他组织中8。我们还证明了相关增强子与间隔编码的物理交互作用CDKN2A/B型,MTAP公司和国际食品标准化协会21在HUVEC中,这些相互作用在IFNγ处理后被重塑,因此表明ECAD9中的STAT1结合位点是一个关键的调控序列。STAT1是介导炎症反应的通路的下游效应器,炎症反应与血管生成有关24和动脉粥样硬化发病机制25在内皮组织中。因此,在内皮组织中,在炎症反应激活期间,破坏ECAD9 STAT1结合位点的rs10811656和rs10757278等位基因的生物学效应可能会增强。很可能9p21独特的增强子景观是由高阶染色质结构控制的,因此与我们研究中确定的基因相比,它参与了额外基因的不同时间或组织特异性表达26未来评估变体在不同生理条件和细胞类型下对9p21染色质景观的影响的研究无疑将为该区间与CAD和T2D易感性的关联提供更多的见解。