鲜血。2011年6月9日;117(23):e207–e217。
利用ChIP-seq进行HIF结合位点的高分辨率全基因组定位
,1 ,2 ,2 ,1 ,1和1 约翰内斯·舍德尔
1英国牛津大学亨利·韦尔科姆分子生理学大楼;和
Spyros Oikonomopoulos公司
2英国牛津大学威康人类遗传学信托中心
拉古西斯坚尼斯
2英国牛津大学威康人类遗传学信托中心
克里斯托弗·普格
1英国牛津大学亨利·韦尔科姆分子生理学大楼;和
彼得·拉特克利夫
1英国牛津大学亨利·韦尔科姆分子生理学大楼;和
大卫·R·摩尔
1英国牛津大学亨利·韦尔科姆分子生理学大楼;和
1英国牛津大学亨利·韦尔科姆分子生理学大楼;和
2英国牛津大学威康人类遗传学信托中心
通讯作者。 2010年10月20日收到;2011年3月16日接受。
- 补充资料
补充表格和图表
GUID:6877548B-C9F1-4EBB-8484-E17F9861C31F
GUID:55C8F5AF-2B53-4A8F-B3D5-3E6982F379AD
摘要
低氧诱导因子(HIF)调节所有哺乳动物细胞对氧张力变化反应的主要转录级联反应。表达阵列表明,数百个基因受该途径调控,控制着不同的过程,而这些过程又协调了氧气的输送和利用。然而,HIF对基因表达的直接和间接控制程度以及决定HIF调节基因范围的因素尚不清楚。利用与高通量测序相关的染色质免疫沉淀,我们在基因组中独立于基因结构识别HIF结合位点。利用基因集富集分析,我们证明了HIF对基因表达的调节具有强大的相关性,这表明这些位点在较长的基因组间隔内运行。HIF-结合基序分析显示了核心RCGTG结合基序之外的序列偏好,但没有揭示任何额外的绝对序列要求。在整个基因组中,只有一小部分潜在结合位点与HIF结合,尽管在正常毒性DNAse1超敏位点(与启动子的距离无关),潜在位点的占有率增加了约20倍,这表明染色质的表观遗传调控可能在定义缺氧反应中起着重要作用。
介绍
氧对所有真核细胞的生存至关重要,通过调节氧的利用和传递,在系统水平和细胞水平上都发生了对氧张力变化的适应。维持足够水平的红细胞和血红蛋白对于向组织输送足够的氧气至关重要,并通过红细胞生成进行控制。促红细胞生成素的产生是通过转录因子低氧诱导因子(HIF)对组织氧合反应进行调节的。事实上,对中国汉族和藏族人群的全基因组关联研究将EPAS1系统血红蛋白浓度改变的基因位点,1,2HIF-2α及其调节蛋白的突变导致红细胞生成障碍。三–5HIF由α/β-异二聚体组成,主要通过2-氧戊二酸依赖性加氧酶对HIF-α亚基的氧调节修饰来控制6,7进而调节HIF-α亚基的稳定性和反式激活活性。7–92-氧戊二酸的小分子类似物(如二甲基草酰甘氨酸[DMOG])抑制这些酶,稳定HIF-α并激活靶基因,如促红细胞生成素。10,11
然而,除了调节红细胞生成素外,HIF还驱动一个主要的转录级联,负责协调许多不同组织中细胞对氧气供应的反应。它控制多种过程,如生长因子的产生、增殖、分化、凋亡、能量代谢和血管生成,在胚胎发育和适应海拔以及炎症、癌症和缺血性血管疾病的病理生理学中具有重要作用。12–14表达阵列表明,数百个基因受HIF途径调控。15–20除了直接的基因调节外,HIF还调节许多其他转录因子,表明HIF控制着缺氧反应网络。然而,直到最近,HIF级联对基因表达的直接与间接转录调节的程度还不清楚。21–25
对约50个HIF靶基因(包括促红细胞生成素增强子)的HIF依赖性调节元件进行了验证分析,确定了一个核心反应元件5′-RCGTG-3′。26然而,该基序在基因组中的出现次数太多,无法预测HIF结合。尽管已经尝试根据哺乳动物的保守性和与转录起始位点(TSS)的距离来确定潜在的HIF结合位点,20根据定义,这种方法局限于短程相互作用,无法从机理上了解限制HIF在分子水平结合的因素,需要实验验证。
为了确定直接HIF靶基因,最近的几项研究使用染色质免疫沉淀耦合到贴片微阵列(ChIP-ChIP)来检测HIF-1α和HIF-2α亚型与基因启动子的全基因组结合。27–30然而,与染色质免疫沉淀结合下一代高通量测序(ChIP-seq)的新技术相比,这些技术具有相对较低的信噪比,并且具有固有的偏见,仅限于平铺阵列中使用的序列。
我们描述了使用ChIP结合下一代高通量测序来定义整个基因组中的HIF结合位点,而不管它们是否与启动子一致。这项工作证明存在大量远离已知启动子的HIF结合位点。基因集富集分析(GSEA)确定了与远距离靶基因调控的强大关联,强烈表明这些位点在很长的基因组间隔内促进了对缺氧的转录反应。基于HIF结合区域更精确定位的HIF识别基序的精细分析定义了核心RCGTG基序以外的序列偏好。然而,这些额外的一级序列偏好并没有大大限制基因组中潜在结合位点的数量,这表明表观遗传因子在定义HIF结合中必须发挥主要作用。HIF-结合数据与ENCODE联盟在正常氧细胞中获得的全基因组DNAse1超敏反应数据的相关性31,32表明“静止状态”染色质可及性是低氧诱导HIF与RCGTG基序结合的一个强大但并非唯一的预测因子。
方法
细胞培养
MCF-7(乳腺癌)细胞在DMEM中生长,2mM我-谷氨酰胺和10%FBS(Sigma-Aldrich)。收获前,将亚流细胞培养物暴露于2mM DMOG(前沿科学)或0.5%的环境氧气中16小时。
炸薯条
如前所述,使用兔抗HIF-1α(PM14)、HIF-2α(PM9)、,27HIF-1β(Novus NB-100-110)和RNA Pol2(Santa Cruz Biotechnology SC-899)。免疫前血清或IgG作为阴性对照。
高通量测序
使用Illumina ChIP-Seq试剂盒从免疫沉淀染色质制备文库;在Illumina GAII平台上进行36-bp单端序列分析。使用ELAND软件将序列映射到NCBI构建36(hg18)。随后使用CisGenome软件套件进行评估、双样本峰发现、基序分析和RCGTG基序绘图(www.biostat.jhsph.edu/~hji/cisgenome).33–36此外,还应用了3个额外的滤波器来定义高强度峰值。首先,每个方向的读取次数至少占总数的三分之一。其次,估计的错误发现率小于0.05。最后,排除了具有4个以上结合位点的位点,因为人工分析显示这些位点是高背景或重复元素区域。
实时定量PCR对染色质富集的独立确认
使用基于SYBR Green的实时定量PCR,使用StepOne热循环器。β-肌动蛋白用于标准化,并使用ΔC测定每个位点的倍数富集t吨方法。补充表3中给出了引物序列(可从血液网站;请参阅在线文章顶部的补充材料链接)。
定量PCR的表达
cDNA是使用高容量cDNA试剂盒(Applied Biosystems)合成的。使用SYBR Green方法和ΔC进行表达分析t吨方法。引物序列见补充表3。
荧光素酶载体和报告分析
使用BglII(引物arrestin domain containing 3[ARRDC3]:ACAGGAGAGCGAGCAG,CTGCAAAGACCTTGAGTTCC;ERBB受体反馈抑制剂1[ERRFI1]CATGTGACGTCAGAAGCT,CTGCGAGCTTTGTTCC)将HIF结合位点克隆到pGL3启动子(Promega)中。用pGL3报告子和β-半乳糖苷酶报告子共同转染U2OS细胞,在常氧或0.5%缺氧条件下培养16小时。荧光素酶活性(Promega Luciferase试剂盒)归一化为β-半乳糖苷酶活性。
结果
HIF-α结合位点的定义
大型ChIP-seq数据集的一个重要挑战是确定合适的阈值来定义绑定峰值。使用先前ChIP-ChIP分析确定的基因位点27作为一个“种子”数据集,我们检查了改变用于定义ChIP-seq峰值的阈值对两个数据集之间重叠程度的影响。这确定了HIF-1α每窗口大约20次读取的阈值(HIF-2α每窗口25次读取),低于该阈值,与ChIP-ChIP数据的重叠降至背景(补充图1A-B)。当先前确定HIF调节基因时,定义了一个可比较的阈值15被用作“种子”数据集,表明为ChIP-seq分析确定合适阈值的方法应该是通用的(数据未显示)。
为了更严格地定义高严格性ChIP-seq-binding站点,我们使用了这些阈值以及3个附加过滤器(请参阅“高通量排序”)。这在356个基因位点上鉴定了400个高强度HIF-1α结合位点(; 补充表1)和357个基因位点上的425个高强度HIF-2α结合位点(; 补充表2)。
表1
HIF-1结合位点 | 染色体 | 起点 | 终点 | 峰值高度,每个窗口的读取次数 | 人类启动子1.0R阵列覆盖 | 最近的基因位点 | RefSeq编号 |
---|
1 | 7 | 156986147 | 156987039 | 314 | 不 | DNAJB6号机组 | NM_058246号 |
2 | 8 | 134456859 | 134457261 | 180 | 不 | 国家发改委1 | 纳米_006096 |
三 | 1 | 114156539 | 114157002 | 288 | 是的 | RSBN1号机组 | NM_018364号 |
4 | 16 | 29984123 | 29984574 | 160 | 是的 | 阿尔多阿 | NM_184041号 |
5 | 15 | 91153222 | 91153655 | 160 | 不 | CHD2(瑞士法郎) | NM_001042572号 |
6 | 20 | 48720371 | 48720786 | 136 | 不 | C20或175 | NM_080829号 |
7 | 三 | 5003621 | 5003966 | 128 | 不 | BHLHB2型 | NM_003670 |
8 | 14 | 61287408 | 61287886 | 126 | 不 | SNAPC1系统 | NM_003082号 |
9 | 10 | 6283489 | 6283830 | 126 | 是的 | PFKFB3型 | NM_004566号 |
10 | 19 | 39541937 | 39542408 | 123 | 是的 | 性别均等指数 | NM_000175号 |
11 | 1 | 178403857 | 178404013 | 118 | 是的 | QSCN6公司 | NM_002826号 |
12 | 15 | 70306014 | 70306475 | 116 | 不 | PKM2(平方公里) | NM_002654号 |
13 | 6 | 87921667 | 87922197 | 109 | 是的 | CGA公司 | 纳米_000735 |
14 | 14 | 74791306 | 74791781 | 103 | 不 | FOS公司 | NM_005252 |
15 | 14 | 22840340 | 22840855 | 102 | 是的 | BCL2L2型 | NM_004050号 |
16 | 14 | 33477245 | 33477551 | 98 | 不 | EGLN3型 | NM_022073号 |
17 | 6 | 43743806 | 43744203 | 96 | 不 | MRPS18A型 | NM_018135号 |
18 | 12 | 8014473 | 8014830 | 95 | 不 | SLC2A3系列 | NM_006931号 |
19 | 三 | 48569558 | 48569870 | 95 | 是的 | PFKFB4系列 | NM_004567 |
20 | 7 | 55216284 | 55216762 | 94 | 不 | 表皮生长因子受体 | NM_201283号 |
21 | 2 | 173128811 | 173129189 | 94 | 是的 | PDK1系列 | NM_002610 |
22 | 4 | 186554370 | 186554738 | 89 | 是的 | 澳元37 | NM_181726号 |
23 | 三 | 123585527 | 123585631 | 88 | 是的 | C3或28 | 纳米_014367 |
24 | 8 | 135913721 | 135913971 | 87 | 不 | ZFAT1型 | NM_020863号 |
25 | 1 | 8861349 | 8862115 | 86 | 是的 | ENO1公司 | NM_001428 |
26 | 17 | 78009247 | 78009655 | 86 | 是的 | NARF公司 | NM_001038618号 |
27 | 1 | 200320766 | 200321048 | 83 | 不 | GPR37L1型 | NM_004767号 |
28 | 2 | 86521270 | 86521896 | 81 | 是的 | JMJD1A公司 | NM_018433号 |
29 | 15 | 88509909 | 88510331 | 81 | 不 | SEMA4B公司 | NM_020210 |
30 | 4 | 120441100 | 120441561 | 87 | 是的 | LOC401152型 | NM_001001701号 |
表2
HIF-2结合位点 | 染色体 | 起点 | 终点 | 峰值高度,每个窗口的读取次数 | 被人类启动子1.0R阵列覆盖 | 最近的基因位点 | RefSeq编号 |
---|
1 | 7 | 156986122 | 156987013 | 268 | 不 | DNAJB6号机组 | NM_058246号 |
2 | 20 | 48720413 | 48720792 | 142 | 不 | C20或175 | NM_080829号 |
三 | 15 | 88509900 | 88510359 | 130 | 不 | SEMA4B公司 | NM_020210 |
4 | 21 | 42669493 | 42669912 | 119 | 不 | TFF1型 | NM_003225号 |
5 | 8 | 134456898 | 134457355 | 117 | 不 | 国家发改委1 | NM_006096号 |
6 | 7 | 127882809 | 127883250 | 105 | 是的 | 高强度气体2 | NM_013332号 |
7 | 2 | 218226277 | 218226673 | 103 | 不 | TNS1型 | NM_022648 |
8 | 三 | 4995548 | 4996080 | 95 | 是的 | BHLHB2型 | NM_003670 |
9 | 三 | 5003471 | 5003914 | 91 | 不 | BHLHB2型 | NM_003670 |
10 | 12 | 8014461 | 8014804 | 91 | 不 | SLC2A3系列 | NM_006931号 |
11 | 14 | 61287435 | 61287871 | 90 | 不 | 快照1 | NM_003082号 |
12 | 7 | 156890452 | 156890887 | 89 | 不 | DNAJB6号机组 | NM_058246号 |
13 | 11 | 72583304 | 72583693 | 88 | 不 | 第二个RY2 | NM_002564号 |
14 | 12 | 50823667 | 50824115 | 87 | 不 | 80韩元 | NM_182507 |
15 | 14 | 99628951 | 99629206 | 86 | 不 | EVL公司 | NM_016337号 |
16 | 16 | 29984146 | 29984554 | 85 | 是的 | 阿尔多阿 | NM_184041号 |
17 | 1 | 200320701 | 200321105 | 86 | 不 | GPR37L1型 | NM_004767号 |
18 | 7 | 55216313 | 55216811 | 79 | 不 | 表皮生长因子受体 | NM_201283号 |
19 | 8 | 22511476 | 22511809 | 79 | 是的 | C8或58 | NM_001013842 |
20 | 2 | 1614654 | 1615038 | 77 | 不 | PXDN公司 | NM_012293 |
21 | 7 | 41579152 | 41579497 | 77 | 不 | INHBA公司 | NM_002192号 |
22 | 4 | 120441169 | 120441511 | 75 | 是的 | 位置401152 | NM_001001701号 |
23 | 5 | 3979121 | 3979463 | 74 | 不 | IRX1系列 | NM_024337号 |
24 | 20 | 48215760 | 48216285 | 73 | 不 | 夸 | NM_199129 |
25 | 19 | 39541912 | 39542320 | 72 | 是的 | 性别均等指数 | NM_000175号 |
26 | 1 | 200258697 | 200259111 | 71 | 不 | ELF3级 | NM_004433号 |
27 | 12 | 123888666 | 123889062 | 71 | 不 | SCARB1号机组 | NM_005505号 |
28 | 14 | 74791304 | 74791735 | 70 | 不 | FOS公司 | NM_005252 |
29 | 12 | 32988395 | 32988693 | 70 | 不 | PKP2系列 | NM_001005242 |
30 | 15 | 62024988 | 62025281 | 70 | 不 | DAPK2型 | NM_014326 |
独立评估随机选择这些峰的准确性的定量PCR分析证实了非常高的特异性(20个HIF-1α位点中的18个和12个HIF-2α位点中的9个;补充图2A-B)。相反,ChIP–对ChIP-ChIP先前识别的位点进行定量PCR分析,27虽然在某些情况下富集程度较低,但不符合ChIP高严格性定义的所有纳入标准,在这些位置产生了信号(补充图2C)。
HIF-α和HIF-1β结合位点之间的重叠
尽管HIF-α蛋白最初被定义为与HIF-1β二聚体的一部分,该二聚体在缺氧反应元件处结合DNA,但与其他转录因子的相互作用已被定义为可能导致在其他位点没有HIF-1β的情况下DNA结合。38因此,为了确定HIF-α和HIF-1β结合位点的泛基因重叠,我们对暴露于缺氧16小时的MCF-7细胞中的HIF-1αDNA结合进行了比较性ChIP-seq分析。
根据峰高对HIF-1β结合位点进行排序,并根据该排序绘制与高严格性HIF-1α结合位点重叠的数量。这表明存在356个重叠HIF-1β峰,之后重叠降至背景水平。对HIF-2α结合位点的类似分析显示301个重叠的HIF-1β峰。HIF-α和HIF-1β结合之间的高度一致性与ChIP-seq对异二聚体结合复合物的非常准确的定义相一致,并表明在这些条件下,大多数HIF-β结合与HIF-1和副病毒a络合。为了测试这一点,我们再次绘制了与等级的重叠程度(补充图3B、D)。这表明,排名较高的山峰的关联程度更高;例如,当考虑前200个HIF-1α和HIF-2α位点时,与HIF-1β的重叠分别为95%和94.5%。相反,前200个HIF-1β位点显示95%与HIF-α位点重叠(补充图3E-F)。综上所述,这些发现与大多数HIF-αDNA结合与HIF-1β和副病毒复合一致。此外,在DMOG或缺氧处理的细胞中,HIF-结合位点之间的高度一致性表明,在DNA结合水平上,这些刺激具有非常相似的作用。
明显不重叠的站点与排名较低的站点的关联表明,不重叠可能在很大程度上反映了一个或另一个数据集中的错误分配。因此,我们通过ChIP定量PCR重新测试了一组明显专属的HIF-α结合位点,发现富集率仅为25%,表明这些位点确实主要由假阳性信号组成(数据未显示)。因此,我们基于HIF-1β也存在的HIF-α位点的所有后续分析。
HIF-结合和HIF-调节基因位点的分布
TSS附近的分布。
独立于拼接启动子微阵列提供的覆盖范围,识别HIF-结合位点的能力允许对HIF-αDNA结合进行真正的全基因组分析,从而能够完整描述HIF结合位点的分布。在ChIP-seq鉴定的356个HIF-1高强度结合位点(HIF-1α和HIF-1β)中,170个(48%)是新的位点,远离启动子区域(如人类启动子1.0R微阵列所定义),而301个HIF-2结合位点中的212个(70%)位于这些区域之外。这些不同的比例可能解释了ChIP-seq识别出的更多新HIF-2结合位点,并表明这两种亚型相对于启动子的分布不同。
为了验证这一点,我们检查了最近TSS的HIF-1和HIF-2结合位点的频率分布。使用5-kb窗口,我们观察到靠近TSS的HIF-1和HIF-2结合位点聚集,结合频率较低,延伸到更远的距离。然而,HIF-1更可能与TSS结合,大约40%的HIF-1结合位点位于TSS的2.5 kb范围内,而HIF-2结合位点约为20%(A) ●●●●。为了排除阈值过低可能扭曲HIF-2位点结合分布的可能性(包括假阳性),我们仅使用每个HIF亚型的100个顶部结合位点重复分析。这为整套结合位点提供了几乎相同的分布,证实了HIF-2结合的更广泛分布模式(数据未显示)。使用100-bp窗口对结合模式进行更详细的分析表明,无论是HIF亚型,在核心启动子内,与TSS的结合位点最常见的位置约为100bp 5′(B) ●●●●。然而,HIF结合位点也存在于基因间、5′-非翻译区、3′-非译区、内含子和外显子区域。
HIF结合位点的分布HIF-1和HIF-2结合位点相对于最近TSS的位置使用(a)5-kb窗口和(B)100-bp窗口绘制为频率分布。(C)HIF-1结合基因位点、(D)HIF-2结合基因位点和(E)HIF-调节基因位点之间最近邻距离的频率分布。在每种情况下,显示了相同数量的随机选择的控制基因位点的最近邻距离的频率分布,以进行比较。(F) Ingenuity Systems Inc(IPA版本8.8-3204)软件工具用于检查功能通路的HIF-1和HIF-2结合位点。HIF结合位点中统计上过度表达的典型路径与相应的−log一起显示10(P(P)值)。
基因组分布。
ChIP-seq提供的全基因组覆盖率还允许分析整个基因组中HIF-α结合位点的聚类。分析HIF-1和HIF-2结合位点以及HIF-调节基因的最近邻距离,揭示了非泊松分布。然而,这种分布与随机选择的相同数量基因的分布相当,表明HIF-1和HIF-2靶基因在已知转录物中随机分布(C-E)。
跨生物途径的分布。
然后使用Ingenuity Pathways Analysis软件工具(版本IPA 8.8-3204)检查HIF结合位点。在HIF-结合位点中,有20条典型路径在统计上表现得过多,其中一些显示出对HIF-1或HIF-2结合的偏倚(F) ●●●●。网络分析确定了3个主要网络,其中最大的网络包含59个焦点分子(补充图4),主要节点以ERRB2、TGFB1、TP53、MYC/MAX、HNF1A、SP1和NOTCH1为中心,表明与这些路径的相互作用。
HIF结合与基因调控
由于HIF-结合位点在基因组的所有区域都被发现,包括许多距离基因启动子很远的区域,我们接下来研究了HIF-连接位点的位置与基因表达的影响之间的关系。使用GSEA检测HIF高强度结合位点在HIF调节基因中的富集。36,37利用MCF-7细胞的表达阵列数据对HIF-调节基因进行鉴定和排序。15正如预期的那样,结合HIF-1和HIF-2的基因座在HIF上调最多的基因中强烈聚集。相反,在HIF下调的基因中,未观察到HIF结合位点的富集(补充图5)。
为了研究启动子距离HIF结合和转录调控之间的关系,我们根据TSS和最近的HIF结合位点之间的距离对HIF结合基因位点进行分层,并使用GSEA进一步测试HIF上调的相关性。这些分析表明,HIF-1结合位点与HIF上调最近转录物显著相关,而与HIF-1连接位点与TSS之间的距离无关(). 即使HIF-1结合距离最近的TSS大于100 kb的位点(富集分数[ES]=0.69,标准富集分数=1.50,标称P(P)=.0,错误发现率q值=0.09,系列错误率P(P)=.0),表明HIF-1 DNA结合可以在大于100 kb的距离上对基因调控产生影响。HIF-2的比较结果可见(补充图6)。
GSEA按结合位点和TSS之间的距离分层MCF-7细胞的表达阵列数据,在1%的环境氧气中培养16小时,并用对照siRNA或针对HIF-α两个亚单位的siRNA处理,15被归一化,过滤当前/缺席呼叫,并根据HIF-α的折叠调节进行排名。根据到最近TSS的距离,将HIF-1高表达基因位点分为4个亚组。对每个基因亚组进行GSEA(www.broadinstitute.org/gsea).37,39累积ESs以及HIF-结合基因位点在按折叠调节排列的基因中的位置绘制为:(A)在TSS的1kb内HIF-1结合最紧密的基因位点,(B)在TSS1kb和10kb之间,(C)在TSS10kb和100kb之间以及(D)在TSS-100kb以上。(E) 日志2说明了HIF-α对折叠的调节作用。
为了进一步研究,我们对2个最遥远的HIF结合位点进行了额外的分析。HIF DNA在两个ARRDC3公司和ERRFI1号机组基因座位于距离启动子100 kb以上的地方,尽管在每种情况下,这些基因都是最近记录的基因(A-B),并且据报道两者都受到HIF的调节。15两个主要峰值出现在ERRFI1号机组轨迹和一个在ARRDC3型轨迹。每个峰在ChIP定量PCR分析中得到确认,且富集程度较高(C) ●●●●。此外,通过定量PCR对mRNA水平的分析证实了这些转录物的缺氧依赖性调节(D) 。ChIP–使用针对RNA Pol2的抗体对这些位点进行定量PCR分析,证明在0.5%缺氧条件下16小时后与RNA Pol2相互作用(E) 表明这些结合位点与一般转录机制之间存在低氧诱导的相互作用。最后,跨越这些结合位点的DNA序列与异源荧光素酶报告基因的融合赋予了荧光素瘤酶活性的低氧调节,证实了这些序列调节低氧诱导基因表达的能力(F) ●●●●。
HIF结合调节长基因组间隔的基因表达HIF-1α、HIF-2α和HIF-1β亚单位在(A)的基因组结合ERRFI1号机组和(B)ARRDC3公司基因位点。显示了每个100-bp窗口的读取次数和每个基因的位置。(C) ChIP–定量PCR确认ChIP-seq定义的结合峰。(D) 表达定量PCR确认0.5%低氧条件下16小时的基因调控。(E) ChIP–定量PCR证明RNA Pol2招募到ERRFI1号机组和ARRDC3公司正常氧和0.5%缺氧16小时后HIF-结合位点。(F) 荧光素酶报告基因分析显示,异源荧光素酶报告基因的活性在常氧和0.5%低氧条件下16小时后融合到跨越每个HIF结合位点的序列。
在最近基因不受调控的HIF结合位点,我们接下来检查HIF结合和第二最近转录物调控之间的关联。这些最近的HIF结合基因位点也与HIF调节的转录物有显著关联(ES=0.45,标准化富集分数=1.45,标称P(P)=.0,错误发现率q值=0.09,系列错误率P(P)=.0),表明HIF通常“跳过”最近的基因来调节另一个较远的启动子(数据未显示)。
然后根据HIF-1结合是位于内含子、外显子、5′-非翻译区、TSS上游还是转录末端的下游对HIF-1的结合位点进行分组。类似的GSEA分析表明,所有亚群的上调基因与之显著相关(补充图7)。
最后,HIF的转录上调幅度与最近的HIF结合位点与启动子的距离无关(补充图8)。综上所述,这些结果表明,在全基因组水平上,HIF-结合位点似乎在功能上相似(即,无论相对于受调控基因启动子的位置如何,它们在大基因组区间内对低氧诱导基因表达的定性和定量影响都相似)。
HIF结合位点转录因子结合位点基序分析
基于对大约50个HIF调节基因的分析,HIF依赖性转录激活所需的最小顺调控元件被定义为RCGTG基序。26我们对400多个HIF结合位点进行了无偏见、更精确的全基因组鉴定,这使我们能够使用两种独立的方法对围绕该核心基序的序列偏好做出更明确的声明。首先,在无偏分析中,使用CisGenome的Gibbs Motif Sampler模块检测HIF结合位点的常见新基序,35通过测定HIF结合区与对照区的相对出现次数,对其进行富集试验。34正如预期的那样,以这种方式为HIF-1和HIF-2结合区域确定的最丰富的基序包含核心RCGTG基序,在R位置优先选择a而不是G(A-B)。然而,这些基序也表现出对该核心基序的5′和3′的扩展序列偏好。在这两种情况下,T立即5′优先于RCGTG,C立即3′优先于此基序。在HIF-1结合区中识别的基序也确定了C或G 2-bp 5′对R位置的偏好。此外,该方法还确定了HIF-结合区比对照区更经常出现的其他基序(A-B),包括AP-1样基序。
HIF结合基序的特征使用CisGenome的Gibbs Motif Sampler模块检测了HIF-1和HIF-2结合区域中常见的新基序。然后通过确定HIF-结合区中每个基序与控制区(r1)的相对出现率,HIF-绑定区系统发育保守部分中系统发育保守基序与对照区(r2)的相对发生率,来检查以这种方式识别的基序的丰富性,HIF-1结合区和控制区(r3)所有部分的系统发育保守基序。序列徽标40图中显示了所有3个富集比均大于2的基序。每个字母的高度与其频率成比例,最频繁的字母位于顶部。然后调整每个堆栈的高度,以表示该位置序列的信息内容(以位为单位)。(C) 对包含单个RCGTG基序的HIF-1和(D)HIF-2结合位点进行分析,以确保该核心基序以外的序列保持。将序列延伸至RCGTG基序的上游和下游100 bp,并对齐。在每个位置,使用χ将观察到的基频与预期基频进行比较2测试。每个核苷酸在每个位置的相对出现率用字母高度表示为占总数的百分比。显示非随机基频的位置(P(P)<.01(Bonferroni校正后)以灰色突出显示。
尽管无偏见的方法将确定新的基序,但它很难区分2个相关基序中碱基的相对丰度,例如结合HIF-1和HIF-2的序列。因此,在第二种基于RCGTG基序的方法中,对每个独特的HIF-结合RCGTG模序侧翼的序列进行了比较(C-D)。HIF-1和HIF-2结合区域都相对富含GC,反映了它们在启动子区域内的浓度。对于这两种亚型,都鉴定出了一个扩展的缺氧反应元件共识基序,这两种基序都非常相似。事实上,在RCGTG基序两侧的任何位置,无论是2种亚型还是近端启动子与远端启动子,基频都没有观察到显著差异。在位置0(R的位置),A优先于G。位置-1处的T优先。重要的是,C在位置-1处的表达明显不足,这意味着CACGTG E-box基序被抑制结合HIF。这种排除可能是由于识别E-box并降低其结合HIF(包括HIF-1β同源二聚体)的可用性的其他蛋白质的竞争所致。41在核心RCGTG基序之外,可以看到位置+13和+15之间的CAC基序的偏好。此外,RCGTG基序下游其他位置的CAC基序的频率并未高于背景(补充图9)。CAC基序在+13和+15之间的突变先前已被证明影响促红细胞生成素3′增强子的功能活性。42,43
HIF结合与DNAse1超敏反应的相关性
在参考基因组中,共有114925个RCGTG,其中只有606个(0.05%)在HIF-1和462个(0.04%)HIF-2结合区域中被识别。即使考虑到用于定义这些结合位点的高严格标准产生的假阴性结果,大多数RCGTG基序也不结合HIF。除了排除一些E-box基序外,序列分析并没有提供任何明确的规则来进一步定义潜在的结合位点。因此,我们希望确定表观遗传机制,特别是DNA Ase1超敏反应定义的染色质可及性,在多大程度上可能有助于定义HIF结合位点。因此,我们将HIF-结合结果与来自ENCODE联盟数据集1的DNAse1超敏反应峰关联,用于MCF-7细胞中的数字DNAse1Hypersensitivity(wgEncodeUwDnaseSeqPeaksRep1Mcf7)。31,32
总的来说,271(76%)个HIF-1结合位点和246(82%)个HIF-2结合位点与DNAse1超敏峰和HIF-结合区域重叠,表明超敏峰的浓度远高于紧邻的侧翼区域(补充图10)。当全基因组的1 114 925个RCGTG基序都被认为是DNAse1超敏感的RCGTG基序与HIF-1结合的可能性是不敏感基序的19倍,与HIF-2结合的可能性是不敏感基序的22倍。这表明正常细胞中的DNAse1超敏反应将是HIF与其共识识别位点结合的重要预测因子。
为了测试这一点,并探索在启动子区域以外观察到DNAse1超敏反应和HIF结合的重合程度(在任何情况下,DNAse1超敏位点都可能被预测富集),我们根据最近TSS的上游/下游距离对ChIP-seq定义的HIF结合位点进行了排名。然后,我们根据所有RCGTG基序或仅与DNAse1超敏位点一致的RCGTG模序与HIF-结合区域(由ChIP-seq实验定义)中心的距离绘制了该等级(A-B)。这些分析的预期是,正确识别的HIF结合的RCGTG基序将排列在ChIP-seq定义的区域的中心,而不结合HIF的RCGTG基序将随机分布。A显示了所有RCGTG的图,并在非HIF结合RCGTG“噪音”的背景下显示了预期对齐。当数据仅限于DNAse1超敏位点内的RCGTG基序时,观察到“信噪比”大大提高(B) 与DNAse1超敏反应的预测能力一致。重要的是,无论HIF结合位点与最近的TSS的秩距离如何,都可以观察到这一点,这表明正常毒性DNAse1超敏反应是HIF结合的一个强有力的决定因素,即使是在远离启动子的位点,也与这些远程位点在基因调控中的功能重要性相一致。
正常毒性DNAse1超敏反应预测HIF缺氧结合根据最近的TSS(纵轴)上游/下游的距离对HIF-1高活性结合区进行排名。(A) 对于每个HIF-1结合区域,绘制了每个RCGTG基序相对于HIF-结合区域中心的位置(水平轴)。(B) 对与正常毒性DNAse1超敏反应峰一致的RCGTG基序子集重复相同的分析(ENCODE联合体数据集1)。(C) HIF-1α、HIF-2α和HIF-1β亚单位在egl九同系物3基因位点。每个100-bp窗口的读取数和基因的位置以及RCGTG基序和DNAse1-超敏RCGTG(DNAse1-hypersensite site RCGTG)基序的位置都显示出来以进行比较。
因此,数据表明,DNAse1超敏反应的全基因组分析可用于帮助识别特定位点上功能重要的RCGTG基序。例如,在egl九同系物3该位点与正常毒性的DNAse1超敏反应峰一致。上述缺氧反应元件44,45是所有3个数据集中唯一绑定HIF的(C) ●●●●。
因此,正常毒性DNAse1超敏反应所表明的可接近性是预测HIF与RCGTG基序结合的主要因素。然而,尽管如此,与HIF结合的超敏RCGTG基序的比例仍然很低(1.1%的超敏RC GTG与HIF-1结合,0.9%与HIF-2结合),这表明其他表观遗传机制也可能有助于定义HIF-结合位点。
讨论
我们描述了第一次使用ChIP结合下一代高通量测序来定义整个基因组中的HIF-α和HIF-1β结合位点。这项技术能够实现真正的全基因组覆盖,并比以前更精确地定位HIF结合位点。使用MCF-7细胞可以与先前报道的低氧诱导基因表达的全基因组研究进行比较,15以及同一细胞系中DNAse1超敏反应位点的高分辨率定位,并提供了迄今为止最完整的缺氧转录反应泛基因组分析。
暴露于DMOG的细胞中HIF-α结合与缺氧HIF-1β结合之间的高度一致性表明,这两种刺激均产生可比较的全基因组HIF-DNA结合模式。此外,在HIF-α和HIF-1β结合之间观察到的高度一致性(补充图3)表明,HIF-β只能将DNA作为异二聚体与HIF-1?结合,或者如果HIF-?能够将DNA与另一个伙伴结合(例如,作为Sp-1-结合复合体的一部分)38)它在与αβ-异二聚体相同的位点上这样做,亲和力/占有率低得多,或者在全基因组分析中鉴定的位点太少。相反,它也表明,在这些条件下,在这些细胞中,大多数HIF-1β结合为HIF-α/β异二聚体。
使用高度严格的标准,在基因组中发现了500多个HIF结合位点。其中许多位点位于启动子阵列覆盖的区域之外,并且远离核心启动子。事实上,HIF结合位点在远离任何已记录的启动子的数百千碱基处被观察到。核心HIF-结合RCGTG基序也观察到类似的富集()与启动子近端位点相比,这些启动子远距离结合位点中的DNAse1超敏位点(补充图10),而CpG岛仅在启动子近端位点富集(补充图10)。结合定量PCR的独立实验验证,这些结果表明,启动子远距离位点的鉴定是准确的,可能与功能相关。
HIF-结合和HIF-调节基因的最近邻分析15揭示了与随机选择的控制位点相当的距离分布。这种缺乏HIF结合和特别是HIF调节的基因座的聚类提供了反对基因的广泛操纵子样调节或HIF转录靶标的基因组聚类的证据。然而,我们不能排除远距离染色质元素在三维空间聚集形成低氧诱导的“转录工厂”的可能性
独创性途径分析(F) 证明HIF以HIF-1或HIF-2结合的各种偏见为靶向许多典型途径。与先前发表的工作一致,参与碳水化合物代谢的途径主要由HIF-1靶向,而在Oct4-调节的干细胞多能性中起作用的基因主要与HIF-2结合。46有趣的是,尽管siRNA研究表明,在MCF7细胞中,HIF-2似乎没有多少转录活性,但仍观察到特定HIF亚型的路径特异性关联,15这表明HIF结合的异构体特异性模式可能延伸到不同的细胞,并与限制转录活性的DNA后结合机制相一致。17,45
人类细胞中普遍表达的HIF的DNA结合泛基因组模式的查询能力提出了一个问题,即结合模式在多大程度上具有细胞类型特异性。先前关于HIF与启动子区域结合的研究表明,U87和HepG2细胞之间的区域一致性为60%。28为了在全基因组水平上尽早了解这个问题,我们将当前研究中确定的位点与786-0肾癌细胞中未发表的分析进行了比较(J.S.,D.R.M.,未发表的观察,2011年3月)。这表明启动子内和启动子间的远距离位点具有相似的一致性(重叠率分别为42%和36%)。
HIF结合数据与使用GSEA进行的HIF转录反应功能研究的相关性表明,即使在基因组距离超过100 kb的情况下,也存在与低氧诱导基因表达模式的稳健统计关联。事实上,这些研究表明,对于HIF-1结合,无论HIF-1在基因位点的结合位置如何,无论距离至少达到100 kb,对低氧诱导基因表达的影响在质量和数量上都是相似的,并且不管是否存在对HIF通路无反应的干预基因。这与大多数或所有启动子距离的HIF结合位点都是低氧诱导增强子的模型相一致,这些增强子通过DNA在潜在的非常大的距离上的环连与靶基因启动子处的转录复合体连接,从而对这些复合体的转录活性产生类似的影响与染色体上的物理距离无关。还需要进一步的工作来定义各个位点的物理相互作用,以及控制HIF结合和缺氧诱导HIF后转录复合物形成的事件的时间序列。有趣的是,在缺氧细胞中RNA Pol2结合的泛基因组研究中,我们通常观察到RNA Pol2与这些位点的低氧诱导关联,但没有证据表明之前未标记的转录物与它们与远距离启动子的物理关联相一致(J.S.,D.R.M.,未发表的观察,2011年3月)。
当前的ChIP-seq分析证实并扩展了对低氧诱导反应结构的观察,该结构是通过使用平铺启动子阵列的ChIP-ChIP分析得出的。27–30特别是,即使在分析中包括启动子远距离位点,我们也没有发现与HIF负调控的转录物位点相关的证据。这证实了HIF途径对转录物丰度的下调在很大程度上是间接的,甚至完全是间接的。
基因组中HIF结合的准确性提高和无偏见的确定也允许对HIF共识进行重大改进。这些研究揭示了RCGTG共识之外的许多位点的偏好,包括E-box基序CACGTG的相对排除,表明即使在缺氧细胞中,E-box蛋白的竞争性结合也可能将HIF排除在这些位点之外。
值得注意的是,即使对于RCGTG共识之外的残基,也无法区分HIF-1与HIF-2结合基序偏好,尽管HIF-2的结合位点与HIF-1结合位点的分布不同,在远离启动子的位点更为普遍。这表明,如果存在这样的基序,那么在HIF-结合区域的基序分析中,这些基序要么太多,要么太远,无法检测到,或者非序列定义的“表观遗传”染色质标记有助于2种亚型的差异结合。
与在泛基因组水平上分析的一些其他转录因子相比,基因组中定义的高强度HIF结合位点的数量相对较少。47这与HIF结合的相对杂乱的一级序列偏好形成对比,再次表明表观遗传过程必须决定HIF与DNA的结合,并且可能在限制缺氧的转录反应中特别重要。
由于HIF-α蛋白在常氧条件下通过蛋白水解降低到非常低的水平,我们发现大多数HIF-结合位点与正常氧条件下的DNAse1超敏位点一致,这有点令人惊讶,并反对HIF结合或缺氧本身导致染色质构象的广泛开放。然而,这一发现与观察结果一致,即红细胞生成素基因座的HIF结合位点对应于正常毒性的DNAse1超敏区,48染色质可及性可以预先决定糖皮质激素受体结合模式,49启动子处的HIF结合模式与这些位点的正常转录活性标记相关。28
然而,许多与活性转录基因相近或相距较远的DNA超敏基序都不能与HIF结合。这表明,决定这些增强子位点在不同细胞环境中分布的其他表观遗传因素可能对低氧转录反应有重大影响。鉴于HIF对氧调节生理学和疾病(包括癌症和贫血)的病理生理学的重要性,识别调节这些和其他限制HIF与离散位点结合的过程的表观遗传因子,对于理解这种高度多效性途径的病理生理学和治疗可操作性将是重要的。我们的结果为此类分析提供了一个框架。
数据集可从以下网站获得:ChIP-seq数据:http://www.ncbi.nlm.gov/geo/query/acc.cgi.?acc=GSE28352; 表达式数组数据,http://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE3188; 和ENCODE Digital DNAse1超敏数据,http://genome.ucsc.edu/cgi-bin/hg表格.
致谢
这项工作得到了威康信托基金会、英国癌症研究中心和英国高等教育资助委员会的支持。
脚注
本文的在线版本包含数据补充。
这篇文章的出版费用部分由页面费支付。因此,仅为了表明这一事实,根据《美国法典》第18卷第1734节,本文特此标记为“广告”。
作者
贡献:D.R.M.、J.S.、C.W.P.和P.J.R.设计了研究;J.S.和D.R.M.进行了实验;D.R.M.、S.O.和J.R.对数据进行了分析和解释,并进行了生物信息学分析;D.R.M.、J.S.、C.W.P.和P.J.R.撰写了手稿。
利益冲突披露:P.J.R.和C.W.P.是ReOx Ltd.的科学联合创始人。其余作者声明没有竞争性财务利益。
通信:David R.Mole,英国牛津大学威康人类遗传学信托中心,牛津,OX3 7BN;电子邮件:ku.ca.xo.lew@elomrd公司.
工具书类
1Beall CM、Cavalleri GL、Deng L等。西藏高原人低血红蛋白浓度相关EPAS1(HIF2alpha)的自然选择。美国国家科学院院刊。2010;107(25):11459–11464. [PMC免费文章][公共医学][谷歌学者] 2Yi X,Liang Y,Huerta-Sanchez E,等。50个人类外显子的测序揭示了对高海拔的适应。科学。2010;329(5987):75–78. [PMC免费文章][公共医学][谷歌学者] 三。Ang SO,Chen H,Hirota K,等。先天性丘瓦什红细胞增多症的基础是氧稳态的破坏。Nat Genet。2002;32(4):614–621.[公共医学][谷歌学者] 4Percy MJ、Furlow PW、Lucas GS等。家族性红细胞增多症HIF2A基因的获得性突变。N英格兰医学杂志。2008;358(2):162–168. [PMC免费文章][公共医学][谷歌学者] 5南岛YA、莫斯利J、巴迪西N、卡伦D、布朗森RT、凯林WG。,PHD2脯氨酰羟化酶的体细胞失活导致红细胞增多和充血性心力衰竭。鲜血。2008;111(6):3236–3244. [PMC免费文章][公共医学][谷歌学者] 6Semenza GL.有氧生活。科学。2007;318(5847):62–64.[公共医学][谷歌学者] 7Kaelin WG,Jr,Ratcliffe PJ。后生动物的氧气感应:HIF羟化酶途径的中心作用。分子细胞。2008;30(4):393–402.[公共医学][谷歌学者] 8斯科菲尔德CJ,拉特克利夫PJ。HIF羟化酶的氧气传感。Nat Rev Mol细胞生物学。2004;5(5):343–354.[公共医学][谷歌学者] 9Lando D,Gorman JJ,Whitelaw ML,Peet DJ。脯氨酰和天冬酰胺羟基化对低氧诱导因子的氧依赖性调节。欧洲生物化学杂志。2003;270(5):781–790.[公共医学][谷歌学者] 10Hsieh MM,Linde NS,Wynter A,等。抑制HIF脯氨酰羟化酶导致猕猴内源性红细胞生成素诱导、红细胞增多和适度的胎儿血红蛋白表达。鲜血。2007;110(6):2140–2147. [PMC免费文章][公共医学][谷歌学者] 11Bernhardt WM、Wiesener MS、Scigalla P等。脯氨酰羟化酶的抑制增加了ESRD中促红细胞生成素的生成。《美国肾脏病杂志》。2010;21(12):2151–2156. [PMC免费文章][公共医学][谷歌学者] 12凯林工作组。,Jr The von Hippel-Lindau肿瘤抑制蛋白:O2感知和癌症。Nat Rev癌症。2008;8(11):865–873.[公共医学][谷歌学者] 13.Pouyssegur J、Dayan F、Mazure NM。癌症中的缺氧信号和增强肿瘤消退的方法。自然。2006;441(7092):437–443.[公共医学][谷歌学者] 14Bertout JA、Patel SA、Simon MC。O的影响2关于人类癌症的可用性。Nat Rev癌症。2008;8(12):967–975. [PMC免费文章][公共医学][谷歌学者] 15Elvidge GP、Glenny L、Appelhoff RJ、Ratcliffe PJ、Ragoussis J、Gleadle JM。缺氧和2-羟戊酸依赖性双加氧酶抑制对基因表达的协同调节:HIF-1alpha、HIF-2alpha和其他途径的作用。生物化学杂志。2006;281(22):15215–15226.[公共医学][谷歌学者] 16Manalo DJ、Rowan A、Lavoie T等。HIF-1对血管内皮细胞缺氧反应的转录调节。鲜血。2005;105(2):659–669.[公共医学][谷歌学者] 17Hu CJ,Iyer S,Sataur A,Covello KL,Chodosh LA,Simon MC。低氧诱导因子1α(HIF-1α)和HIF-2α在干细胞中转录活性的差异调节。分子细胞生物学。2006;26(9):3514–3526. [PMC免费文章][公共医学][谷歌学者] 18Wang V,Davis DA,Haque M,Huang LE,Yarchoan R.缺氧诱导因子-1α和缺氧诱导因子-2α在HEK293T细胞中的差异基因上调。癌症研究。2005;65(8):3299–3306.[公共医学][谷歌学者] 19Choi SM,Oh H,Park H。芳香烃受体核转运体(Arnt)依赖性低氧调节基因的微阵列分析。FEBS J公司。2008;275(22):5618–5634.[公共医学][谷歌学者] 20Ortiz-Barahona A、Villar D、Pescador N、Amigo J、del Peso L.通过整合转录诱导数据和硅结合位点预测的概率模型对低氧诱导因子结合位点和靶基因进行全基因组鉴定。核酸研究。2010;38(7):2332–2345. [PMC免费文章][公共医学][谷歌学者] 21Oikawa M、Abe M、Kurosawa H、Hida W、Shirato K、Sato Y。缺氧通过缺氧诱导因子-1的活性诱导转录因子ETS-1。生物化学与生物物理研究委员会。2001;289(1):39–43.[公共医学][谷歌学者] 22Laderoute KR、Calaoagan JM、Gustafson Brown C等。C-jun/AP-1对慢性缺氧的反应是低氧诱导因子1α依赖性的。分子细胞生物学。2002;22(8):2515–2523. [PMC免费文章][公共医学][谷歌学者] 23Miyazaki K、Kawamoto T、Tanimoto K、Nishiyama M、Honda H、Kato Y.DEC1和DEC2基因启动子区功能性缺氧反应元件的鉴定。生物化学杂志。2002;277(49):47014–47021.[公共医学][谷歌学者] 24Koshiji M、Kageyama Y、Pete EA、Horikawa I、Barrett JC、Huang LE。HIF-1α通过功能性对抗Myc诱导细胞周期阻滞。EMBO J。2004;23(9):1949–1956. [PMC免费文章][公共医学][谷歌学者] 25Gordan JD,Lal P,Dondeti VR,等。HIF-α对c-Myc的影响可区分散发性VHL缺乏型透明细胞肾癌的两种亚型。癌细胞。2008;14(6):435–446. [PMC免费文章][公共医学][谷歌学者] 26Wenger RH、Stiehl DP、Camenisch G.在HRE共识中整合氧气信号。科学STKE。2005;2005(306):第12条。[公共医学][谷歌学者] 27Mole DR、Blancher C、Copley RR等。低氧诱导因子(HIF)-1α和HIF-2αDNA结合与低氧诱导转录物表达谱的全基因组关联。生物化学杂志。2009;284(25):16767–16775. [PMC免费文章][公共医学][谷歌学者] 28Xia X,Kung AL.HIF-1与转录活性位点的优先结合决定了细胞对缺氧的特异性反应。基因组生物学。2009;10(10) :R113。 [PMC免费文章][公共医学][谷歌学者] 29Xia X,Lemieux ME,Li W,等。HIF结合和反式激活的综合分析揭示了其在维持组蛋白甲基化稳态中的作用。美国国家科学院院刊。2009;106(11):4260–4265. [PMC免费文章][公共医学][谷歌学者] 30Krieg AJ、Rankin EB、Chan D、Razorenova O、Fernandez S、Giaccia AJ。低氧诱导因子1α对组蛋白去甲基化酶JMJD1A的调节增强低氧基因表达和肿瘤生长。分子细胞生物学。2010;30(1):344–353. [PMC免费文章][公共医学][谷歌学者] 31Sabo PJ,Kuehn MS,Thurman R,等。使用拼接DNA微阵列绘制体内DNase I敏感性的基因组尺度图。自然方法。2006;三(7):511–518.[公共医学][谷歌学者] 32Sabo PJ、Hawrylycz M、Wallace JC等。通过染色质结构的数字分析发现功能性非编码元件。美国国家科学院院刊。2004;101(48):16837–16842. [PMC免费文章][公共医学][谷歌学者] 33.Ji H、Jiang H、Ma W、Johnson DS、Myers RM、Wong WH。用于分析ChIP-ChIP和ChIP-seq数据的集成软件系统。国家生物技术。2008;26(11):1293–1300. [PMC免费文章][公共医学][谷歌学者] 34Ji H、Vokes SA、Wong WH。哺乳动物转录因子全基因组染色质免疫沉淀数据的比较分析。核酸研究。2006;34(21):e146。 [PMC免费文章][公共医学][谷歌学者] 35周强,王伟。CisModule:通过分层混合建模从头发现顺调控模块。美国国家科学院院刊。2004;101(33):12114–12119. [PMC免费文章][公共医学][谷歌学者] 36Subramanian A、Kuehn H、Gould J、Tamayo P、Mesirov JP。GSEA-P:基因集富集分析的桌面应用程序。生物信息学。2007;23(23):3251–3253.[公共医学][谷歌学者] 37.Mootha VK、Lindgren CM、Eriksson KF等。参与氧化磷酸化的PGC-1alpha应答基因在人类糖尿病中协调下调。Nat Genet。2003;34(3):267–273.[公共医学][谷歌学者] 38Koshiji M、To KK、Hammer S等。HIF-1α通过转录下调MutSalpha表达诱导遗传不稳定性。分子细胞。2005;17(6):793–803.[公共医学][谷歌学者] 39.Subramanian A、Tamayo P、Mootha VK等。基因集富集分析:解释全基因组表达谱的基于知识的方法。美国国家科学院院刊。2005;102(43):15545–15550. [PMC免费文章][公共医学][谷歌学者] 40Schneider TD,Stephens RM。序列标识:显示一致序列的新方法。核酸研究。1990;18(20):6097–6100. [PMC免费文章][公共医学][谷歌学者] 41斯旺森高中。促进基因激活的AHR/ARNT异二聚体的DNA结合和蛋白质相互作用。化学生物相互作用。2002;141(1):63–76.[公共医学][谷歌学者] 42Semenza GL,Wang GL。缺氧通过从头合成蛋白质诱导的核因子在转录激活所需的位置与人类促红细胞生成素基因增强子结合。分子细胞生物学。1992;12(12):5447–5454. [PMC免费文章][公共医学][谷歌学者] 43Pugh CW、Ebert BL、Ebrahim O、Ratcliffe PJ。小鼠促红细胞生成素3′增强子在不同细胞系中传递氧调节反应的功能域特征。Biochim生物物理学报。1994;1217(3):297–306.[公共医学][谷歌学者] 44Pescador N、Cuevas Y、Naranjo S等。一种调节egl九同源物3(egln3/phd3)基因表达的功能性低氧反应元件的鉴定。生物化学杂志。2005;390(1):189–197. [PMC免费文章][公共医学][谷歌学者] 45Lau KW、Tian YM、Raval RR、Ratcliffe PJ、Pugh CW。肾癌细胞中低氧诱导因子α的靶基因选择性通过DNA后结合机制传递。英国癌症杂志。2007;96(8):1284–1292. [PMC免费文章][公共医学][谷歌学者] 46Covello KL、Kehler J、Yu H等。HIF-2alpha调节Oct-4:缺氧对干细胞功能、胚胎发育和肿瘤生长的影响。基因发育。2006;20(5):557–570. [PMC免费文章][公共医学][谷歌学者] 47Fullwood MJ,Liu MH,Pan YF,等。雌激素受体-α结合人类染色质相互作用组。自然。2009;462(7269):58–64. [PMC免费文章][公共医学][谷歌学者] 48Semenza GL,Nejfelt MK,Chi SM,Antonarakis SE。低氧诱导核因子与位于人类红细胞生成素基因3′的增强子元件结合。美国国家科学院院刊。1991;88(13):5680–5684. [PMC免费文章][公共医学][谷歌学者] 49John S、Sabo PJ、Thurman RE等。染色质可及性预先决定糖皮质激素受体结合模式。Nat Genet。2011;43(3):264–268. [PMC免费文章][公共医学][谷歌学者]