结果
ESCs中主转录因子和介体占据的大基因组域
先前的研究表明,Oct4、Sox2和Nanog转录因子对ESC基因组位点的共现性可高度预测增强子活性(Chen等人,2008)而Mediator通常与这些站点关联(Kagey等人,2010年). 我们为小鼠ESCs中的Oct4、Sox2和Nanog(OSN)生成了高质量的ChIP-Seq数据集,并确定了8794个由这三种转录因子共同占据的位点,以注释ESCs的增强子(表S1,数据S1). 对在ESC生物学中具有显著作用的几个基因的增强子进行的检查显示出一个不寻常的特征:一个包含成簇组分增强子的大域(). 而绝大多数增强子跨越数百个碱基对的DNA片段(),基因组的某些部分包含高达50kb的增强子簇(). 我们发现,根据介体水平,ESC增强子可分为两类:一类包括绝大多数增强子,另一类包括231个大的增强子结构域(). 大约40%的与增强子相关的介体信号在这231个增强子域中被发现。含有高水平介体的231个结构域(我们称之为超增强子)的关键特征是:1)它们跨越的DNA区域的中位长度比典型增强子大一个数量级,2)它们的介体水平至少比典型增增子大一数量级().
ESC中的增强器和超级增强器A、 B)ESC转录因子Oct4、Sox2和Nanog(OSN)以及位于格克和miR-290-295型ESCs基因座。基因模型如结合图谱所示。增强条和比例尺显示在装订轮廓上方。
C)8794 ESC增强器中介体ChIP-Seq信号(总读数)的分布。介质占用率在增强子区域中的分布并不均匀,一部分增强子(231个超级增强子)包含异常高的介质。
D)8563个典型增强子和231个超增强子中介体ChIP-Seq密度的转移基因(每对碱基百万读数)。转移基因集中在增强子区域(典型增强子为703个碱基对,超增强子8.7kb),每个增强子区周围有3kb的碱基对。增强子特征的ChIP-Seq倍差介体、H3K27ac、H3K4me1和超增强子与典型增强子的DNaseI超敏反应显示在后基因下方。增强器处的折叠差异是指超级增强器的平均ChIP-Seq信号(总读数)除以典型增强器上的平均ChIP-Seq。增强子成分的折叠差异是指超增强子组分的平均ChIP-Seq密度(每对碱基的百万读数)除以典型增强子组成的平均ChIP-Seq浓度。另请参见图S1A和数据S1.
E)介体、H3K27ac、H3K4me1、DNaseI超敏反应和OSN标准化ChIP-Seq信号在8794个ESC增强子中的分布。对于每个增强器特征,通过将每个ESC增强器处的ChIP-Seq信号除以最大ChIP-Seq信号,对曲线进行标准化。X轴上的增强器分别针对每个增强器功能进行排名(即,位置8000处的确切增强器对于每个增强子功能是不同的)。调整x轴和y轴,以便可以可视化每个增强器特征的分布差异。另请参见图S1B.
F)Oct4、Sox2、Nanog、Klf4和Esrrb的ChIP-Seq绑定配置文件格克和miR-290-295型ESCs基因座。
G)8563个典型增强子和231个超增强子区域内的组分增强子中Oct4、Sox2、Nanog、Klf4和Esrrb ChIP-Seq密度的转移基因。每个后基因以一个组分增强子为中心,在组分增增子区域周围有2kb。
H)8563种典型增强子和231种超增强子中成分增强子的Oct4、Sox2、Nanog、Klf4和Esrrb ChIP-Seq密度框线图。P值(Oct4=0.012,Nanog=10−4,Sox2=0.11,Klf4=10−34,Esrrb=10−25)采用双尾t检验进行计算。
I)表中描述了与基因组背景相关的超增强区内的组分增强子富集的转录因子结合基序以及相关的p值。CTCF和c-Myc不富集。
J)
左侧面板,方框图描述了典型增强子内组分增强子和超增强子中组分增效子处Oct4、Sox2或Nanog结合基序的数量。右侧面板,方框图描述了典型增强子内成分增强子处的Klf4或Esrrb结合基序数量以及超增强子区的成分增强器处的Klf4或Esrb结合基元数量。P值(Oct4/Sox2/Nanog=0.36,Klf4/Esrrb=10−45)采用双尾t检验进行计算。
ESC超增强子区域的进一步表征表明,它们包含典型增强子的许多特征,但规模相当大(,图S1A). 先前的研究表明,组蛋白修饰的核小体H3K27ac和H3K4me1在活性增强子处富集(Creyghton等人,2010年;Rada-Iglesias等人,2011年). 根据ChIP-Seq数据,超增强子组蛋白修饰的水平至少比典型增强子高一个数量级(). 这些高水平的组蛋白修饰是由于结构域的大小和组分增强子的占据密度所致(). DNase I超敏反应也得到了类似的结果(,图S1A),增强器的另一个功能(Dunham等人,2012年). 我们比较了OSN、Mediator、H3K27ac、H3K4me1的ChIP-Seq数据以及DNaseI超敏数据的相对能力,以区分超增强子和典型增强子(扩展实验程序和图S1B). 我们发现Mediator表现最佳,尽管这些增强子的每个特征都可以在一定程度上用于区分超增强子和典型增强子(,图S1B).
为了研究超增强子是否具有可能进一步将其与典型增强子区分开来的特征,我们检查了18种不同转录因子、组蛋白修饰、染色质调节因子以及DNaseI超敏反应的ChIP-Seq数据(表S2). 最显著的差异是转录因子Klf4和Esrrb的占有率(). 而典型增强子和超增强子中的组分增强子Oct4、Sox2和Nanog水平相似(p值=0.012,10−4Klf4和Esrrb的水平在超增强子结构域的组分增强子中表现出较高的占有率(p值<10−34和10−25)(). 因此,超增强子不仅是典型增强子的簇,而且在Klf4和Esrrb中特别丰富,之前已经证明,它们在ESC基因表达程序和体细胞重编程为诱导多能干细胞(iPS)中发挥重要作用(Feng等人,2009年;Festuccia等人,2012年;Jiang等人,2008;Martello等人,2012年;Percharde等人,2012年;高桥和山中,2006年).
为了进一步了解超增强子形成的机制,我们研究了基因组中这些和其他区域已知转录因子结合基序的频率。我们发现,超级增强子区域内的组成增强子显著富集Oct4、Sox2、Nanog、Klf4和Esrrb结合的序列基序,但不富集ESCs中表达的其他转录因子如CTCF和c-Myc结合的基序(). Oct4、Sox2和Nanog的序列基序在典型增强子和超增强子域中的组分增强子中表现出相似的富集水平,但Klf4和Esrrb的基序在超增强器中的组份增强子显著富集(p值<10−45)(). 这些数据表明ESC超级增强子是大的增强子簇,其可以通过转录因子Klf4和Esrrb的存在以及异常水平的介体来区别于典型的增强子,并表明这些结构域是特定主转录因子与其结合位点序列的密集簇结合的结果。
超级增强子与ESC关键身份基因相关
增强子倾向于与相邻基因循环并关联,以激活其转录(Ong和Corces,2011年). 大多数相互作用发生在增强子~50kb的距离内,尽管许多相互作用可能发生在更大的距离上,最多可达几个兆碱基(Sanyal等人,2012年). 以前的研究使用了各种方法将增强子分配给目标基因,包括邻近性、增强子-启动子单元分配(EPU)和染色体构象捕获技术发现的全基因组相互作用(Dixon等人,2012年;沈等,2012;Whyte等人,2012年). 我们最初使用邻近性将231个超级增强子分配给210个基因(表S1)因为超增强子往往会与它们相关的基因重叠。这些超级增强器邻近分配与EPU分配高度一致(95%一致)(表S3). 此外,93%由邻近性确定的超增强子-启动子对发生在Hi-C定义的相同拓扑域内(,表S3). 此外,对于其中三个基因(10月4日,纳克、和左侧1),先前使用染色质构象捕获(3C)证明了超增强子部分与靶启动子之间的相互作用(Kagey等人,2010年).
超增强子与关键ESC多能性基因相关A)OSN和Med1的ChIP-Seq绑定配置文件Klf4公司ESCs基因座。先前描述的Hi-C相互作用频率(标准化相互作用计数)和包含拓扑域一部分的基因组坐标(Dixon等人,2012年),在装订轮廓上方指示。
B)OSN和Med1的ChIP-Seq绑定配置文件10月4日和Sox2系统ESCs基因座。基因模型如结合图谱所示。
C)与超增强子相关并在ESC生物学中发挥突出作用的选定基因列表。
D)超增强子与编码转录因子、辅活化因子和染色质调节因子的基因有关,这些基因对维持ESC状态很重要。超增强子相关基因的基因集富集分析(GSEA)揭示了这些基因编码的调节因子,其shRNA敲除对Oct4表达和ESC状态影响最大。敲除对ESC身份重要的基因会导致10月4日的损失,这反映在负的Z评分上。P值(10−2)作为GSEA分析的一部分进行计算。
E)超级增强子相关基因的基因本体论(GO)功能类别。编码对DNA合成、蛋白质合成和代谢重要的因子的基因没有得到富集。另请参见图S2.
F)ESC核心控制电路的一小部分示意图。编码主转录因子的基因本身由超增强子驱动。这些主因子形成一个相互连接的反馈回路,并调节其自身的表达,以及在ESC生物学中发挥重要作用的其他转录因子和非编码RNA的表达。
这组超增强子相关基因几乎包含了所有与ESC特性控制相关的基因(表S1). 它们包括编码主要ESC转录因子Oct4、Sox2和Nanog的基因(,表S1). 它们还包括编码与ESC特性控制有关的大多数其他转录因子的基因,以及编码DNA修饰酶和miRNA的基因,这些基因在ESC基因表达程序的控制中起着重要作用(). 例如,Klf4和Esrrb在ESC生物学中起着重要作用,并且可以促进重新编程(Feng等人,2009年;Festuccia等人,2012年;Jiang等人,2008;Martello等人,2012年;Percharde等人,2012年;高桥和山中,2006年). Tet基因的产物与最活跃的启动子相关,并负责ESCs中DNA的全球5-羟甲基化(Wu等人,2011年;Yu等人,2012a). 这个miR-290-295型该位点在ESCs中产生最丰富的miRNAs(卡拉布雷斯等人,2007年)对胚胎存活至关重要(Medeiros等人,2011年).
以前的研究已经确定了编码广泛的转录因子、辅活化因子和染色质调节因子的基因,这些都是维持ESC状态所必需的(丁等人,2009;Fazzio等人,2008年;胡等,2009;Kagey等人,2010年). 为了进一步研究超增强子相关基因参与ESC状态控制的程度,我们比较了超增强器相关基因集与短发夹RNA(shRNA)敲除筛选中涉及2000个调节因子的基因,其中包括小鼠基因组中编码的大多数转录因子和染色质调节因子(Kagey等人,2010年). 我们发现,大多数编码转录因子、辅活化因子和染色质调节因子的基因,其敲除最严重地导致ESC状态丧失,与超增强因子相关(p值<10−2) (). 这进一步支持了超增强相关基因编码许多调节因子的概念,这些调节因子是建立和维持ESC状态的关键。
基于基因本体功能类别的分析,编码转录因子的基因是超增强相关基因的主要类别(). 相反,超级增强子没有发现与家政基因相关(图S2). ESC主转录因子Oct4、Sox2和Nanog先前已被证明可形成相互连接的自动调节环,其中所有三个因子作为一个组与各自基因的启动子结合,并形成ESC的核心调节回路(Boyer等人,2005年;Loh等人,2006年). Klf4和Esrrb在超级增强子中的发现,以及Klf4和Esrrb在ESC基因表达程序和体细胞重编程为iPS细胞中发挥重要作用的证据(Feng等人,2009年;高桥和山中,2006年)建议将该自动调节回路扩大到包括Klf4和Esrrb().
超级增强器的功能属性
与典型增强子相关的基因相比,超增强子关联基因的表达水平通常更高(p值<10−5)(,图S3A,表S4)这表明,超增强子可以驱动其靶基因的高水平表达。为了测试超增强子是否比典型的ESC增强子具有更强的增强子活性,我们将这些元素的DNA片段克隆到荧光素酶报告结构中,随后将其转染到ESC中。超增强子中的组分增强子片段被定义为一个600–1400碱基对区域,其单峰Oct4/Sox2/Nanog占位,与典型增强子的单峰相比产生了更高的荧光素酶活性(高3.8倍;p值=0.02)(). 这些结果与超增强子及其成分有助于驱动控制ESC特性的关键基因的高水平转录的想法一致。
超增强子赋予高转录活性和对干扰的敏感性A)典型增强子、超增强子和所有增强子相关基因以及前1000个表达最高的看家基因的表达框线图(外显子每千碱基百万映射读数(RPKM))。表示我们有表达数据的每个类别的基因数量。P值(10−5)采用双尾t检验进行计算。另请参见图S3A和表S4.
B)
上部面板,OSN和Med1的ChIP-Seq绑定配置文件Sgk1公司典型增强子和埃斯勒布超增强子位点。带虚线边框的灰色条表示克隆的区域。下部面板,转染24小时后荧光素酶活性图,归一化为转染的对照质粒。与所选基因相邻的增强子被克隆到含有荧光素酶由10月4日启动子,然后转染到ESCs。使用双尾t检验计算P值(0.02)。另请参见图S3B.
C)
上部面板,针对10月4日用shRNAs转导的ESC示意图。下部面板,与用针对GFP的shRNA转导的对照ESCs相比,分化的ESCs(转导后3、4和5天)中的倍数变化表达的盒图。P值(第3天=10−5,第4天=10−8,第5天=10−10)采用双尾t检验进行计算。另请参见图S3C.
D)
上部面板,转导shRNAs对抗介体亚单位Med12的ESCs示意图。下部面板与对照ESC相比,中位缺失ESCs(转导后3、4和5天)中折叠变化表达的方框图。P值(第3天=10−11,第4天=10−11,第5天=10−13)采用双尾t检验进行计算。
为了获得有助于超级增强子中单个增强子元件更高活性的因素的线索,我们根据基因组位点的ChIP-Seq数据,确定增强子元素中特定转录因子的水平是否与报告分析中的荧光素酶活性水平相关。Klf4和Esrrb的存在与高水平的荧光素酶活性相关(图S3B). 因此,Klf4和Esrrb特别富含超增强剂()在这些报告分析中,可能有助于超级增强子中增强子元素的优越活性。
接下来,我们研究了超增强子的功能属性是否可以解释Oct4或Mediator水平降低对ESC基因表达程序的影响非常相似,并导致ESC状态同样快速丧失的观察结果(Kagey等人,2010年). 增强子通常通过多种转录因子和辅活化因子之间的协同作用发挥作用(凯里,1998年;Carey等人,1990年;Giese等人,1995年;Kim和Maniatis,1997年;塔诺斯和马尼提斯,1995年). 与具有较少结合位点的增强子相比,具有大量转录因子结合位点的增强子的转录输出对转录因子浓度的变化更为敏感(Giniger和Ptashne,1988年;格里格斯和约翰斯顿,1991年). 因此,我们假设,与正常增强子相关的基因相比,超增强子关联的基因可能对增强子结合因子水平的扰动更敏感。我们对该模型进行了两次测试。
在ESCs中,降低Oct4水平会导致ESC特异性基因表达和分化的丧失。如果与其他基因相比,超增强子相关基因对主转录因子的丢失更敏感,那么Oct4水平的降低应优先导致超增强器相关基因表达的丢失。为了验证这个想法,我们使用shRNAs降低Oct4转录水平,这导致滋养层主转录因子Cdx2的激活和细胞分化()(Deb等人,2006年;Niwa等人,2005年;Strumpf等人,2005年). Oct4缺失导致细胞形态变化,与5天的ESC分化一致(图S3C). 我们分析了Oct4缺失后3、4和5天的基因表达,并观察到与超增强子相关的基因比与典型增强子有关的基因转录水平更早、更深刻地降低(p值<10−5, 10−8、和10−10)(). 这些结果表明,ESC超增强子相关基因的转录产物在分化过程中迅速优先减少。
如果与其他基因相比,超增强子相关基因对辅激活物的丢失更敏感,那么介体亚单位水平的降低应优先影响超增强器相关基因的表达。当在ESCs中使用shRNAs降低介体水平时,在超增强相关基因中观察到对基因表达的最显著影响(p值<10−11, 10−11、和10−13)(). 总之,这些结果表明,与具有典型增强子的其他活性基因相比,降低Oct4和Mediator水平对超增强子相关基因表达的影响更为深远。因此,这些结果可以解释Oct4缺失和介体亚基缺失对ESC状态有类似影响的观察结果(Kagey等人,2010年).
B细胞中的超增强剂
我们研究了在胚胎干细胞中发现的超增强因子在分化细胞中是否有类似的对应物。我们使用ChIP-Seq数据注释了小鼠前体B(pro-B)细胞中主转录因子PU.1的13814个增强子(表S5)(DeKoter和Singh,2000年;纳特和基,2007年). 先前的研究表明,PU.1对B前基因组位点的占有是增强子活性的预测(Abujarour等人,2010年;Wlodarski等人,2007年). 我们发现主转录因子PU.1和介体的全基因组占有率高度相关(,图S4). 当介体水平与ChIP-Seq信号排列的增强子相比较时,这些细胞中的增强器可分为两类,正如ESCs所观察到的那样(). 前B细胞有395个大的结构域,与ESCs中发现的超增强子具有共同的关键特征:它们跨越的DNA结构域的中位长度比典型增强子大一个数量级,并且它们的介体水平至少比典型增效子大一数量级(). 在增强子处观察到的所有介体信号中,近40%与前B细胞中的超增强子结构域有关。
前B细胞中的超增强剂A)PU.1和Med1的ChIP-Seq装订型材福克斯1B前细胞中的位点。
B)介体ChIP-Seq密度在13814个前B增强子中的分布,其中一个子集增强子(395个超增强子)包含异常高的介体。另请参见图S4.
C)原B细胞中典型和超增强子介体密度的转移基因。变位基因集中在增强子区域(典型增强子为422个碱基对,超增强子15.4kb),每个增强子区周围有3kb。超增强子与典型增强子的介导子的ChIP-Seq倍数差异显示在宏基因下方。
D)表中描述了与基因组背景和相关p值相关的超增强区内在成分增强子富集的转录因子结合基序。CTCF和Zfx不富集。
E)
左侧面板,方框图描述了典型增强子内组分增强子的PU.1、Ebf1或Foxo1结合基序数量和超增强子中组分增效子的数量。右侧面板,方框图描述了典型增强子中组分增强子和超增强子区域中组分增强子处E2A结合基序的数量。P值(PU.1/Ebf1/Foxo1=10−5,E2A=10−22)采用双尾t检验进行计算。
F)与超增强子相关并在B细胞生物学中发挥突出作用的选定基因列表。
G)前B细胞中典型增强子、超增强子和所有增强子相关基因的表达方框图。表示我们有表达数据的每个类别的基因数量。P值(10−6)采用双尾t检验进行计算。
我们研究了超增强子和基因组其他区域中与前B转录因子结合的DNA序列的频率。超增强子区域内的组分增强子显著富集于PU.1结合的序列基序簇,以及一组与B细胞控制有关的其他转录因子(). 在超增强子结构域中具有序列基序富集的转录因子包括Ebf1、E2A和Foxo1,这些转录因子以前被证明对B细胞的控制很重要(Lin等人,2010年). 与典型增强子成分相比,E2A的序列基序在超增强子组分中显著富集(p值<10−22)(). E2A在B细胞淋巴生成过程中对前B细胞的发育至关重要(Kwon等人,2008年). 这些发现与获得的ESCs一致,其中主转录因子的DNA序列基序在紧密间隔的簇中富集。
接下来,我们在原B细胞中发现了与超增强相关的基因,并发现其中许多基因是B细胞识别的重要调节因子(). 例如,前B细胞中的超增强相关基因包括福克斯1和发票5d在常见的淋巴祖细胞中,Foxo1与Ebf1协同作用,将B细胞命运指定为正反馈回路的一部分(Mansson等人,2012年),而脂质代谢酶由发票5d,SHIP1,去磷酸化蛋白质以调节B细胞抗原受体(BCR)信号反应(Alinikula等人,2010年). 与ESCs一样,与前B细胞中的超增强子相关的基因表达水平高于与典型增强子有关的基因(p值<10−6)(,表S5).
超级增强子是细胞类型特异性的,标记关键细胞识别基因
为了进一步研究超增强子是否是哺乳动物细胞的一般特征,我们将这些元素的研究扩展到了一系列其他细胞类型,其中控制细胞状态的关键转录因子得到了明确定义(). 我们发现,小鼠肌管(MyoD)、辅助T细胞(Th)和巨噬细胞(C/EBPα)的主要转录因子也与大量增强子结合(图S5A、B),并且这些大的结构域与这些细胞生物学中主要特征的基因有关(,图S5C,表S6). 例如,在肌管中,一种超增强因子与编码MyoD的基因有关,MyoD是骨骼肌的主要调节因子,也是将成纤维细胞重编程为肌肉细胞的第一个因子(塔普斯科特,2005年;Weintraub等人,1989年). 在Th细胞中,超增强因子与该基因相关七氟化碳编码T细胞因子1(Tcf-1),对造血过程中T细胞的产生至关重要(Staal和Sen,2008年;薛和赵,2012;Yu等人,2012b). 在巨噬细胞中,超增强因子与编码细胞外基质糖蛋白Thbs-1的基因相关,Thbs-1参与巨噬细胞对凋亡细胞的清道夫识别(萨维尔等人,1992年). 这些结果支持这样的观点,即控制细胞状态的关键转录因子与与细胞特性关键的特定基因相关的增强子簇结合。
超增强子通常与关键细胞特性基因相关A)主转录因子(ESCs中的OSN;pro-B细胞中的PU.1;肌管中的MyoD;Th细胞中T-bet;巨噬细胞中的C/EBPα)的ChIP-Seq结合谱埃斯勒布,发票5d,Myod1型,七氟化碳和Thbs-1型基因座。另请参见图S5A、B.
B)ESCs(蓝色边界)、pro-B细胞(绿色边界)和肌管(橙色边界)中典型增强子相关和超增强子关联基因的文氏图。
C)ESCs(蓝色边界)、pro-B细胞(绿色边界)、肌管(橙色边界)、Th细胞(棕色边界)和巨噬细胞(紫色边界)中典型增强子相关和超增强子关联基因的Chow-Ruskey图。每个交叉点周围的边界颜色对应于基因重叠的细胞类型。中间的红色圆圈表示所有5种单元格类型的重叠。较浅的红色、橙色和黄色表示较少细胞类型的重叠。每个交叉点的面积与交叉点内的基因数量成正比。
D)超增强子与在细胞类型特异性生物学中发挥显著作用的基因相关。显示了ESCs、前B细胞、肌管、Th细胞和巨噬细胞中与超增强子相关的基因的前10个基因本体术语。对应于每个基因本体术语的P值显示为一个颜色条,颜色刻度条如下所示。另请参见图S5C、D.
与转录因子结合并控制任何一种细胞类型中转录的一组增强子可以促进细胞类型特异性基因和在多种细胞类型中活跃的基因的表达(Bernstein等人,2012年;沈等,2012;Yip等人,2012年). 在ESCs、前B细胞、肌管、Th细胞和巨噬细胞中发现的超增强因子跨越几乎完全是细胞类型特异性的结构域(,图S5D)与这些元素相关的基因相对于典型的增强子相关基因具有高度的细胞类型特异性(). 这些结果与以下观点一致:超增强子是由关键转录因子与控制独特细胞特性的基因相关的结合位点簇结合而形成的。
如果超增强子通常在功能与细胞特性相关的基因上形成,我们可能认为超增强器相关基因是细胞类型的定义。当使用与每种细胞类型中的超增强子相关的一组基因进行基因本体分析时,我们发现为每种细胞获得的前10个最重要的生物过程术语显著描述了每种细胞的特定功能(). 这一结果表明,超增强相关基因可能是有价值的细胞识别生物标记物。
讨论
我们已经确定了超大的增强子结构域,这些结构域被主转录因子占据,并与编码细胞特性关键调节因子的基因相关。在ESCs中,这些超增强因子由增强因子簇组成,这些增强因子簇由关键转录因子和介体辅激活因子复合体结合形成。ESC超增强子与典型增强子在大小、转录因子密度和含量、激活转录的能力和对扰动的敏感性方面不同。超增强子存在于多种其他细胞类型中,它们与关键细胞类型特异性基因相关,已知这些基因在其生物学中起着重要作用。这些结果暗示了超增强剂在哺乳动物细胞特性的控制中的作用。
超增强子的形成似乎是大量主转录因子与在这些大结构域中相对丰富的DNA序列簇结合的结果。ESC转录因子Oct4、Sox2、Nanog、Klf4和Esrrb具有富含超增强域的DNA结合基序。超级增强子不仅仅是典型增强子的簇,而且特别富含Klf4和Esrrb,之前已经证明它们在ESC基因表达程序和体细胞重编程为iPS细胞中发挥重要作用(Feng等人,2009年;Festuccia等人,2012年;Jiang等人,2008;Martello等人,2012年;Percharde等人,2012年;高桥和山中,2006年). 此外,超增强子相关基因对增强子结合因子和辅因子水平的降低高度敏感。我们推测,自然导致ESC分化的信号可能利用超增强相关基因的这种敏感性来促进向新基因表达程序的过渡。
值得注意的是,编码ESC主转录因子的基因本身由超增强子驱动,形成一个反馈回路,其中关键转录因子调节其自身的表达(). 早期的研究确定了这个相互连接的自动调节环的一部分,包括编码Oct4、Sox2和Nanog的基因,但没有发现与这个调节环中的基因相关的异常增强子结构(Boyer等人,2005年;Loh等人,2006年). 在这些基因上形成超级增强子也很有趣,因为这表明超级增强器通常可以识别对控制细胞特性很重要的基因,并且在某些情况下能够重新编程细胞命运。事实上,我们发现了与控制多种细胞类型中细胞特性的基因相关的超增强子的证据,其中一些基因确实编码已被证明可以重新编程细胞命运的因子。
我们发现,可以通过搜索增强子结合转录因子的结合位点簇来识别超增强子,并且可以通过辅助因子或增强子相关替代标记(如组蛋白H3K27ac或DNaseI超敏性)的占据来将其与典型增强子区分开来。以前的研究已经注意到许多不同的ESC转录因子可以结合到称为多转录因子结合位点的位点(Chen等人,2008;Kim等人,2008年)但这些基因座不同于超增强子,与不同的基因相关。其他研究也确定了参与基因控制的大基因组结构域,但没有注意到编码细胞状态关键调节因子的基因通常由超级增强子驱动。例如,IgH增强子(约20kb)、Th细胞受体(约11.5kb)和β-珠蛋白增强器(约16kb)等具有成簇转录因子结合位点或DNaseI超敏位点的大控制区已被描述(Diaz等人,1994年;Forrester等人,1990年;Grosveld等人,1987年;Madisen和Groudine,1994年;迈克尔森等人,1995年;奥金,1990年). 以前的研究可能没有注意到与关键细胞身份基因相关的增强子活性的大区域,因为大多数现有算法通常寻求基因组小区域内因子结合或DNaseI超敏反应的证据。然而,有一些算法是为识别大域而设计的(安永会计师事务所(Ernst and Kellis),2010年;Filion等人,2010年;Hon等人,2008年;瑟曼等人,2012年),并且我们在这里描述的算法对于进一步发现超增强体和其他大域应该是有用的。
关键细胞识别基因的超增强子的存在为哺乳动物细胞的转录控制提供了新的见解。这里描述的证据表明,哺乳动物基因组在编码细胞状态关键驱动因素的基因附近进化出了DNA序列簇。这些簇受关键转录因子组合的约束,形成细胞类型特异性超增强子,并以此方式控制与特定细胞身份相关的基因表达程序。
超级增强子的概念可能有助于绘制包含哺乳动物的许多不同细胞类型的调控电路。发现数千个转录因子如何协同控制脊椎动物大量细胞中的基因表达程序是一项非常复杂的任务。然而,如果只有几百个超级增强子控制建立和维持细胞特性的关键基因,那么就有可能创建描述细胞状态转录控制关键特征的基本模型。
实验程序
细胞培养
V6.5,小鼠胚胎干细胞在辐照的小鼠胚胎成纤维细胞(MEF)上生长。如前所述,细胞在标准ESC条件下生长(Whyte等人,2012年). 细胞生长在0.2%涂胶(Sigma,G1890)的ESC培养基组织培养板上;DMEM-KO(Invitrogen,10829-018)补充15%胎牛血清(Hyclone,特征为SH3007103)、1000 U/ml LIF(ESGRO,ESG1106)、100 uM非必需氨基酸(Invit罗gen,11140-050)、2 mM L-谷氨酰胺(Invitorgen,25030-081)、100 U/ml青霉素、100 ug/ml链霉素(Invitrougen,15140-122)、,和8 nl/ml 2-巯基乙醇(Sigma,M7522)。
ChIP-Seq公司
如前所述执行ChIP(Boyer等人,2005年). 扩展实验程序中提供了更多详细信息。使用Med1抗体(Bethyl Labs A300-793A,Lot#A300-793A-2)生成Mediator的ChIP-Seq。
Illumina测序和文库生成
纯化的ChIP DNA用于制备Illumina多重测序文库。Illumina测序文库是根据Illuminia TruSeq™DNA样品制备v2试剂盒协议,但扩展实验程序中描述了例外情况。
荧光素酶表达结构
A最小值10月4日从小鼠基因组DNA中扩增启动子,并将其克隆到pGL3碱性载体(Promega)的XhoI和HindIII位点。随后将增强子片段克隆到pGL3-pOct4载体的BamHI和SalI位点。使用Lipofectamine 2000(Invitrogen)转染v6.5小鼠ESCs。将pRL-SV40质粒(Promega)作为标准化对照进行共转染。培养细胞24小时,并使用双荧光素酶报告分析系统(Promega)测量荧光素酶活性。克隆片段的基因组坐标位于表S7.