细胞。作者手稿;PMC 2013年9月15日提供。
以最终编辑形式发布为:
预防性维修识别码:PMC3773330型
NIHMSID公司:NIHMS509222标准
多梳对人胚胎干细胞发育调控因子的调控
,1,8 ,1,8 ,1,8 ,1,8 ,1,8 ,1 ,1 ,1,2 ,1,2 ,三 ,三 ,4 ,4 ,1 ,6 ,1 ,1 ,1 ,1 ,1 ,1 ,5 ,1 ,1,2 ,6 ,1,7 ,1,2和1,2,*
李东彦(Tong Ihn Lee)
1美国马萨诸塞州剑桥市剑桥中心9号怀特海生物医学研究所,邮编02142
理查德·詹纳
1美国马萨诸塞州剑桥市剑桥中心9号怀特海生物医学研究所,邮编02142
劳里·A·博伊尔
1美国马萨诸塞州剑桥市剑桥中心9号怀特海生物医学研究所,邮编02142
马修·甘瑟
1美国马萨诸塞州剑桥市剑桥中心9号怀特海生物医学研究所,邮编02142
斯图亚特·莱文
1美国马萨诸塞州剑桥市剑桥中心9号怀特海生物医学研究所,邮编02142
Roshan M.Kumar先生
1美国马萨诸塞州剑桥市剑桥中心9号怀特海生物医学研究所,邮编02142
布雷特·雪瓦利埃
1美国马萨诸塞州剑桥市剑桥中心9号怀特海生物医学研究所,邮编02142
莎拉·约翰斯通
1美国马萨诸塞州剑桥市剑桥中心9号怀特海生物医学研究所,邮编02142
2美国马萨诸塞州剑桥市麻省理工学院生物系,邮编02139
梅根·F·科尔
1美国马萨诸塞州剑桥市剑桥中心9号怀特海生物医学研究所,邮编02142
2美国马萨诸塞州剑桥市麻省理工学院生物系,邮编02139
Kyo-ichi Isono公司
三日本神奈川县横滨市鹤见村上弘1-7-22理研过敏和免疫学中心发育遗传学组230-0045
小泽久彦(Haruhiko Koseki)
三日本神奈川230-0045横滨筑路口苏弘1-7-22,RIKEN过敏和免疫中心发育遗传学小组
Takuya Fuchikami先生
4哺乳动物细胞动力学技术与开发团队,生物资源中心,日本茨城市茨城县Koyadai 3-1-1,RIKEN Tsukuba Institute,Ibaraki 230-0045
阿部库尼亚
4哺乳动物细胞动力学技术与开发团队,生物资源中心,日本茨城市茨城县Koyadai 3-1-1,RIKEN Tsukuba Institute,Ibaraki 230-0045
希瑟·L·穆雷
1美国马萨诸塞州剑桥市剑桥中心9号怀特海生物医学研究所,邮编02142
雅各布·P·祖克
6美国马萨诸塞州剑桥哈佛大学分子和细胞生物学系霍华德·休斯医学研究所,邮编02138
冰冰园
1美国马萨诸塞州剑桥市剑桥中心9号怀特海生物医学研究所,邮编02142
乔治·W·贝尔
1美国马萨诸塞州剑桥市剑桥中心9号怀特海生物医学研究所,邮编02142
伊丽莎白·赫博尔斯海默
1美国马萨诸塞州剑桥市剑桥中心9号怀特海生物医学研究所,邮编02142
南希·汉内特
1美国马萨诸塞州剑桥市剑桥中心9号怀特海生物医学研究所,邮编02142
孙开明
1美国马萨诸塞州剑桥市剑桥中心9号怀特海生物医学研究所,邮编02142
邓肯·T·奥多姆
1美国马萨诸塞州剑桥市剑桥中心9号怀特海生物医学研究所,邮编02142
阿里·奥特
5荷兰阿姆斯特丹1098 SM阿姆斯特丹大学Swammerdam生命科学研究所
托马斯·沃尔科特
1美国马萨诸塞州剑桥市剑桥中心9号怀特海生物医学研究所,邮编02142
大卫·P·巴特尔
1美国马萨诸塞州剑桥市剑桥中心9号怀特海生物医学研究所,邮编02142
2美国马萨诸塞州剑桥市麻省理工学院生物系,邮编02139
道格拉斯·A·梅尔顿
6美国马萨诸塞州剑桥哈佛大学分子和细胞生物学系霍华德·休斯医学研究所,邮编02138
大卫·K·吉福德
1美国马萨诸塞州剑桥市剑桥中心9号怀特海生物医学研究所,邮编02142
7麻省理工学院CSAIL,32 Vassar Street,Cambridge,MA 02139,USA
鲁道夫·杰尼什
1美国马萨诸塞州剑桥市剑桥中心9号怀特海生物医学研究所,邮编02142
2美国马萨诸塞州剑桥市麻省理工学院生物系,邮编02139
理查德·A·杨
1美国马萨诸塞州剑桥市剑桥中心9号怀特海生物医学研究所,邮编02142
2美国马萨诸塞州剑桥市麻省理工学院生物系,邮编02139
1美国马萨诸塞州剑桥市剑桥中心9号怀特海生物医学研究所,邮编02142
2美国马萨诸塞州剑桥市麻省理工学院生物系,邮编02139
三日本神奈川230-0045横滨筑路口苏弘1-7-22,RIKEN过敏和免疫中心发育遗传学小组
4日本理研筑波研究所生物资源中心哺乳动物细胞动力学技术与开发团队,3-1-1,茨城县筑波Koyadai 230-0045
5荷兰阿姆斯特丹1098 SM阿姆斯特丹大学Swammerdam生命科学研究所
6美国马萨诸塞州剑桥哈佛大学分子和细胞生物学系霍华德·休斯医学研究所,邮编02138
7麻省理工学院CSAIL,32 Vassar Street,Cambridge,MA 02139,USA
8这些作者为这项工作做出了同等贡献。
结果和讨论
绘制ES细胞的基因组占有率
我们绘制了RNA聚合酶II和PRC2全基因组SUZ12亚基在人类ES细胞中的位置(). 绘制RNA聚合酶II的起始形式以测试方法的准确性,并为与PRC2占据的位点进行比较提供参考。PRC2的SUZ12亚单位对复合物的功能至关重要,并被选为这些全基因组实验的材料。通过免疫组织化学分析人类ES细胞(H9,NIH代码WA09)的特征性干细胞标记,测试其在分化为胚胎体时从所有三个胚层产生细胞类型的能力,并显示在免疫功能低下小鼠中形成畸胎瘤(补充数据;图S1–S3).
人类胚胎干细胞的全基因组芯片(A) 使用染色质免疫沉淀法(ChIP)分离出与RNA聚合酶II或SUZ12起始形式结合的DNA片段,并使用DNA微阵列进行鉴定,该微阵列包含460多万个独特的60聚体寡核苷酸探针,跨越人类基因组的整个非重复部分。ES细胞生长和质量控制、抗体、ChIP协议、DNA微阵列探针设计和数据分析方法在补充数据.
(B) 来自全基因组ChIP-ChIP的RNA聚合酶II ChIP信号示例。图中显示了基因组区域内所有探针的未处理富集比率(蓝色)(ChIP与整个基因组DNA)。染色体位置来自NCBI构建的人类基因组35。基因在图中按比例排列(外显子用竖线表示)。转录的开始和方向用箭头表示。
(C) 来自全基因组ChIP-ChIP的SUZ12 ChIP信号示例。图中显示了基因组区域内所有探针的未处理富集比率(绿色)(ChIP与整个基因组DNA)。染色体位置、基因和标记如(B)所述。
(D) 图表显示了RNA聚合酶II(蓝色)、SUZ12(绿色)、两者(黄色)或两者都不结合(灰色)的所有注释基因的百分比。
(E) SUZ12(绿线)和RNA聚合酶II(蓝线)的RefSeq、Ensembl、MGC、UCSC已知基因和H-Inv数据库中结合探针和最近转录起始位点之间的距离分布。结合探针的数量以总探针的百分比表示,并按起始位置400 bp的间隔计算。所有探针和最近转录之间距离的零分布显示为黑线。
在复制染色质免疫沉淀(ChIP)实验中,使用DNA微阵列鉴定了RNA聚合酶II结合的DNA序列,该微阵列包含460多万个独特的60聚体寡核苷酸探针,跨越人类基因组的整个非重复部分(和补充数据). 为了获得结合事件的概率评估,实现了一种算法,该算法结合了来自代表基因组连续区域的多个探针的信息,并建立了阈值标准来识别具有最小假阳性和假阴性的数据集。RNA聚合酶II与约22500个注释人类基因中7106个的启动子相关,表明三分之一的蛋白编码基因准备在ES细胞中转录。三行证据表明该数据集的质量很高。大多数RNA聚合酶II位点(87%)发生在已知或预测基因的启动子上。在之前的ES细胞表达实验中,检测到88%的RNA聚合酶II结合基因的转录物。最后,使用基因特异性PCR进行独立分析(补充数据)表明在该数据集中,假阳性的频率约为4%,假阴性的频率约为30%。RNA聚合酶II数据集的详细分析,包括与miRNA基因的结合,可以在补充数据(表S1–S6系列和图S4和S5).
然后使用与RNA聚合酶II相同的方法,在H9 ES细胞的整个非重复基因组中绘制SUZ12占据的位点(). SUZ12与大约22500个注释人类基因中1893个的启动子相关,表明ES细胞中的-8%的蛋白编码基因被SUZ12占据(补充数据;表S7和S8). 独立的位点特异性分析表明,在该数据集中,假阳性的频率约为3%,假阴性的频率约27%。
将SUZ12与RNA聚合酶II占据的基因进行比较,发现这两组基因基本上是互斥的(;补充数据;表S8). 然而,在一些基因中,SUZ12和RNA聚合酶II共同占据启动子。在这些基因上,PRC复合体可能无法阻止启动前复合体的组装(Dellino等人,2004年)与Polycomb组蛋白可以与一般转录器的成分结合的观察结果一致(Breiling等人,2001年;Saurin等人,2001年).
绝大多数SUZ12结合位点发现于基因启动子(). 95%的SUZ12结合区位于已知或预测的转录起始位点的1kb内(补充数据和表S7). 这表明SUZ12在人类ES细胞中主要作用于启动子而非远端调控元件。有趣的是,40%的SUZ12结合区位于CpG岛的1Kb范围内(表S7)鉴于最近发现PcG蛋白和DNA甲基化转移之间存在机械联系(Vire等人,2006年).
PRC2的全局转录抑制
PRC2由三个核心亚单位SUZ12、EED和EZH2组成,已被证明在体内调节组蛋白H3K27甲基化。为了证实SUZ12与靶基因的活性PRC2相关,我们使用带有EED抗体和组蛋白H3K27me3标记的染色质免疫沉淀法,并用启动子微阵列分析结果。我们发现EED和组蛋白H3K27me3标记与SUZ12在大多数基因中使用高置信结合阈值共存(). 阈值数据的假阴性率会导致低估不同数据集之间的相似性。绘制与SUZ12、EED或H3K27me3相关的基因的原始富集率表明,SUZ12结合代表几乎所有靶基因的PRC2结合(图S6).
SUZ12与ES细胞中的EED、组蛋白H3K27me3修饰和转录抑制有关(A) 维恩图显示了SUZ12高置信结合的基因、EED高置信结合基因和H3K27高置信三甲基化基因的重叠。这些数据来自启动子微阵列,其中包含在转录开始时分为-8 kb和+2 kb的探针。72%的SUZ12高可信结合基因也高可信结合EED;其他人受EED约束的信心较低(图S6).
(B) SUZ12(顶部)、EED(中部)和H3K27me3(底部)占用率神经元1该图显示了该基因组区域内所有探针的未处理富集率(SUZ12-ChIP对全基因组DNA,EED-ChIP对全基因组DNA,以及H3K27me3-CIP对总H3-ChIP)。染色体位置来自NCBI构建的人类基因组35。神经元1如图所示(外显子用竖线表示)。转录的开始和方向用箭头表示。
(C) PRC2占据的604个基因和H3K27处三甲基化基因在ES细胞中的相对表达水平。比较了四种ES细胞系和79种分化细胞类型。每行对应一个由SUZ12结合的基因,与EED和H3K27me3相关,Affymetrix表达数据可用。每列对应于一个表达微阵列。ES细胞按以下顺序排列:H1、H9、HSF6、HSF1。对于每个基因,显示的表达相对于该基因在所有样本中的平均表达水平,根据右边的刻度,红色表示高于平均表达,绿色表示低于平均表达。细胞类型按组织或器官功能分组,基因根据其在ES细胞中相对表达水平的重要性排序。
对选定基因的遗传和生化研究表明,PRC2-介导的H3K27甲基化抑制基因表达,但尚未确定其是否在全基因组范围内起阻遏作用。如果SUZ12占据的基因被PRC2抑制,那么这些基因的转录物在ES细胞中的水平通常低于分化细胞类型。为了验证这一预测,我们比较了四种不同ES细胞系中PRC2-occupied基因的表达水平和79种分化人类细胞和组织类型中这些基因的表达(Sato等人,2003年;Abeyta等人,2004年;Su等人,2004年). 我们发现,与其他细胞类型相比,PRC2占据的基因在ES细胞中普遍表达不足(). PRC2占据的一小部分基因在ES细胞中相对过表达(); 这些倾向于显示SUZ12占用范围较小,并且更可能被RNA聚合酶II共同占用(补充数据). 这些结果与PRC2介导的组蛋白H3K27甲基化促进ES细胞基因组中大多数靶基因的基因沉默的模型一致。
关键发展监管机构是PRC2的目标
对SUZ12靶点的检测表明,它们显著富集了控制发育和转录的基因()SUZ12倾向于在这些基因上占据较大的结构域(). 虽然只有8%的所有注释基因被SUZ12占据,但与发育过程相关的编码转录因子的约50%被SUZ12占据。相比之下,RNA聚合酶II优先占据涉及广泛细胞增殖功能的基因,如核酸代谢、蛋白质合成和细胞周期(和中的示例;补充数据;表S10).
SUZ12占据基因的细胞功能(A) 将SUZ12或RNA聚合酶II结合的基因与生物过程基因本体分类进行比较;显示了高度代表性的类别。本体术语显示在年轴线;富集显著性的p值沿x个轴(SUZ12为绿色,RNA聚合酶II为蓝色)。
(B) SUZ12结合的发育转录因子家族的精选实例。SUZ12由绿色椭圆形表示;如图所示,单个转录因子由圆圈表示并按家族分组。标记了在发育中具有明确作用的转录因子的示例。转录因子家族包括同源盒蛋白(HOX)、含有基本螺旋-环-螺旋结构域、B类(BHLHB)、HOX辅因子(MEIS/EVX)、无距离同源盒(DLX)、叉头盒(FOX)、神经元、GATA结合蛋白(GATA)、runt相关转录因子(RUNX)、配对盒和配对样(PAX)、LIM同源盒(LHX)、,正弦眼同源异型盒同源物(SIX)、NK转录因子相关物(NKX)、SRY盒(SOX)、含有POU结构域的3类和4类(POU)、早期B细胞因子(EBF)、无张力同源物(ATOH)、毛和分裂蛋白增强子(HES)、肌原性基本结构域(MYO)、T盒(TBX)、尾型同源盒(CDX)和易洛魁同源盒蛋白(IRX)。
SUZ12占据编码转录因子的大部分基因,在发育中发挥作用(A) SUZ12靶基因部分与不同大小的结合域相关。基因根据其功能分为四类:信号、粘附/迁移、转录和其他。
(B) SUZ12(绿色)和RNA多酶II(蓝色)在编码发育调节因子TBX5和PAX6的基因上结合的示例。该图显示了基因组区域内所有探针的未处理富集率(ChIP与全基因组DNA)。基因在图中按比例排列(外显子用竖线表示)。转录的开始和方向用箭头表示。
(C) SUZ12(绿色)和RNA聚合酶II(蓝色)在−500 kb区域的结合谱HOX公司集群A–D显示了基因组区域内所有探针的未处理富集比率(ChIP与整个基因组DNA)。近似值HOX公司簇区域大小用黑色条表示。
令人惊讶的是,SUZ12占据了许多控制发育和转录的基因家族(和第7部分和表S11). 这些基因包括40个同源异型基因中的39个HOX公司簇和大多数同源结构域基因。SUZ12结合的同源域基因几乎包括DLX公司,IRX公司,LHX公司、和圣像牌基因家族,调节神经发生、造血、轴向模式、组织模式、器官发生和细胞-脂肪规范的早期发育步骤。SUZ12还占据了大亚群的启动子FOX、SOX和TBX基因家族。叉头家族福克斯基因参与所有三个胚层的轴向模式和组织发育(Lehmann等人,2003年). 的成员突变SOX公司基因家族改变了细胞脂肪的规格和分化,并与几种发育疾病有关(Schepers等人,2002年). 这个TBX(待定)基因家族调节多种发育过程,如原肠胚形成、早期模式形成、器官发生和肢体形成(Showell等人,2004年). 因此,优先与SUZ12结合的基因在表达时具有促进分化的功能。这可能解释,至少部分解释了为什么PRC2对早期发育和ES细胞多能性至关重要。
大多数编码发育调节因子的基因的PRC2结合的一个显著特征是调节因子占据该位点的广度(,S8和S9). 对于基因组中大多数(72%)的结合位点,SUZ12占据启动子的一个小区域,其大小与RNA聚合酶II结合的区域相似(). 对于其余的结合区,SUZ12占据包括跨越2-35kb的大域,并从启动子延伸到基因。大部分编码发育调节因子的基因(72%)显示了SUZ12结合的这些延伸区域。在某些情况下,结合包含多个相邻基因。例如,SUZ12结合在整个HOXA、HOXB、HOXC、,和HOXD公司簇,但不与相邻基因组序列结合,产生高度明确的空间模式(). 相反,不相关基因簇,如白细胞介素1-β簇,与SUZ12没有类似的结合。因此,编码发育调节因子的基因显示出一种不寻常的趋势,即PRC2占据了其大部分或全部转录区域。
PRC2和高保护元件
以前的研究已经注意到脊椎动物基因组中许多高度保守的非编码元件与编码发育调节因子的基因有关(Bejerano等人,2004年;Siepel等人,2005年;Woolfe等人,2005年). 鉴于SUZ12与这类基因密切相关,我们研究了SUZ12结合区与这些高度保守元素相关的可能性。对单个基因的检测表明SUZ12的占有率与序列保守性区域有关(). Woolfe及其同事描述的大约1400个高度保守的非编码DNA元素中的8%(Woolfe等人,2005年)发现与SUZ12结合的发育调节因子(p值10−14). 使用PhastCons保守元素数据库中的条目(Siepel等人,2005年),我们发现SUZ12对高度保守元素的占有率非常显著(使用LoD保守分数为100或更高的高度保守元素,显著性的p值小于10−85). 由于PRC2没有被证明直接结合DNA序列,我们预计特定的DNA结合蛋白占据高度保守的DNA序列,并可能与PRC2相关,PRC2扩散并占据相邻染色质。因此,即使这些元素与PRC2招募相关,SUZ12入住率的峰值也可能无法与高度保守的元素精确地共存。
SUZ12结合与高度保守性区域相关(A) SUZ12占用率(绿色)和保守元素如所示NKX2-2型和邻近的基因组区域。图中显示了该基因组区域内所有探针的未处理富集比率(SUZ12 ChIP与整个基因组DNA)。源自PhastCons计划的LoD得分>160的保守元素(红色)(Siepel等人,2005年)按比例显示在绘图上方。基因在图中按比例排列(外显子用竖线表示)。下面还显示了更高分辨率的视图。(B) SUZ12(绿色)和RNA聚合酶II(蓝色)结合区内保守非编码元素的富集。确定了每个结合区的最大非xonic PhastCons守恒分数。为了进行比较,使用具有相同大小分布的随机基因组区域集确定相同参数。该图显示了具有该分数的绑定区域数量与具有该分数随机基因组区域数量的比率。
值得注意的是,当考虑到保守程度增加的序列时,SUZ12结合和保守序列之间的关联程度增加(). 相比之下,RNA聚合酶II没有表现出这种富集。这些结果表明,编码发育调节因子的基因中高度保守的非编码元件的亚群可能与PcG介导的这些调节因子的沉默有关。
信号基因属于PRC2靶点
SUZ12的靶点也富含编码信号通路成分的基因(和表S12). 有证据表明,转化生长因子-β(TGFβ)、骨形态发生蛋白(BMP)、无翼型MMTV整合位点(Wnt)和成纤维细胞生长因子(FGF)信号通路是胚胎原肠形成和谱系分化所必需的,对培养的ES细胞的自我更新和分化也至关重要(Loebel等人,2003年;Molofsky等人,2004年). SUZ12通常占据这些通路的多个成分的启动子,但它在一组包含高度保守元素的信号基因中占据较大的域。该组包含Wnt家族成员(WNT1、WNT2、WNT6)以及TGFβ超家族的成分(骨形态发生蛋白2、GDF6). 最近的研究表明,Wnt信号在小鼠和人类ES细胞的多能性和自我更新中发挥作用(Sato等人,2004年)我们的结果表明,在ES细胞中保持特定家族成员处于被抑制状态非常重要。
分化过程中PRC2靶基因的激活
PRC2与一组重要的发育调节因子相关,这些调节因子在ES细胞中必须保持沉默,但在分化过程中被激活。这一观察结果表明,PRC2最终起到抑制ES细胞中被占据基因的作用,并且这些基因可能在ES细胞分化过程中处于转录激活状态。我们推断,如果这个模型是正确的,那么与SUZ12结合的基因应该在ES细胞分化或缺乏SUZ12的细胞中优先激活。此外,在分化细胞中,SUZ12可能在沉默基因中继续存在,但必须从表达对该细胞类型至关重要的基因中删除。
我们首先检测了受刺激分化的ES细胞中的基因表达(Sato等人,2003年). 我们发现,与未被SUZ12占据的基因相比,被SUZ12占据的基因更有可能在ES细胞分化过程中被激活(;补充数据;表S13)表明在这些条件下,SUZ12-占据的基因在分化过程中表现出优先激活。在ES细胞分化过程中,36%与SUZ12结合的基因的表达增加了2倍以上,而只有16%未与SUZ11结合的基因表达增加。这种影响在发育调节器组中尤为显著(). SUZ12占据了ES细胞分化过程中被诱导超过10倍的大多数(83%)发育调节剂。
ES细胞分化过程中PRC2靶基因的优先激活(A) ES细胞分化过程中诱导或抑制的基因数量增加。基因表达的变化以分化H1细胞与多能H1细胞中信号的对数(2)转化率表示,并分为六组。每个箱子的上限显示在x个轴。这两个品系显示ES细胞中的基因转录不活跃(无RNA聚合酶II)并与SUZ12结合(绿色),ES细胞中基因转录不活动并被其他方式抑制(蓝色)。在这两种情况下,根据基因总数计算折叠富集度,并针对每个组中存在的基因数量进行标准化。
(B) ES细胞分化过程中编码发育调节因子基因的表达变化。表达率(分化/多潜能)由颜色表示,根据上述比例,红色表示上调,绿色表示下调。基因根据基因表达的变化排序,左侧多能干细胞中的基因表达较高,右侧分化细胞中的表达较高。未分化ES细胞中SUZ12结合的基因在下面板中用蓝线表示。
(C) SUZ12缺陷小鼠细胞中诱导或抑制的基因数量增加。基因表达的变化表示为Suz12-缺陷细胞与野生型ES细胞中信号的对数(2)转换比率。这两个品系显示人类ES细胞中的基因转录不活跃(无RNA聚合酶II)并与SUZ12结合(绿色),人类ES细胞的基因转录无活性并被其他方式抑制(蓝色)。在这两种情况下,折叠富集度都是根据基因总数量计算的。
(D) 分化的人类H1 ES细胞中Suz12靶基因相对于多能干细胞H1 ES的基因表达率(对数基2)(x个轴)和Suz12-缺陷小鼠细胞相对于野生型小鼠ES细胞(年轴)。右上象限:人类ES细胞分化和Suz12-缺陷小鼠细胞中基因上调;右下:ES细胞分化过程中基因上调,Suz12-缺陷细胞中基因下调;左下:ES细胞分化和Suz12-缺陷细胞中基因下调;左上角:ES细胞分化过程中基因下调,Suz12-缺陷细胞中基因上调。
(E) H9人类ES细胞(绿色)和初级人类骨骼肌肌管(灰色)中肌肉调节器MYOD1编码基因的SUZ12结合图谱。图中显示了基因组区域内所有探针的未处理富集比率(ChIP与整个基因组DNA)。基因在图中按比例排列(外显子用竖线表示)。转录的开始和方向用箭头表示。
(F) H9人类ES细胞(绿色)和初级人类骨骼肌肌管(灰色)中LHX9编码基因的Suz12结合图谱。图中显示了基因组区域内所有探针的未处理富集比率(ChIP与整个基因组DNA)。基因在图中按比例排列(外显子用竖线表示)。转录的开始和方向用箭头表示。
接下来,我们检测了SUZ12靶基因在源自纯合突变胚泡的SUZ12缺陷细胞系中的表达(补充数据). 我们推断,人类ES细胞中与SUZ12结合的基因在小鼠中具有同源基因,而在SUZ12-缺陷小鼠细胞中应上调这些同源基因,尽管我们预计由于人类和小鼠ES细胞之间的潜在差异,这些基因组的重叠是不完美的,PRC2靶基因可能受到其他机制的抑制,以及Suz12基因敲除对Suz12-靶基因下游基因的多效性影响。使用基因表达微阵列测量Suz12纯合突变细胞和野生型ES细胞之间的基因表达差异,并使用HomoloGene将人类Suz12结合数据映射到同源小鼠基因(www.ncbi.nlm.nih.gov/同源基因). 我们发现,在SUZ12-缺陷小鼠细胞中,相当一部分与人类ES细胞中的SUZ12结合的小鼠基因上调(346个基因中的70个,p=6×10−4); 这些基因列在表S14SUZ12在人类ES细胞中占据的基因直系图比SUZ12不占据的基因的直系图更有可能被激活,而在SUZ12缺陷小鼠细胞中被抑制的可能性较小(). 此外,我们发现,在人类ES细胞分化时诱导的Suz12靶基因的同源基因通常也在小鼠细胞中失去Suz12时诱导(). 在ES细胞分化和Suz12-缺陷细胞中被激活的基因包括编码转录调节因子的基因(GATA2、GATA3、GATA6、HAND1、MEIS2、,和SOX17标准)信号蛋白(WNT5A、DKK1、DKK2、EFNA1、EFNB1、EPHA4、,和EPHB3型)和细胞周期抑制剂CDKN1A公司这些数据表明,Suz12对于完全抑制野生型ES细胞中PRC2所占据的基因是必要的,并且已经通过小鼠第二个PRC亚基的结合数据和敲除研究证实(Boyer等人,2006年).
如果PRC2功能抑制ES细胞中在分化过程中激活的基因,那么在分化组织中,SUZ12在编码发育调节因子的基因中的占有率应降低,这些发育调节因子在确定该组织的特性方面起作用,类似于Ezh2在小鼠特定基因中的结果(Caretti等人,2004年). 为了验证这一点,我们设计了一个聚焦于发育调节因子启动子的阵列,并使用ChIP-ChIP研究了SUZ12在初级分化肌肉细胞中对这些启动子的占用。结果表明,编码肌肉分化关键调节因子的基因,包括MYOD1年与ES电池相比,SUZ12占用率大大降低(). MYOD1是肌肉分化的主要调节器(塔普斯科特,2005年)与ES细胞中观察到的SUZ12占位水平相比,编码该转录因子的基因没有显示出显著的SUZ22占位。编码在肌肉发育中起核心作用的其他转录调节因子的基因,例如PAX3系列和PAX7(Brand-Saberi,2005年),显示肌肉细胞相对于ES细胞SUZ12占用水平降低(补充数据和图S11). 相反,在分化的肌肉细胞中,其他对非肌肉组织分化起重要作用的发育调节因子仍由SUZ12占据(和表S15). 这些数据支持一个模型,即ES细胞中的PRC2结合抑制了随后在分化过程中表达的关键发育调节因子。
PRC2的目标与关键ES细胞调节器共享
转录因子OCT4、SOX2和NANOG在早期发育中具有重要作用,并且是培养中未分化ES细胞增殖所必需的(Nichols等人,1998年;Avilion等人,2003年;钱伯斯等人,2003年;Mitsui等人,2003年). 我们最近报道,这些转录因子在人类ES细胞中占据了许多重要发育调节因子的启动子(Boyer等人,2005年). 这使我们比较了OCT4、SOX2和NANOG与PRC2占据的编码发育调节因子的基因集(和补充数据). 我们发现三种DNA结合转录因子中的每一种都占据了编码发育转录因子的PRC2-占据基因的大约三分之一(;补充数据;表S11). 值得注意的是,我们发现OCT4、SOX2和NANOG所占据的编码发育调节因子的基因子集,以及Boyer等人所强调的调控电路中被抑制的基因子集几乎都被PRC2占据(). 这些包括已知对分化为胚外、内胚层、中胚层和外胚层谱系(例如。,ESX1L,ONECUT1,手动1,HOXB1). 正如预期的那样,编码ES细胞转录因子的活性基因(例如。,ZIC3、STAT3、OCT4、NANOG)被OCT4、SOX2、NANOG和RNA聚合酶II占据,但不被PRC2占据().
SUZ12定位于ES细胞转录调控因子也结合的基因(A) 人类ES细胞中由OCT4、SOX2、NANOG、RNA聚合酶II和SUZ12调控的发育调节剂的转录调控网络模型。ES细胞转录因子与大约三分之一的PRC2-占用的发育转录因子基因结合。基于基因本体选择发育调控因子。监管机构由深蓝色圆圈表示;RNA聚合酶II以浅蓝色圆圈表示;SUZ12由绿色圆圈表示;发育调节因子的基因启动子由小的红色圆圈表示。
(B) SUZ12在人类ES细胞中占据一组受抑制的发育调节因子,也与OCT4、SOX2和NANOG结合。先前注释为OCT4、SOX2和NANOG结合的基因,并根据表达数据确定为活性或抑制的基因(Boyer等人,2005年)检测它们是否与SUZ12或RNA聚合酶II结合。在之前确定的11个活性基因中,有10个在已知启动子处与RNA聚合酶II结合,而在之前确认的12个抑制基因中,11个与SUZ12结合。调控因子由深蓝色圆圈表示,RNA聚合酶II由浅蓝色圆圈代表,SUZ12由绿色圆圈代表。基因启动子由红色矩形表示。
OCT4、SOX2和NANOG与PRC2占据的发育基因的一个重要子集相结合的观察结果支持发育调节因子抑制与干细胞多能性之间的联系。与PRC2一样,OCT4和NANOG已被证明对早期发育和ES细胞鉴定很重要。因此,对OCT4、NANOG和PRC2共同靶点的发育调控因子的不当调控可能导致OCT4,NANOG,和EZH2突变体中无法建立ES细胞系(Nichols等人,1998年;O'Carroll等人,2001年;钱伯斯等人,2003年;Mitsui等人,2003年).
结束语
我们绘制了SUZ12在整个基因组中占据的位置,以深入了解PRC2如何促进人类胚胎干细胞的多能性。ES细胞在未分化状态下增殖,但仍能对发育线索作出反应。因此,编码促进分化的转录调节因子的基因必须在ES细胞中被抑制,但在接收到分化信号时被激活。我们发现,PRC2在编码一组受抑制的发育调节因子的基因中占据了很大的域,这些发育调节因子在细胞分化时优先激活,因此该复合体直接参与维持多能性状态。
转录因子和染色质调节因子参与了人类ES细胞中负责多能性和自我更新的转录调节电路。了解这种电路对于了解人类的发展和实现这些细胞的治疗潜力至关重要。在这方面,我们发现令人兴奋的是,人类ES细胞核心转录调控电路的轮廓正在出现。转录因子OCT4、SOX2和NANOG与促进生长和自我更新的活性转录基因相关(Boyer等人,2005年). 这些因子还占据编码关键发育调节因子的基因,这些发育调节因子受到转录抑制,至少部分原因是它们与PRC2和组蛋白H3K27me3修饰的核小体相关。对全基因组转录因子和染色质调节器的进一步研究将使研究人员能够绘制更全面的ES细胞转录调控电路图,并测试电路中出现的模型。这一信息可以为多能干细胞被刺激分化为不同细胞类型的方法提供见解。