结果
TSC-Xi定量等位基因特异表达图谱
为了在自然环境下研究XCI,并在分析基因表达和染色质模式时区分活性X(Xa)和Xi,我们选择研究女性TSC中的XCI,其中失活模式是非随机的。由于TSC保持印记的XCI,它们的Xa和Xi分别是母系和父系遗传的,在这些细胞中读取的SNP重叠序列可以可靠地追踪起源染色体(Quinn等人,2006年)。
作为了解Xi染色质模式与基因沉默之间关系的先决条件,我们开始了我们的研究,通过链特异性RNA-Seq测量来自CAST/EiJ(CAST)和C57BL/6J(B6)小鼠杂交的雌性TSC系的等位基因表达。考虑到我们的目标是将表达与Xi染色质模式联系起来,并且基因组的最准确构建是B6衍生,下游染色质分析集中于带有Cast Xa和B6 Xi(C/B)的TSC系。对携带B6 Xa和Cast Xi(B/C)的额外TSC株系进行RNA-Seq,以帮助区分菌株和亲本特异性表达偏差。
根据正常核型和TSC特异性标记的表达(未显示),选择两个TSC雌性系进行RNA-Seq。收集TSC多聚腺苷酸RNA,制备复制cDNA文库并测序((Ingolia等人,2009年);表S1). 识别SNP重叠读码,并通过将B6或Cast-overlapping读码数除以每个基因的等位读码总数来计算等位基因的表达。由此得到的表达图谱为后续解释X连锁染色质模式提供了必要的基线。
内部一致性和实验验证表明RNA-Seq数据具有高质量。R(右)2比较C/B和B/C重复之间的基因表达的值分别为0.970和0.985;两条TSC线路之间的相同比较得出R20.917。此外,通过定量等位基因特异性RT-PCR分析选择了9个基因进行验证,在所有情况下测量的等位基因比率和测序数据都是一致的(图S1)。
接下来,我们通过检测两个TSC株系中SNP重叠读数≥20的基因,确定哪些基因受到TSC XCI的影响,哪些基因逃脱TSC XPI。先前的分析使用10%Xi表达的截止值来区分X失活基因和逃逸基因(Carrel和Willard,2005年;Yang等人,2010年). 我们试图从经验上定义TSC逃逸,理由是10%的临界值可能会排除真正的逃逸者。等位基因表达数据适合于混合的β二项分布,使我们能够确定每个基因的逃逸概率(补充方法). 对于每个基因,在逃逸测定中计算Xi表达的比例、逃逸读取的总数以及这些读取中SNP重叠碱基的序列质量分数。
13%的基因(262个符合条件的基因中有35个)不同程度地逃脱了XCI(;表S2). 在西安沿岸,逃逸并不是以可预测的模式发生的,而是基因单独或成组逃逸。使用西斯特作为主要例外,逃逸者主要表达Xa,Xi的表达中位数约为15%。27名逃避者表现出至少10%的Xi表达。相反,X失活基因的Xi表达中位数约为0.5%,失活强度与基因距离无关西斯特(右2C/B、B/C为0.07、0.04;)。
TSC-Xi等位基因特异表达图谱点表示评估的TSC基因的X位置和XCI状态。Y轴是TSC线C/B(阳性刻度)和B/C(阴性刻度)中的%Xi表达。箭头标记有代表性的逃生者。
另请参见图S1。
在TSC中逃脱XCI的基因也在其他组织中逃脱。我们通过PCR分析了第6.5天胚胎组织中的等位基因表达,发现测试的4个基因逃逸到了外胎盘锥体和胚外外胚层(未显示)。此外,在受随机XCI影响的小鼠组织中发现的约½个逃逸者也逃逸了TSC XCI;13名胚胎肾细胞逃逸者中的7名(Yang等人,2010年)以及20名神经前体细胞逃逸者中的10名(Splinter等人,2011年),在TSC中逃跑。最后,我们注意到,Xi基因背景显著影响TSC逃逸特征。在两条TSC线路中,约有½名逃生人员这样做;然而,11个基因仅在C/B TSC中逃逸,8个仅在B/C TSC中(蓝色和绿色圆点,). 在独立衍生的TSC株系中的等位基因PCR验证了大多数差异逃逸是可遗传的,而不是TSC株特异性的(图S1)。
TSC-Xi染色质环境的高分辨率分析
在建立了TSC X染色体的等位基因表达图谱后,我们开始通过C/B TSC中的ChIP-Seq高分辨率分析X连锁表观遗传模式。这些实验的首要目标是表征TSC Xi上的亚显微染色质特征,并定量研究这些特征与基因表达、DNA特征和已知染色体微观特性的关系(Escmilla-Del-Arenal等人,2011年). 调查最初以H3K27me3为中心,这是维持胚胎外细胞XCI所必需的(Kalantry等人,2006年;Wang等人,2001年). 为抑制相关组蛋白H4-赖氨酸20-单甲基化(H4K20me1)以及与活性转录相关的标记(如Pol II、H3K4me2、组蛋白H3-赖氨酸36-三甲基化(H3K36me3)和总组蛋白H3(H3))生成了额外的ChIPSeq数据集,该组蛋白也在显微镜下覆盖TSC Xi。
常染色体和X连锁的ChIP-Seq数据均显示预期的等位基因分布。在所有数据集中,常染色体的Cast-B6等位基因比率约为1:1,对参考基因组略有偏倚(). 相反,等位基因在X染色体上的偏差与经典免疫荧光(IF)显微镜实验的数据一致(Escmilla-Del-Arenal等人,2011年)活性标记偏向Cast基因组或Xa,抑制标记偏向B6基因组或Xi()。
ChIP-Seq显示X连锁表观遗传偏见(A) ,(B)常染色体(A)和chrX(B)的比例等位基因分布。
(C)chr1和chrX非等位基因平铺密度图,单位为每40kb bin(rpm)百万次标准化读数。仅显示校准性≥50%的箱子。
(D)chrX等位基因瓷砖密度图,比例如(C)所示。
接下来对H3K27me3和H4K20me1的镶嵌密度进行了检测,以定量说明其微观Xi富集与特定染色体区域的关系(). 这两个标记在X上都显示出大规模的密度波动,有百万基地大小的富集和耗尽区域(,右侧面板)。这些X连锁图谱的Spearman系数为0.88,高于常染色体相关性0.46。X连锁的H3K27me3和H4K20me1模式也与1号染色体模式形成对比,例如,富集区更具点状(,左侧面板)。重要的是,等位基因数据显示X连锁H3K27me3和H4K20me1富集的主要模式反映了Xi(,右侧面板与2D)。
Xi的线状密集区位于H3K27me3和西斯特域
之前的研究表明H3K27me3和西斯特与西安的基因密集区和非LINE密集区共存(查德威克,2007年;Duthie等人,1999年;Mak等人,2002年;Marks等人,2009年). 我们解决了X连锁H3K27me3密度、基因和LINE之间的关系,在检查TSC Xi的更详细的表观遗传学方面之前,继续将我们的数据与先前的观察结果相吻合。TSC X上的平铺密度图显示H3K27me3水平与基因和LINE之间的相互关系(). H3K27me3与基因密度在X上正相关(Spearman系数0.29;,中间vs.底部)。相反,X连锁LINE和H3K27me3密度呈负相关(Spearman系数-0.57;,中间与顶部)。几乎总是,LINE密度的峰值与H3K27me3密度的谷共存,反之亦然(,S2A、B). 线密度区域内H3密度的连续性验证了我们在这些区域内检测和归一化H3K27me3的能力。
H3K27me3和LINE密度与Xi呈负相关(A)X上的平铺线和基因密度H3K27me3/H3密度如所示。仅显示校准性≥50%的箱子。标记(B–F)中的FISH探头位置。
(B)DNA FISH定量过程。H3K27me3 IF为绿色,带有红色和蓝色的基因感应/线性密集型探针。从左到右显示了进程:一个完整的细胞核,一个提取的Xi,一个3D渲染的Xi图像。
(C–F)FISH探头相对于Xi H3K27me3(C)的位置或西斯特(D–F)域,按百分比。n、 Xi按每对探针计数。P值来自χ2测试比较Xi域内外边缘的点。
另请参见图S2。
从XCI开始,LINE和其他重复序列被提议组成Xi的空间核心,X失活基因在沉默时移动到提议的核心(Chaumeil等人,2006年;Chow等人,2010年;克莱姆森等人,2006年;Namekawa等人,2010年). 考虑到TSC Xi的LINE和基因感应区域之间的H3K27me3水平不同,很难协调这些序列类如何占据相同的核空间。因此,我们直接研究了TSC-Xi基因密集区和LINE密集区之间的空间关系。使用H3K27me3 IF结合DNA FISH,我们检测了五个X连锁FISH探针对相对于H3K17me3外壳的位置。成对探针由邻近基因和LINE密集区的探针组成(,标记勾号;图S2C). 进行H3K27me3 IF和DNA FISH,收集Z堆叠图像并去卷积,并对个体Xi周围的区域进行3D重建。成像后,对Xi的H3K27me3涂层内部、边缘或外部的探针进行评分()。
令人惊讶的是,对于五个探针对中的四个,线状密集区比基因敏感区更经常位于H3K27me3结构域外部(). 使用两个相对于西斯特外套(). 五个线密度探针中的一个,15L,最常位于H3K27me3结构域的内部,这可能是由于H3K26me3水平较高或靠近着丝粒(图S2C). 我们还研究了受随机XCI影响的细胞类型中LINE和基因感应区域之间的空间关系:小鼠胚胎成纤维细胞(MEF)和类胚体(EB)。在这些细胞中检测到的线状密集区位于西斯特频率与TSC相似(). 我们的结论是,在TSC、MEF和EB中,大多数LINE密度最高的Xi区域在空间上与染色体的基因感应区域分离,这些区域被西斯特和H3K27me3。鉴于这种空间分离,我们的结果表明,XCI期间保持基因沉默与易位到LINE密集空间核无关。
X失活启动子排除活性染色质标记,并富含H3K27me3和H4K20me1
在建立了组蛋白标记和TSC-Xi的DNA特征之间的大规模关系后,我们开始了对X连锁染色质的更高分辨率研究。我们最初比较了两种转录状态不同的X连锁基因类别:(1)X失活基因,平均在Xa中表达99.5%,和(2)非转录基因,根据RNA-Seq评估其完全缺乏表达。比较这两种基因类别之间的后基因数据需要对基因集大小和SNP密度进行标准化(图S3)。
显示了10kb周围X失活和非转录转录起始位点(TSS)的等位基因复基因图。正如从RNA-Seq数据中预期的那样,几乎所有的Pol II、H3K4me2和H3K36me3都通过来源于Xa的X失活基因发出信号,表明Pol II与X失活TSS的结合被阻断(面板i-iii)。X失活基因的H3K27me3密度在Xi上相对于Xa一致较高;然而,在X失活和非转录TSS周围的4kb区域,H3K27me3密度有一个适度的峰值(,面板i)。两个独立衍生的TSC株系中出现了类似的H3K27me3峰,证实TSS富集是H3K26me3在TSC Xi上积累的一般特征(面板ii、iii)。Xi TSS上H4K20me1富集反映H3K27me3模式(,第四组),与平铺密度图中这两个修改之间的高度正相关一致()。
Xi启动子排除活性染色质标记,并富含H3K27me3和H4K20me1X失活和非转录X连锁基因的等位基因图谱。铸造(红色)和B6(黑色)数据显示为每500bp箱的rpm。(C/B#2),一条C/B TSC线不用于RNA-Seq。(B/C),图1 RNA-Seq中的TSC线。另请参见图S3。
X失活基因和非转录基因之间的Xi H3K27me3和H4K20me1 TSS富集相似(面板i-iv)。这与之前在EB中的研究形成对比,EB发现X失活基因的H3K27me3密度高于非转录基因,这可能突显了XCI分析的细胞类型或阶段之间的差异(Marks等人,2009年). 我们的结果表明,与周围的Xi序列相比,TSS近端核小体,无论Xa转录状态如何,更有可能被H3K27me3和H4K20me1修饰,这表明这些位点要么具有更强的吸收修饰的能力,要么在沉积后更稳定地保留它们。
调控元件显示TSC-Xi的DNaseI超敏反应
X灭活的TSS中没有转录相关染色质特征,这表明这些区域存在于局部封闭状态,缺乏通常在使用的TSS上发现的核小体耗竭。为了解决这个假设,我们用两种抗体依赖性方法(DNase和FAIRE-Seq)分析了等位核小体密度(Giresi和Lieb,2009年;Song等人,2011年). DNase-Seq检测对DNaseI消化过敏的基因组区域,而FAIRE-Seq使用甲醛处理来富集未与蛋白质交联的基因组区域。这两种技术都能识别通常在活性启动子和调节元件处发现的核小体缺失位点,但也能检测到非重叠位点(Song等人,2011年)。
首先在常染色体上检测DNA酶和FAIRE-Seq模式,以验证这两种方法在TSC中的预期效果。事实上,在这两种技术中,信号存在于高表达基因中,而非转录基因中没有信号(图S4A、B). 尽管常染色体多梳靶点在TSC中表达较低,但由于其TSS的H3耗竭,预计两种方法都会积累信号(图S4C)。
接下来,我们检查了X连锁DNase-Seq转基因图谱。X灭活的TSS在Xi上观察到DNase-Seq信号的显著富集(). 考虑到Pol II和其他活性染色质标记几乎完全被排除在这些相同的位点,这个结果令人惊讶。虽然X失活TSS周围的DNaseI信号在Xi上比Xa低6.7倍,但Xi信号远高于背景,在非转录基因上比Xi信号大2倍(). 重要的是,等位基因谱是由许多基因的小信号贡献造成的,可能代表X失活启动子的平均DNaseI超敏反应(DHS)(图S4D). 总的来说,198个基因为Xi谱贡献了TSS相关信号,中位数和最大信号贡献分别为0.3%和1.9%。这些数字与Xa上的数字相似,其中201个基因贡献了信号,中位数和最大贡献分别为0.2%和3.4%。因此,X失活的TSS显示出高于周围序列的Xi-DHS水平,以及非转录基因的预期水平。
X灭活TSS中不富集FAIRE的DNaseI超敏反应(A) ,(B)DNase-Seq和FAIRE等位基因图谱,如。
(C)常染色体基因的中位基因图谱,表达与X失活的Xa基因相匹配(AXa公司)X灭活的Xi基因(AXi(希))和非转录基因(ANT公司)。
(D)Xa和Xi基因之间的DNaseI、FAIRE和Pol II比率,AXa公司和AXi(希)基因和AXa公司和ANT公司基因。假设来自Xa和A的信号Xa公司鉴于基因的表达水平相似,它们将是等价的。
(E)FAIRE(i)、Pol II(II)和DNaseI(iii)的等位基因、X连锁分布峰值。分类与峰值开始或结束后5kb内的基因有关;“in”、“es”、“nt”和“ig”峰值分别与X失活、逃逸、非转录或基因间区域相关Xa/Xi pref',在一个X上检测到峰值,但在另一个X没有检测到峰值;'XaXi’,在两个X上检测到峰值;’AA峰值',峰值为A类不合逻辑地A类通过SNP-重叠读取分配给至少一个X。”NA峰值',峰值为N个其他A类由于缺乏等位基因数据,可分配给任一X。
(F)DHS X连锁基因间位点的等位基因图谱。
(G)TBP(i)和SP1(ii)在Xa和Xi上的分布达到峰值,如(E)所示。
(H)X失活基因周围的TBP(i)和SP1(ii)的等位基因复基因图谱,如(A)所示。
另请参见图S4,5。
相比之下,FAIRE-Seq在TSS上没有检测到Xi相关信号,尽管Xa上X灭活的TSS上有稳健信号()和超过常染色体多梳目标(图S4C). TSS-相关FAIRE信号的缺失与我们的总H3分析一致,该分析缺乏Xi,TSS-局部H3缺失(,面板iv)。根据后基因图谱进行的TSS信噪比估计表明,DNase-Seq的动态范围高于FAIRE-或总H3-Seq,信噪比为20,而分别为4和2。因此,尽管存在DHS,但Xi TSS缺乏FAIRE富集和H3缺失,这表明Xi上存在一个核小体缺失位点,该位点比等效Xa位点小或持久性差。
RNA-Seq分析表明,X失活基因在TSC Xi中以低水平表达,表达中值为0.037读/千基米(rpkm),与常染色体多囊卵巢靶点的中值0.089 rpkm相似。因此,我们检查了X灭活TSS中观察到的DNaseI、FAIRE和Pol II的数量是否与等位表达的常染色体基因的预期数量相同或不同。如果与预期不同,这些特征可能表明X失活TSS具有不同的表观遗传特性,这可能有助于深入了解XCI的机制。为了进行比较,我们选择了3类常染色体基因:在Xa(AXa公司)和Xi(AXi(希))和非转录基因(ANT公司). 分别创建了DNaseI、FAIRE和Pol II的后基因图谱(),并比较了X连锁和常染色体类之间TSS相关信号的比率(). 由于等位基因和总数据的富集程度不同,因此没有直接进行比较;相反,我们分别计算了X连锁常染色体基因和表达匹配常染色体基因之间的比率,并假设来自Xa和A的信号Xa公司考虑到基因具有类似的强健表达,它们将是等价的。X灭活TSS的相对Xi DHS高于在非转录常染色体基因中观察到的,低于在表达匹配常染色体基因上观察到的(; A类Xi(希)>Xi>ANT公司). 相反,X灭活TSS的Xi FAIRE和Pol II信号与常染色体非转录基因相当,显示水平接近背景(; A类Xi(希)>一个NT公司>Xi)。因此,X失活TSS具有不同于低表达和非转录常染色体基因的Xi表观遗传状态,显示DHS,但缺乏FAIRE或Pol II富集。如果低水平的Xi-Pol II结合导致有效的靶基因延伸,则可以解释X失活基因和非转录基因之间的转录差异。
接下来,我们研究了Xi的调控元件是否具有与X灭活TSS相似的表观遗传特性。MACS定义的DNaseI、FAIRE和Pol II的峰根据与最接近基因的关系分为4类。与X失活、逃逸、非转录或基因间区域相关的个体峰值,定义为与已知基因相距大于5kb的基因组空间(; “in”、“es”、“nt”和“ig”峰值)。然后通过经验背景模型确定等位基因结合事件(表S3). 与X灭活TSS观察到的排除一致(和在X失活、非转录和基因间Xi区域周围很少检测到FAIRE和Pol II峰,而Xi检测在逃逸基因周围增加(,面板i、ii)。相反,但符合我们的TSS分析(),在整个Xi中检测到DNaseI峰值,大多数位于与Xa共享的位点,而不考虑相关区域(,第三组)。
基因间DHS经常标记参与近端和远端基因转录控制的调控元件(Song等人,2011年). 迄今为止,尚未对此类地点进行与XCI有关的调查。在460个X连锁的等位基因间DNaseI峰值中,尽管大多数X连锁基因近乎转录沉默,但约50%的Xi DHS保持不变(,第三组)。
为了了解XCI是如何处理Xi调节元件的,通过后基因分析,以MACS定义的峰值作为参考点,检查了基因间DHS位点的平均染色质状态。该分析侧重于在两个X上检测到的176个基因间DHS位点,以避免混淆Xa或Xi特定峰的贡献。这些站点显示出显著的Xi DHS,平均Xa:Xi比率为2(). 将绑定CTCF的DHS站点排除在该分析之外,不会改变Xa:Xi比率(未显示)。相反,其他活性标记被排除在Xi基因间DHS位点之外,类似于X灭活TSS中观察到的标记(图S5A). 我们观察到Xa-only富集H3K4me1和H3K27-乙酰化,这两个标记与利用的转录因子结合有关,这与标记Xa上活性调控元件的基因间DHS一致,而不是Xi(图S5B). 基因间DHS位点也显示出Xi H3K27me3和H4K20me1富集水平较小但可检测到(图S5C)。
考虑到DHS通常指示转录因子结合,我们检查了这种结合是否发生在Xi上。对通用转录因子TBP和基因特异转录因子SP1进行ChIP-Seq,其基序在X上的DHS峰上显著富集(未显示)。在这两种情况下,都没有在Xi上检测到绑定,尽管Xa上出现了预期的强健信号()。
总之,Xi调节元件保留了DHS,类似于Xa对应物和常染色体Polycomb靶点,但排除了Pol II和转录因子,并且未通过FAIRE检测到开放染色质,类似于非转录基因(,S4系列). 这些数据表明,X失活调节元件维持着不同于常染色体多梳靶基因和非转录基因的染色质状态。此外,观察到的TBP和SP1排除表明XCI至少部分通过阻止高效转录因子与Xi结合而起作用。
逃避XCI基因周围的可变H3K27me3微环境
接下来,我们研究了逃脱XCI的基因周围的染色质修饰,以了解局部转录是如何在抑制性Xi环境中发生的。正如所料,逃逸者与活性转录标记相关(图S6A). 此外,许多擒纵器存在于H3K27me3耗尽的微环境中,例如一般来说,逃逸水平与局部H3K27me3密度呈负相关(; r、 −0.46,皮尔逊系数Syap1公司H3K27me3水平与X失活基因中发现的水平极为相似(). 先前的研究表明,DNA结合蛋白CTCF和核位置相对于西斯特领域,可能在逃逸中扮演重要角色(Chaumeil等人,2006年;Filippova等人,2005年). 因此,我们研究了这两个特征是否比局部H3K27me3水平更好地与Xi表达相关。
与逃逸相关的可变H3K27me3水平,以及广泛的CTCF与Xi结合(A) 、(B)、(C)X灭活中心周围的基因组窗口(A),Las1l系列(B) 、和Syap1公司(C) ●●●●。非等位基因ChIP-Seq数据如基因组注释所示。黑色基因逃逸,红色基因X失活,金色基因没有等位分配。Xa/Xi上的红色/黑色*标记CTCF峰值;紫色**,两个X上的;圆形,不可分配的峰值。
(D)Xi表达与基因H3K27me3密度,对于具有≥20个等位基因RNA-Seq读数的X连锁基因。
(E)Xi表达与Xi CTCF结合水平的比较,对于(D)中在其开始或结束的5kb内包含CTCF峰值的基因。
(F)CTCF峰的等位基因分布,如。
另请参见图S6。
CTCF结合两个X上的位点
我们通过ChIP-Seq定位Xi结合位点,探讨了CTCF在促进逃逸中的作用。CTCF结合与全基因组染色质状态之间的隔离相关(Song等人,2011年). 此外,CTCF将贾里德1c基因只存在于逃避XCI的物种中,表明CTCF在逃避许可中的作用(Filippova等人,2005年). 因此,我们假设局部CTCF结合与逃逸水平增加有关。事实上,CTCF结合和Xi表达之间存在中度正相关,支持CTCF在逃避中的作用(; r=0.25;皮尔逊相关性)。然而,无论X失活状态或基因存在与否,我们观察到CTCF在Xi上的结合(,绿色“CTCF”轨道)。X失活区、逃逸区、非转录区和基因间区的等位基因分配CTCF峰分别有59、81、68和71%出现在Xi或两个X上(). 这些结果表明,仅CTCF结合不能预测H3K27me3的逸出或局部绝缘。
同样出乎意料的是,大多数Xi CTCF峰位于与Xa共享的位置,而不是Xi特有的(428个Xi峰中的394个;,紫色星星;,绿色条)。X特异性CTCF结合确实存在,例如在X失活中心两侧的H3K27me3边界(,黑色*’s),但构成了少数山峰(428个Xi山峰中的34个;,黄色条)。无论基因或染色质边界位置如何,在不同的Xi环境中都存在共享的CTCF峰值,这表明XCI中蛋白质的利用很复杂。
转录能力和相对于西斯特域是解耦的
最后,我们检测了逃逸基因和X失活基因相对于Xi的H3K27me3和西斯特域。之前的工作显示了包括西斯特显微镜下没有转录相关特征,如Pol II,逃逸基因优先位于西斯特领域(Escmilla-Del-Arenal等人,2011年). 考虑到这些数据,我们假设外化相对于西斯特该结构域可能将基因置于允许转录的环境中,可能在逃逸中起到因果作用。
检查逃逸与西斯特在TSC外化中,我们从Xi中选择了4个不同水平表达的逃逸位点:Taf1-Ogt公司(平均Xi指数为18%),贾里德1c(Xi支出18%),Nkap公司(12%Xi支出),以及Utx公司(Xi支出5%)。这些基因相对于习近平的核心位置西斯特H3K27me3外壳与X失活基因一起检测(12卢比或Abcb7型),使用中描述的DNA FISH分析该分析可同时量化逃逸基因和X灭活基因的位置,为每个实验提供内部控制。
正如预期的那样,逃逸基因更常见于西斯特TSC、MEF和EB中X失活基因的域(). 检查相对于Xi的H3K27me3涂层的位置时未发现定位差异(图S6B). 对于这6个位点,外化频率与TSC-Xi表达和H3K27me3水平密切相关(r=0.87和−0.95,Pearson相关;),但有一些例外:Utx公司和Nkap公司具有相似的外化频率但不同的Xi表达水平,并且12卢比和Abcb7型具有不同的外化频率,但Xi表达水平相似(外化p=0.03,χ2测试;)。
相对于微观的外部化西斯特域不诱导逃逸(A)相对于的基因位置西斯特域,按百分比。垂直线将逃逸基因(黑色字体)和X失活基因(红色字体)的探针对分开。n、 Xi按每对探针计数。P值来自χ2测试比较Xi域内外边缘的点。
(B、C)
西斯特结构域外化频率与(B)Xi表达或(C)局部H3K27me3密度的关系。
(D)相对于的基因位置西斯特域,如(A)所示。
(E)RNA FISH信号与西斯特域。'无信号’,Xa的单等位基因表达。条形图上方有代表性的图像。
另请参见图S6。
考虑到这些例外情况,我们进一步探讨了西斯特领域外化和Xi表达式,试图解析因果关系和相关性之间的差异。检测了与逃逸基因相邻的两个X失活基因座相对于西斯特域:Huwe1号机组,靠近逃生器贾里德1c并显示0.1%Xi表达和一个~200kb位点,称为TOA公司,用于T型af1型和O(运行)gt公司
A类关联,包含4个与逃逸者相邻的X失活基因塔夫1和奥格特并显示0%聚合Xi表达式。在TSC中,这两个基因座的外化频率与相邻的逃逸基因座相似,尽管缺乏Xi表达并维持高水平的H3K27me3(). 在MEF和EB中观察到相同的定位模式(). RNA FISH证实了这些位点的单等位基因表达(图S6C). 总之,这些结果表明基因外化相对于西斯特该结构域与XCI逃逸呈正相关,但不足以诱导其逃逸。
根据这一结果,我们通过RNA FISH和3D重建研究了逃避转录在单细胞水平上发生的位置西斯特域。如果由西斯特正如先前的分析所预测的那样(Escmilla-Del-Arenal等人,2011年)则逃逸轨迹仅在位于边界或外部时表示西斯特域,可以在其中访问Pol II和相关因子。我们选择了两个最可靠的逃逸TSC基因座进行分析,贾里德1c和Taf1-Ogt公司考虑到其高水平的双等位性和RNA FISH信号的清晰度。与现有模型预测的结果相反贾里德1c和Taf1-Ogt公司在TSC内本地化西斯特域名(占Xi总数的14%和12%;). 观察到类似的共同定位频率贾里德1c和西斯特MEF(21%)和EB(15%)(). RNA FISH信号的检测西斯特这表明,在TSC、MEF或EB中,微观结构域不是一个专性沉默区。
总之,两行证据表明转录能力与相对于显微镜的基因位置无关西斯特域,在TSC、MEF和EB中。首先,逃逸者附近的X失活位点保持不活跃,尽管它们经常定位在显微镜外西斯特领域(). 其次,escape经常与西斯特结构域,通过RNA FISH评估(). 我们的结论是,XCI不太可能仅仅通过染色体宽度与转录机制的分离来维持。相反,我们的结果表明,在失活过程中,调控元件的局部特异性沉默发挥了作用。
讨论
我们的等位基因表达和染色质分析揭示了TSC-Xi上复杂的表观遗传环境。最值得注意的是,X失活调控元件具有与常染色体多梳靶基因和非转录基因不同的表观遗传特征,显示DHS而不富集其他转录特征。与微观分析一起检查相对于西斯特我们的数据表明,调控元件的位点特异性沉默在维持随机和印迹XCI中起着核心作用。
我们首次对印迹Xi的等位基因表达进行了全球分析,发现13%的TSC基因逃逸了XCI。这个百分比与人类细胞的估计值相似(Carrel和Willard,2005年),但与小鼠肾脏中观察到的3%不同(Yang等人,2010年),表明不同的细胞类型具有不同的逃逸频率。TSC逃逸的程度可以通过当地H3K27me3水平进行部分预测,尽管不是完全预测。考虑到这种不完美的相关性,我们假设许多逃逸基因在H3K27me3绝缘和非绝缘状态之间波动,其中在绝缘期间表达最为强烈。或者,即使在存在高的局部H3K27me3水平的情况下,一些基因也可能逃逸。
考虑到其作为绝缘体的分类,我们讨论了CTCF在建立逃逸XCI中的作用。考虑到其广泛的绑定模式,也许并不令人惊讶(Song等人,2011年),CTCF的X连锁分布是复杂的。Xi CTCF结合与逃逸呈正相关,支持了该过程中的作用,正如所提议的那样(Filippova等人,2005年). 然而,在Xi上检测到的428个CTCF峰值中,92%位于与Xa共享的站点。因此,Xi-CTCF结合不能预测逃逸者或H3K27me3边界的位置,这与之前在XCI期间检测转基因绝缘的研究结果一致(Ciavata等人,2006年). 镜像CTCF绑定在不同X链接环境中的功能尚不清楚。我们支持CTCF结合某些位点而不区分X的可能性,但这些位点在创建等位基因特异性染色质结构中有不同的利用。
关于Xi调控元件的表观遗传特性,我们描述了证据,表明这些位点是从周围序列中识别出来的,但XCI机制使其失去功能。平均而言,相对于邻近的Xi DNA,Xi调控元件表现出H3K27me3和H4K20me1的富集,支持Xi调控元素被细胞机制识别的观点。值得注意的是,尽管排除了Pol II和其他转录标记,但TSC Xi的监管元素显示出DHS。这些数据表明,围绕Xi调控元件的核小体被识别和置换,但这些位点的未知性质——特定构象、非标准核小体或相关蛋白或修饰——阻止了Pol II与Xi的有效结合。
在Xi调节元件上未检测到两种转录因子TBP和SP1的结合,尽管这些元件含有典型的转录因子结合DHS。这种缺乏可检测的结合表明,XCI至少部分通过阻止Pol II招募因子与靶点的稳定关联而起作用。在完全没有转录因子结合的情况下,在Xi调节元件处观察到的DHS可能是Xi中排除这些因子的机制的副产物。考虑到Xi DHS峰值并不一定与H3K27me3富集区一致(未显示),且TSC常染色体PRC2靶点与TBP、SP1和Pol II结合,该机制将是PRC2依赖性的(图S4C). 转录因子也有可能在低水平结合TSC Xi,导致DHS,但我们的等位基因ChIP Seq缺乏检测这种结合所需的敏感性。在这种情况下,Xi转录因子结合的估计上限可能与Xi TSS的DHS水平相当,与Xa相比,Xi的水平大约低7倍。在这种情况下,鉴于X失活基因在TSC Xi上被抑制约200倍,并且基本上缺乏Pol II结合,XCI可以通过抑制转录因子结合和功能进行组合操作。对Xi染色质状态的继续研究可能会进一步深入了解XCI的机制。
根据我们的基因组分析,相对于先前存在的XCI机制模型,我们检查了Xi的空间特性。这些模型表明,习近平的空间核心西斯特,是一个转录沉默的重复感区域,当基因失活时,会被招募到该区域(Chaumeil等人,2006年;Chow等人,2010年;克莱姆森等人,2006年;Namekawa等人,2010年). 进入这个域可以通过阻止进入转录机制来诱导或至少有助于保持沉默。因此,逃亡者被认为活跃在领地外部,允许他们进入Pol II(Escmilla-Del-Arenal等人,2011年)。
我们的工作建议对上述模型进行重大修改。位点特异性DNA FISH表明,线状密集区并不像人们所说的那样总是构成了西安的空间核心(Chaumeil等人,2006年;Chow等人,2010年;Clemson等人,2006年;Namekawa等人,2010年). 相反,在TSC、MEF和EB中,基因和LINE密集区域占据了不同的核区域,LINE密集DNA最常与西斯特域。这种空间分离表明,XCI期间保持基因沉默不需要与LINE密集型核心共定位,并支持Xi最密集的LINE区域在XCI中的间接作用西斯特-介导沉默(Tattermusch和Brockdorff,2011年). 先前将Xi的核心定义为重复感的工作依赖于Cot-1等非特定位点的FISH探针,该探针无法区分基因区域和基因间区域的重复序列,这可能解释了观察到的差异。
我们的数据还表明,相对于测量值,基因外化西斯特领域是逃避的结果,而不是原因。在两个不同的基因座上,逃逸基因和相邻的X失活基因被发现位于西斯特类似频率下的域。如果外化是诱导逃逸的主要因素,那么这些X失活基因座在外化后会表现出Xi表达增加。相反,无论相对于测量的位置如何,它们都保持沉默西斯特域,表明逃逸的许可发生在基因特异性水平上,并不是严格由染色体拓扑决定的。为了证明这一点,在显微镜下发现了逃逸现象西斯特域,通过RNA FISH评估。这一观点得到了以下观察结果的进一步支持:不同的基因调控可以发生在拓扑相关的基因组区域内(Dixon等人,2012年;Nora等人,2012年). 我们假设逃逸子和拓扑相关的X失活基因是由于逃逸子与转录工厂的相互作用而外化的,这些转录工厂在测量范围之外非常丰富西斯特域。
综合考虑,我们的结果支持一个XCI模型,其中单个调控元件通过一种机制保持在静默状态,无论它们相对于更大的X链接域的位置如何。虽然转录机制在染色体范围内被排除在Xi的物理区域之外可能在XCI中发挥作用,但在XCI维持过程中,它最终似乎是继发于位点特异性沉默;逃避XCI的基因在Xi的内部表达,X失活基因从显微镜下分离时保持沉默西斯特域。与微观区域的分离可能会动态发生,导致局部区域的暂时损失西斯特外化X灭活基因的涂层。或者,西斯特这种结合可能在外化区域持续存在,但其水平是常规RNA FISH无法检测到的。在这两种情况下,沉默在整个外化过程中都是稳定的,因为外部和内部X失活基因的基因表达水平无法区分。
TSC-Xi独特的亚显微表观遗传特征为XCI模型提供了额外的证据,XCI模型中基因沉默受单个调节元件的失活控制,而非染色体尺度的空间分离远离转录机制。我们惊奇地观察到X失活调控元件显示DHS和近端H3K27me3和H4K20me1富集,这表明Xi上的这些位点是从周围DNA中识别出来的。尽管Xi基因明显暴露于允许转录的核环境中,但XCI沿线基因缺乏转录相关信号,这表明XCI诱导的表观遗传特征可以独立于用于转录沉默的染色体尺度核室而稳定地保持。