研究核小体在拟南芥,我们使用Illumina GAII测序器对微球菌核酸酶(MNase)消化的核小体DNA进行测序,以实现核小体约68倍的覆盖率(参见补充方法). 数据显示在修改后的UCSC基因组浏览器中(http://apis.pellegrini.mcdb.ucla.edu:8081/Ath-核小体/,(name=reviewer,password=DkZmv9wJ)以及核小体密度轨迹,可轻松可视化整个基因组中的核小体位置().
的特征拟南芥核小体数据a、,一个基因的代表性UCSC浏览器屏幕截图、该区域的核小体读数以及计算出的核小体密度。b、,核小体读取计数和ChIP-seq读取计数的染色体视图显示,核小体在着丝粒周围区域富集。c、,正绞合读取的自相关显示位置174和355处的局部峰值。d日AA和GC二核苷酸和CG甲基化谱在核小体结合DNA上显示出10个碱基的周期性,DNA甲基化谱与WW二核苷酸谱同相,与SS二核苷酸谱异相。
为了获得核小体内容的染色体视图,我们将读取数据绘制在100千碱基的箱子中,并将染色体平铺。为了控制绘图和测序中的偏差,我们还对随机剪切的拟南芥基因组DNA文库进行了测序。然后,我们通过染色体上每个箱子内唯一映射基因组DNA计数的数量,将核小体计数标准化。染色体常染色体区域的核小体含量相对均匀,但着丝粒周围异染色质区域的含量显著增加(,补充图1). 为了证实这些结果,我们使用针对未修饰组蛋白H3的抗体进行了ChIP-Seq(,补充图1). 这些观察表明,与常染色体臂相比,核小体更密集地分布在转录沉默、富含转座子且含有高度甲基化DNA的着丝粒周围区域三.
通过检查映射到相反DNA链的读取之间的关系,我们观察到反向链上的读取峰值发生在正向链上读取的下游约145-170个碱基处(补充图2a). 核小体公认大小附近的宽峰表明许多核小体位置良好,导致相应核小体区域的正向和反向补体重复测序。类似地,当我们绘制出正链读数与其他正链读数之间的相关性时,我们发现从核小体开始,相关性就逐渐降低(,补充图2b),在距离参考读数起始位置174和355碱基对处有较小的峰间隔,这表明核小体基因组范围内有一定的规则间距偏好。假设核小体包裹在147个碱基对的DNA周围,规则间隔的核小体的连接体的平均长度约为30个碱基对。与着丝粒周围异染色质区域中核小体含量较高一致,我们发现174和355处的峰值在这些区域比常染色质臂中更为明显()这表明着丝粒周围核小体更倾向于以规则间距排列。这些结果与果蝇异染色质核小体间距更规则的早期证据一致4.
与动物和真菌高通量核小体测序研究中的发现类似5–8,我们在WW(W=A或T)二核苷酸和SS(S=G或C)二核苷酸中发现了10个碱基周期,其中5个碱基与WW二核苷酸不同步(,补充图3-5). WW二核苷酸在小沟面对组蛋白核心的部位更受欢迎,而SS二核苷酸则在小沟背离组蛋白核心处更受欢迎9,10这些二核苷酸频率的异相峰导致DNA的最佳弯曲,因为A/T核苷酸导致负碱基滚动,而G/C核苷酸导致正碱基滚动9,10.
为了研究DNA甲基化与核小体位置的关系,我们利用我们的单核苷酸分辨率全基因组亚硫酸氢盐测序数据三拟南芥胞嘧啶被三种不同的DNA甲基转移酶之一甲基化,这取决于它们的序列上下文。CG位点被MET1甲基化,CHG位点(H为A、C或T)被CMT3甲基化。最后,CHH位点被DRM2甲基化从头开始小RNA靶向的甲基转移酶11值得注意的是,所有三种类型的甲基化在核小体DNA上都显示出10个碱基的周期性,这与WW二核苷酸同步,而与SS二核苷酸不同步(,,补充图6). 这些甲基化偏好与这些位置CG、CHG或CHH序列的偏好无关(补充图7). 由于DNA甲基转移酶进入主沟,这种甲基化将发生在核小体外部的DNA上(面向组蛋白的小沟),因此DNA甲基转移酶类更容易进入。这反过来表明,DNA可能部分甲基化,因为DNA仍然与核小体结合,导致观察到的10碱基对周期性。有人提出,DNA甲基转移酶需要染色质重塑酶才能获得DNA,事实上,DRD1、DDM1和LSH1是已知的控制DNA甲基化的重要因素12然而,我们的数据表明,核小体DNA也可能是DNA甲基转移酶的底物体内证明了核小体在决定整个基因组甲基化模式中的重要作用。
核小体结合DNA的甲基化谱拟南芥计算DNA甲基化的加权平均百分比,并在距核小体起始位点(0)的每个距离处绘制曲线。a、 b、c、,CG甲基化(a),CHG甲基化(b)和CHH甲基化(c)在核小体结合DNA(1-147个碱基)上,每个碱基都表现出10个碱基的周期性。快速傅里叶变换(FFT)可用于分解复杂信号中的固有频率。在核小体区域计算的FFT在CG中证明了这种周期性(a),CHG公司(b)和CHH(b)上下文。
我们之前在对整个基因组的甲基化模式进行自相关分析时,报告了CHH甲基化数据中的10-核苷酸周期性三我们之前的解释是,DRM2酶的结构可能是这种模式的原因,因为哺乳动物中的同源Dnmt3酶被认为是异聚物,其中两个甲基转移酶活性位点的间距大约相当于DNA的10个核苷酸13然而,目前的数据显示,所有类型的甲基化都有10个碱基对周期性,这表明了一个更普遍的解释:核小体在某种程度上决定了对DNA的访问,因此为所有DNA甲基转移酶设置了甲基化登记册。核小体偏好也可以部分解释我们之前观察到的CHG和CHH甲基化的强烈序列偏好三高度甲基化的胞嘧啶往往紧接着是A/T而不是C,这与我们的发现一致,即DNA甲基化与CC二核苷酸不同步(补充图6).
在更大范围内,我们还观察到跨越DNA的核小体中所有三种类型的DNA甲基化水平都高于侧翼DNA,这表明核小体结合DNA的甲基化水平更高(,补充图8). 这一发现支持了核小体优先被DNA甲基转移酶靶向的观点。在CMT3的情况下,预计该酶被组蛋白H3赖氨酸9二甲基化招募或激活,因为组蛋白H3-赖氨酸9-甲基转移酶的敲除模拟CMT3敲除,并且因为CMT3色域可以与甲基化组蛋白结合14然而,我们的数据表明,所有类型的甲基化都富集在核小体结合DNA上,这表明核小体或组蛋白修饰可能有助于所有拟南芥DNA甲基转移酶的招募。
为了测试人类核小体DNA上的DNA甲基化模式是否也存在,我们利用了先前发表的MNase核小体测序数据15以及人类胚胎干细胞系HSF1的单核苷酸分辨率亚硫酸氢盐测序数据(参见补充方法). 我们发现人类核小体结合DNA在CG、CHG和CHH甲基化状态下也表现出10个碱基周期性(). 此外,如拟南芥,核小体结合DNA的整体甲基化水平高于侧翼区域。这表明核小体结构在塑造人类基因组中的DNA甲基化模式中发挥作用,并与最近发现的Dnmt3 DNA甲基转移酶稳定锚定哺乳动物染色质的结果相一致16更普遍的是,植物和动物中DNA甲基转移酶功能的保护17我们还分析了拟南芥和人类基因组不同区域核小体上的DNA甲基化模式,包括基因、启动子、着丝粒周围区域和常染色臂区域(补充图9-17)并发现在所有情况下都发现了10个核苷酸的周期性,这表明核小体定位和DNA甲基化之间的关系是普遍的。
人类核小体结合DNA的甲基化谱计算DNA甲基化的加权平均百分比,并在距核小体起始位点(0)的每个距离处绘制曲线。a、 b、c、,CG甲基化(a),CHG甲基化(b)和CHH甲基化(c)在核小体结合DNA(1-147个碱基)上,每个碱基都表现出10个碱基的周期性。d、 e、f、,在核小体区域计算的FFT在CG中证明了这种周期性(d),CHG公司(e)和CHH(f)上下文。
我们观察到核小体在外显子中比内含子中丰富得多(参见例如),与最近几项其他生物体核小体定位研究的结果一致18–23内含子中每个碱基对的核小体数量仅为外显子中核小体水平的63%。此外,我们在内含子-外显子连接处和外显子-外控子连接处发现了核小体起始位点的强峰值(,补充图18). 外显子中核小体的富集不仅仅是由于GC含量较高(补充图19a-c),或由于一致的剪接位点序列(补充图19d-f),并使用独立的染色质免疫沉淀方法进行了证实(补充图20). 较长的外显子包含较多的核小体。对170–240 bp、315–330 bp、480–550 bp和645–715 bp大小范围内的外显子的检测显示,一个、两个、三个或四个定位良好的核小体的峰值分别为()这表明核小体在外显子内是相控的。
外显子中的核小体和PolII水平我们用抗RNA聚合酶II(Pol II)抗体进行染色质免疫沉淀,并将所得DNA杂交到全基因组Affymetrix微阵列。我们将这些数据标准化为随机剪切的基因组DNA,以控制探针效率。a、,核小体在外显子中是相控的。选择外显子大小限制,使外显子可以容纳不超过1、2、3或4个核小体。核小体中点绘制在这些内含子-外显子边界上。b、,每个外显子被分成25个大小相等的箱子,核小体中点、Pol II和CG甲基化水平绘制在外显子和两侧内含子上。
对于高表达基因和用于核小体分析的芽组织中未表达的基因,检测到外显子上的核小体高度富集(补充图21)这表明DNA序列定位核小体时没有活性转录和剪接。与这一假设一致,利用核小体定位预测算法24我们发现在实验数据集和理论数据集之间,内含子和外显子的核小体定位模式相似(补充图22). 类似地,使用理论上预测的核小体位置,我们观察到核小体结合DNA上类似的DNA甲基化模式(补充图23),以及预测的中心体周围区域的核小体富集(补充图24).
由于核小体对RNA聚合酶II(Pol II)转录具有屏障作用,我们使用染色质免疫沉淀微阵列方法检测外显子中的Pol II占有率。我们观察到Pol II在外显子相对于内含子的显著富集,这与Pol II暂停于外显子DNA的假设一致(). 一种可能性是Pol II在外显子上的固定可以增强上游外显子的有效剪接,从而有助于外显子定义的准确性。这与Pol II在人类外显子上富集的发现一致,并表明Pol II外显子富集可能是真核生物的一个常见特征20此外,最近研究表明,特定组蛋白修饰可以招募剪接调控因子,为核小体定位调控剪接提供了额外的可能机制25.
由于DNA甲基化在核小体DNA上的增强,以及外显子上核小体的富集,预测DNA甲基化应该在外显子相对于内含子上增强。事实上,我们发现内含子中DNA甲基化的缺失和外显子的富集模式类似于核小体占据(). 这与其他植物物种以及衣原体、蜜蜂、犀牛和人类基因组中外显子甲基化增强的最新发现相一致26,27这表明DNA甲基化可能在外显子定义或剪接调控中发挥保守作用,这种甲基化经常存在于活性基因的转录区。这些发现也加强了这样一种观点,即核小体位置在塑造真核生物基因组的甲基化景观中起着重要作用。