简介
CpG序列中DNA胞嘧啶5位甲基化是发育和细胞谱系分化的关键事件(1–5). 甲基化模式由DNA甲基转移酶建立(6)并且可以被5-甲基胞嘧啶(5mC)氧化酶,即十-十一易位(TET)蛋白调节或擦除(7–9). 在哺乳动物中,一个由三种TET蛋白组成的小家族(TET1/2/3)通过在三个连续氧化步骤中生成5-羟甲基胞嘧啶(5hmC)、5-甲酰胞嘧啶和5-羧基胞嘧啶(5 caC)来催化5mC的氧化(8,10,11). 后两个修饰的碱基通过碱基切除修复从DNA中切除,导致DNA去甲基化,即使在没有DNA复制的情况下也可能发生(10). 某些细胞类型,如神经元和胚胎干细胞,含有相对较高水平的5hmC(12). 尽管在DNA甲基化模式的全基因组重编程过程中已经证明了5mC氧化的参与(9,13–16)以及增强子激活期间(17–21)TET活动是如何在全球和现场进行监管的,目前尚不清楚。
含有1(SMCHD1)的染色体柔性铰链结构域的结构维持最初被鉴定为小鼠亚稳表位基因的修饰物(22)通过促进非活性X上一组CpG岛的超甲基化,参与女性细胞中X染色体失活(22,23)通过影响非活性X染色体的结构组织(24–26). 然而,尚不清楚SMCHD1如何参与DNA甲基化模式的建立。
在这里,我们发现SMCHD1存在于与所有三种哺乳动物TET蛋白的复合物中。我们发现SMCHD1是TET介导的5mC氧化的负调节因子。ES细胞中SMCHD1的失活导致DNA低甲基化和杜克斯转录因子基因并引发早期[双细胞(2c)样]胚胎转录程序,这在很大程度上依赖于TET活性。这些数据揭示了一种以前未知的机制,即DNA甲基化模式如何在哺乳动物中调节。
结果
SMCHD1作为TET蛋白相关蛋白的鉴定
利用质谱(MS),我们确定SMCHD1是293T细胞中与FLAG标记的TET3相互作用的蛋白质(和表S1),其中它在八种最显著富集的蛋白质中得分,包括TET3本身和已知的TET3结合伙伴O(运行)-连接的β-N个-乙酰氨基葡萄糖转移酶(OGT)(27–29). 为了进一步验证SMCHD1-TET的相互作用,我们通过同源重组创建了ES细胞系,该细胞系在内源性Smchd1号机组编码序列(图S1A)。我们对其中一个克隆进行了抗FLAG下拉,并进行了蛋白质组学分析。在已鉴定的蛋白质中,SMCHD1本身是最核心的蛋白质(54%覆盖率)(图S1B和表S2)。我们检测到已知的SMCHD1相互作用蛋白LRIF1(12.3%覆盖率)(30). PRC2复合体也有几个成分(EZH2、SUZ12和MTF2;4.5%到15%的覆盖率),但没有PRC1成分。SMCHD1已被证明是防止Polycomb复合物形成组蛋白H3赖氨酸27三甲基化(H3K27me3)的保护因子(25). 在这个蛋白质组学实验中,我们特别恢复了与SMCHD1相关的TET2蛋白(4.92%覆盖率),但没有恢复TET1。TET3在ES细胞中的表达水平很低。已知的TET相互作用蛋白OGT(27–29)也发现了(9.37%)。然后我们将FLAG标记的TET2转染到293T细胞中。尽管TET2本身的覆盖率仅为4.0%(图S1C和表S2),但我们仍然发现SMCHD1(11.4%覆盖率)和OGT(46%)是TET2相互作用蛋白。
SMCHD1和TET蛋白的相互作用。(A类)293T细胞TET3FL和TET3S的标记纯化。纯化后的样品进行考马斯蓝染色(左)和免疫印迹(右)。用MS.M、分子量标记分析所示凝胶片段;IB,免疫印迹。(B类)MS鉴定SMCHD1为TET3的结合伙伴。TET3S在293T细胞中表达,并用抗FLAG珠免疫沉淀。对凝胶段2(A)进行LC-MS/MS(液相色谱-串联质谱)分析(见材料和方法以及表S1)。显示了前八个最高核蛋白。M.W.,分子量。(C类)SMCHD1与TET1、TET2和TET3FL的内源性共免疫沉淀(co-IP)。(D类)利用293T细胞中标记蛋白的表达,通过co-IP实现TET蛋白和SMCHD1之间的相互作用。(E类)将TET3的不同结构域与全长SMCHD1共转染到293T细胞中。IP后,通过蛋白质印迹鉴定相互作用的蛋白质。星号表示IgG(免疫球蛋白G)带。氨基酸。(F类)将SMCHD1的不同结构域与TET3FL共转染到293T细胞中。IP后,通过Western blotting鉴定相互作用蛋白。星星表示IgG带。HATPase,组氨酸激酶样ATP酶结构域。
通过联合免疫沉淀(co-IP),我们发现所有小鼠TET蛋白,包括TET3[TET3FL(全长TET3)和TET3S的长亚型和短亚型(31)]以及TET1和TET2作为内源性蛋白与SMCHD1相互作用,在蛋白大量表达的细胞类型中(ES细胞中的TET1、TET2和Neuro2a细胞中的TEM3)(). 通过共同转染各自的表达结构和IP实验证实了这些相互作用().
为了进一步证实细胞中SMCHD1-TET的相互作用,我们进行了双分子荧光互补(BiFC)实验(32,33)带SMCHD1和TET3(图S2)。数据表明,TET3和SMCHD1在类似于TET3与OGT阳性对照(P.C.)实验的水平上进行了有效的相互作用。如前所述,后两种蛋白质是相互作用的伙伴(27,28). 尽管该试验不能确定这两种蛋白质直接相互作用,但它是对体内TET-SMCHD1相互作用的独立确认,例如在蛋白质复合体内。
然后,我们通过共转染实验确定了TET3和SMCHD1的相互作用域。我们发现TET3的C末端双链β-螺旋结构域,代表所有三种TET蛋白之间保守的核心催化区域(8,20,34),与SMCHD1紧密互动(). 通过分析SMCHD1结构域,我们发现包括GHKL腺苷三磷酸酶(ATPase)结构域在内的N末端区域与TET3FL(片段F1;)但长中心结构域和C末端铰链结构域没有表现出任何明显的结合。
然后我们检测了SMCHD1和TET蛋白是否可以在体外直接相互作用。我们最初未能观察到SMCHD1的重组N末端(ATP酶)结构域和TET2催化结构域(TET2-CD)之间的直接相互作用。接下来,我们制备了重组全长SMCHD1和重组TET2-CD或TETFL蛋白。这些蛋白质从杆状病毒感染细胞(SMCHD1和TET2-CD)或哺乳动物细胞(TET2FL或TET1FL)中纯化。我们使用AlphaScreen系统(图S3A)评估定量生物物理分析中的结合反应。在这些测定中,SMCHD1-FLAG通过引入的C-末端生物素化序列(AviTag)进行生物素化,并与生物素连接酶(BirA)一起在杆状病毒感染的昆虫细胞中共表达。该SMCHD1蛋白可收集在链霉亲和素珠上,表明其已成功生物素化(图S3B)。哺乳动物TET蛋白表达为C末端His标记蛋白(图S3B)。在AlphaScreen分析中,测量了链霉亲和素AlphaSceen供体小球上捕获的生物素化蛋白与镍螯合物(镍-硝基三乙酸)AlphaScren受体小球上捕获到的His标记蛋白之间的结合。在进行这些分析后,我们没有观察到SMCHD1和TET2蛋白之间的任何直接结合(TET1也被检测为阴性)(图S3C)。我们还使用生物素化试剂盒对SMCHD1进行了体外生物素化,或者我们对抗SMCHD1-抗体进行生物素化后再结合SMCHD1。我们的结论是,我们一直观察到的细胞内SMCHD1和TET蛋白之间的相互作用很可能是基于间接相互作用,可能涉及更大的蛋白复合物或桥联蛋白。这种蛋白的一个潜在候选物是OGT,我们在SMCHD1和TET蛋白复合物中回收了OGT,已知它与TET2/3-CD相互作用(27,29,35,36).
SMCHD1抑制TET活性
当SMCHD1与TET3FL在293T细胞中共表达时,TET活性被抑制,呈剂量依赖性,导致低量TET反应产物5hmC的形成()而5mC的总水平没有明显变化。另一种体内TET活性测定是基于转染前荧光素酶载体在体外所有CpG位点甲基化的去甲基化和再激活。在本试验中,TET3S比TET3FL更为活跃(31). 如前所述,通过共转染TET3S,完全CpG甲基化萤光素酶报告载体的萤光素酶活性增加() (31). SMCHD1抑制了TET诱导的活性,但未降低非甲基化对照报告物的活性().
SMCHD1抑制TET活性。(A类)293T细胞中SMCHD1与TET3共表达降低5hmC水平。使用基于抗体的斑点印迹法评估5hmC和5mC含量。进行单因素方差分析(ANOVA),将各组的平均值与第二组的平均值进行比较(**P(P)<0.01和***P(P)< 0.001; 平均值±SEM)。ns,不显著。(B类)通过SMCHD1抑制TET3S诱导293T细胞中甲基化荧光素酶结构的重新激活(上图)。进行单向方差分析(**P(P)<0.01和****P(P)< 0.0001). 数据用于三个独立实验的平均值±SEM。未甲基化荧光素酶载体用作对照(底部)。(C类)从Sf9昆虫细胞中提取TET2-CD和SMCHD1全长(SMCHD1-FL)的FLAG纯化。考马斯蓝染色。(D类)联合亚硫酸氢盐限制分析(COBRA)检测显示,在SMCHD1存在下,TET2-CD活性对完全甲基化DNA的抑制(BstU I裂解表明甲基化)。P.C.,过量TET蛋白阳性对照(18μg);N.C.,阴性对照,未经TET治疗。显示了SMCHD1和TET蛋白(1.15μg)的不同摩尔比。这个H19型分析了压印控制区。(E类)亚硫酸氢盐序列分析H19型甲基化分析重复。实心黑色圆圈表示修改后的CpG;空心圆圈表示TET氧化的mCpG。紫色箭头表示BstU I站点。(F类)不同样本的修饰胞嘧啶(%Me)百分比。P(P)数值通过费希尔精确检验(双侧)确定。
然后,我们继续从杆状病毒感染细胞中纯化重组活性TET蛋白(TET2-CD和TET2FL)和全长SMCHD1(). TET2-CD的催化活性高于TET2FL,因此用于我们的体外活性测定。TET2的体外活性最初使用亚硫酸氢盐限制性联合分析(COBRA)进行测试(37)一种用BstU I(5′CGCG)进行切割的检测表明这些位点存在甲基化。在本试验中,添加SMCHD1以剂量依赖的方式抑制TET活性(). 我们通过亚硫酸氢钠测序进一步验证了这种影响(). 该分析监测TET活性的最终产物5caC,由于5caC的脱羧和脱氨基作用,其在亚硫酸氢盐测序中得分为未修饰的胞嘧啶。SMCHD1以1:1摩尔比有效抑制TET活性,以2:1摩尔比几乎完全抑制(). SMCHD1是一种DNA结合蛋白,其结合可能通过其铰链结构域介导(38–40). 我们提出SMCHD1与DNA的结合导致TET活性与其DNA靶标的阻断。
SMCHD1失活对DNA甲基化模式的影响
接下来,我们创建并验证了几个Smchd1号机组利用CRISPR-Cas9技术敲除雄性小鼠ES细胞(mESCs)克隆(和图S4A)。使用免疫斑点印迹法,我们确定这些KO克隆具有适度增加的5hmC水平(图S4B),这表明SMCHD1的缺乏导致5mC氧化过程的刺激,这与体外数据一致,表明SMCHT1抑制TET活性。总体而言,SMCHD1缺陷细胞中的TET和DNMT蛋白表达没有显著改变(图S4、C和D)。
在缺乏SMCHD1的情况下转录激活和2c样基因签名。(A类)三个CRISPR-Cas9 KO ES细胞克隆中SMCHD1蛋白缺失。(B类)RNA-seq数据的热图显示WT之间差异表达的基因(n个=3个克隆)和SMCHD1 KO(n个=3个克隆)ES细胞。(C类)2c类ES细胞特征的基因集富集分析(GSEA)。基因集表示2c小鼠胚胎中合子基因组激活期间激活的基因,并在2c::番茄中富集+单元格(42). 这个x个轴显示日志2KO/WT标记转录组的折叠变化。GSEA分析如前所述(49). (D类)heatmap表明WT之间差异表达的2c类基因(n个=6)和SMCHD1 KO(n个=6)ES细胞,包括每个克隆的两个技术复制。典型的2c类基因,例如杜克斯(用红色箭头表示),Z扫描4c,杜比1、和使用17l表示家庭成员(用紫色箭头表示)。(E类)密度图显示SMCHD1 KO细胞中重复元件的激活。这个x个轴显示日志2重复元素表达式的(KO/WT的折叠变化)。这个年轴表示密度。
接下来,我们对三种野生型(WT)和三种Smchd1号机组KO ES细胞克隆。我们在所有染色体上的敲除物中观察到较低水平的修饰胞嘧啶,但Y染色体除外,该染色体已甲基化(图S5A)。这种修饰胞嘧啶的适度全球减少影响了除CpG岛以外的所有基因组亚区,CpG岛屿的甲基化水平非常低(图S5B)。使用DMRseq分析(41),我们在缺乏SMCHD1的克隆中鉴定了283个低甲基化和223个高甲基化差异甲基化区域(DMR)(图S5C和表S3)。一个广泛低甲基化的基因组区域是Pcdha公司基因簇,这是SMCHD1的已知结合区域(40).
SMCHD1控制ES细胞中的2c类基因表达程序
为了在SMCHD1缺失时寻找功能相关的表观遗传学变化,我们进行了RNA测序(RNA-seq),在SMCHD1缺失的细胞中鉴定出1236个上调基因和256个下调基因[倍变>2,错误发现率(FDR)<0.05]Smchd1号机组KO细胞与WT细胞的比较(和表S3)。这与SMCHD1作为转录阻遏物的作用一致。上调基因,而非下调或不变基因,在转录起始位点(TSS)附近的DNA甲基化水平略有降低(图S5,D至F)。SMCHD1敲除的甲基化变化方向与DMR相关基因的表达变化之间总体呈负相关(图S3G)。DMR相关差异表达基因的基因本体分析表明,模式特异性和器官发育特异性过程丰富(图S3H)。
利用基因集富集分析(GSEA),一组显著上调的基因被鉴定为“2c胚胎样基因”()反映了正常表达于2c小鼠胚胎的136个基因的上调,作为合子基因组激活(ZGA)初始波的特征(42). ZSCAN4中发现的一组类似基因+多功能电子稳定控制系统(43)或在CAF1击倒ES细胞中(44)在SMCHD1 KO细胞上调的基因组中也富集。一小部分WT ES细胞偶尔表达2c胚胎阶段特异性(2c)转录物,例如Zscan4公司,并循环进入和退出此专用状态(42). 在缺乏SMCHD1的情况下上调的基因中Zscan4公司基因簇(). 的上调Zscan4公司编码一种参与端粒维护的蛋白质(45),使用pan-ZSCAN4抗体在蛋白质水平确认(). ES细胞群中ZSCAN4阳性细胞的比例从WT细胞的~1.5%增加到SMCHD1 KO细胞的约12%(). ZSCAN4激活的各种重复元素家族,如小鼠内源性逆转录病毒(MERVK和MERVL)(46)并且在ZGA期间也解除了压制(42),在SMCHD1缺失时表达增加().
SMCHD1缺失导致杜克斯和Z扫描4基因簇,导致2c样细胞的出现。(A类)所有RNA-seq轨迹峰值的综合基因组查看器截图Zscan4公司WT和SMCHD1 KO ES细胞中的家族成员。(B类)SMCHD1 KO细胞株中ZSCAN4蛋白的上调。(C类)在缺乏SMCHD1的情况下,ES细胞群中ZSCAN4阳性细胞的比例增加。对ES细胞进行ZSCAN4(绿色)免疫染色。DNA用DAPI(4′,6-二氨基-2-苯基吲哚)(蓝色)复染。比例尺,50μm。(D类)ZSCAN4馏分+WT ES细胞中的细胞和Smchd1号机组-KO ES细胞。t吨进行了统计分析测试(P(P)< 0.001). 误差条表示SEM(六个独立实验)。(E类)RNA-seq轨迹的浏览器视图杜克斯WT和SMCHD1 KO ES细胞中的基因座。这个杜克斯基因本身被涂成黄色。(F类)定量实时聚合酶链反应(qRT-PCR)数据证实杜克斯SMCHD1丢失时激活。β-肌动蛋白作为对照。进行单向方差分析进行统计分析,将各组的平均值与WT组的平均值进行比较(***P(P)< 0.001). 数据为三个独立KO克隆的平均值±SEM。
激活杜克斯在没有SMCHD1的情况下,涉及去甲基化和5hmC的形成
然后,我们将注意力集中在杜克斯编码ZGA和2c类转录体中涉及的双同源盒转录因子(DUX)的基因座(47–49). 我们发现了杜克斯在SMCHD1缺陷的ES细胞中被强烈(>10倍)激活(). 在同一个基因座内,包括5′UTR(5′非翻译区)在内的其他几个转录物杜克斯假基因(Gm4981型)SMCHD1丢失后也上调(). WGBS公司()和手动亚硫酸氢盐测序()揭示了杜克斯SMCHD1 KO克隆中的启动子(WGBS,P(P)< −1 × 105; 人工亚硫酸氢盐测序,P(P)< 0.01;t吨测试)。然后,我们将MERVL-promotor-dTomato报告子构建物并入SMCHD1 KO和WT ES细胞,并通过荧光激活细胞分选(FACS)纯化出表达dTomato(2c-like)的细胞(). 在这个细胞群中杜克斯与未分类的细胞群体相比,启动子进一步减少,并且在分类的SMCHD1 KO细胞中甲基化水平最低(). 使用染色质IP(ChIP)和定量聚合酶链反应(qPCR),我们观察到SMCHD1蛋白存在于小鼠中检测的两个不同位置杜克斯WT中的启动子,但SMCHD1 KO ES细胞中没有启动子(图S6A)。
SMCHD1的缺失导致在杜克斯轨迹。(A类)WT和SMCHD1 KO样品在杜克斯基因座,由WGBS确定。差异甲基化区域用紫色阴影表示。CpG用勾号表示。红圈,WT;蓝色圆圈,SMCHD1 KO。圆圈大小与覆盖范围成正比。每个样本显示一条平滑线。(B类)手动亚硫酸氢排序杜克斯WT和SMCHD1 KO细胞中的启动子。实心黑色圆圈表示修饰的CpG位点;开圆圈表示未修改的CpG位点。显示了修饰胞嘧啶(%Me)的总百分比。引物也如(A)所示。(C类)2C::td番茄的代表性荧光图像和FACS图+中的单元格Smchd1号机组KO ES细胞群。(D类)甲基化杜克斯dTomato表达中的启动子(FACS分类)Smchd1号机组KO细胞数量进一步减少。数据显示亚硫酸氢盐序列分析杜克斯报告基因表达的WT和SMCHD1 KO ES细胞中的启动子。显示了修饰胞嘧啶(%Me)的总百分比。(E类)改性胞嘧啶在杜克斯启动子由(B)和(D)确定。进行单向方差分析(*P(P)< 0.05, **P(P)< 0.01, ***P(P)<0.001,以及****P(P)< 0.0001). 误差条表示来自三个重复克隆(WT和Smchd1号机组-KO)或重复样品(FACS分类2c-Smchd1号机组-KO电池)。
检测TET介导的5mC氧化是否参与杜克斯启动子当SMCHD1没有功能时,我们在羟甲基与生物素衍生后通过下拉法分析5hmC(图S6B)(50)或通过单碱基分辨率TET辅助亚硫酸氢盐测序[TAB测序(51)](图S6C;完整结果见图S7)。两种方法都表明杜克斯SMCHD1缺陷细胞中的启动子。使用ChIP,我们观察到TET1与杜克斯SMCHD1 KO细胞中的启动子(图S6D)。这与SMCHD1在WT ES细胞中正常结合的位置相同(图S6A),表明SMCHT1对5mC氧化酶具有屏蔽作用。
的贡献杜克斯到2c类程序
描述杜克斯对于SMCHD1缺失后上调的整套基因,我们双基因失活杜克斯在里面Smchd1号机组KO ES细胞和WT ES细胞(由于没有可靠的抗DUX抗体,通过广泛的DNA测序证实;). 随后的RNA-seq分析表明,在SMCHD1 KO细胞中136个上调的“2c-like”基因中,有47个在缺乏功能的情况下不再上调杜克斯基因(). 这方面的一个例子杜克斯-依赖基因是Z扫描4基因簇,其表达严格依赖于WT杜克斯(). 在已发表的研究中(48),5738个基因与HA-DUX峰值相关。在这个基因集的基础上,我们发现在我们的研究对象中,仍有49个2c类基因上调Smchd1号机组单一KO不受DUX约束。因此,我们可以确认一部分上调的2c类基因(136个基因中的49个)Smchd1号机组-KO细胞可能不受DUX的直接调节。数据表明,DUX是在缺乏SMCHD1的情况下诱导的2c类转录组的主要贡献者,但并非唯一贡献者().
在缺乏SMCHD1的情况下,2c类转录组部分依赖于杜克斯.(A类)小引导RNA(gRNA)靶向区域位于杜克斯基因。桑格测序证实移码突变。gRNA靶向的序列为蓝色,PAM(原间隔区相邻基序)序列为红色。每个克隆均显示双等位基因移码突变。将gRNA应用于WT和SMCHD1 KO ES细胞,以获得杜克斯单淘汰赛和Smchd1/Dux公司双敲除ES细胞克隆。(B类)热图显示了两种基因之间差异表达的2c类基因杜克斯/Smchd1号机组双重淘汰赛(n个=3个克隆)和Smchd1号机组单一淘汰赛(n个=3个克隆,每个重复两次)ES细胞。蓝色表示基因在双基因敲除中不再上调。(C类)饼图显示,在136个单一KO上调的2c类基因中,有47个在缺乏杜克斯在中Smchd1号机组/杜克斯双重KO。(D类)GVIZ程序包生成的RNA-seq轨迹Zscan4公司WT ES细胞中的基因家族成员(黑色),Smchd1号机组KO ES电池(红色),杜克斯KO ES电池(蓝色),以及Smchd1号机组加杜克斯(双KO)ES细胞(绿色)。
DNA低甲基化和2c样程序依赖于缺乏SMCHD1的TET活性
我们的数据显示SMCHD1与细胞内TET蛋白的相互作用(以及图S1和S2)和SMCHD1对TET诱导的5mC氧化的抑制(). 在没有SMCHD1的情况下,5hmC水平增加(图S4;图S6、B和C;以及图S7),表明SMCHT1是TET活性的负调节器。为了获得这种相互作用的基因支持,我们使用测试1/2/三三敲除ES细胞(52)并从这些细胞中删除了SMCHD1,这一点已通过Western blotting和DNA测序得到证实(和图S8A)。这个杜克斯TET-TKO细胞SMCHD1缺失后,该基因不再被激活(; 与…相比). 因此,DUX的靶基因包括使用17lc、,Zscan4f公司、和兹夫普352(47–49)以及其他SMCHD1调节基因,如1700013H16瑞克和格米12690,也无法再激活(). 在没有SMCHD1的情况下上调的136个2c类基因中,只有69个在没有TET活性的情况下仍上调(). 在TET-TKO细胞中杜克斯启动子在CpG位点甲基化>90%。然而,与WT ES细胞不同(),这些细胞中SMCHD1的缺失并没有引起显著的DNA去甲基化(). 这些实验证明,TET蛋白需要引起杜克斯启动子和激活杜克斯当SMCHD1功能失调时,从基因上证实SMCHAD1是TET活性的负调节器。
在没有SMCHD1的情况下,异常转录组和DNA低甲基化取决于TET蛋白的存在。(A类)三个靶向CRISPR-Cas9中SMCHD1蛋白缺失泰特三敲除ES细胞克隆。(B类)RNA-seq轨迹跨越杜克斯在WT中,泰特三敲除ES细胞,以及泰特-Smchd1号机组四个KO细胞。(C类)定量RT-PCR分析杜克斯以WT表示,泰特三次击倒和泰特-Smchd1号机组四重敲除细胞。进行单因素方差分析。数据用于三个独立克隆的平均值±SEM。(D类)WT中不同基因的RNA-seq分析,Smchd1号机组让开,杜克斯让开,Smchd1号机组和杜克斯(双重)KO,泰特三次击倒,以及Tet-Smchd1测试四敲除ES细胞。进行单因素方差分析,比较各组的平均值(n个=每个克隆3个)Smchd1号机组-KO集团(**P(P)<0.01和****P(P)< 0.0001). 误差条表示SEM(E类)在缺乏TET蛋白的情况下,上调的2c类基因数量减少。(F类)亚硫酸氢盐序列分析杜克斯启动子泰特-TKO细胞和四重敲除细胞。显示了修饰胞嘧啶(%Me)的百分比。(G公司)SMCHD1单个KO中的89%(75%和14%)显著上调的基因不再在TET蛋白缺失的情况下上调泰特-Smchd1号机组四-KO(qKO)细胞。(H(H))SMCHD1作为TET蛋白负调控因子的模型杜克斯发起人。黑色圆圈,5mC;浅蓝色圆圈,5hmC;白色圆圈,非甲基化CpG。
在Smchd1号机组,测试1,测试2、和Tet3型四重敲除细胞,1236个基因中共有921个(75%)在Smchd1号机组单敲除细胞,不能再被激活(和图S8B)。示例如所示另外179个基因(14%),通常在SMCHD1缺失时激活,在这些四重基因敲除中甚至下调(). 这些数据表明,在没有SMCHD1的情况下,异常转录组在很大程度上取决于TET蛋白的存在(图S8、C和D)。
讨论
在本研究中,我们首先通过MS鉴定了SMCHD1是一种TET相互作用蛋白。此前已有几项研究通过蛋白质组学分析了TET-或SMCHD1-相互作用蛋白,但没有发现这种相互作用(27,28,30,53). 最近的一份出版物在蛋白质组学数据中确定SMCHD1是TET2相互作用蛋白(54). 一些研究使用更高的盐浓度(300 mM)进行细胞裂解或清洗步骤(30,53),但其他人使用了与我们类似的条件(27,54). 我们使用的相对温和的提取条件可能解释了我们确实发现了TET-SMCHD1关联。SMCHD1-TET复合物可被300 mM NaCl破坏。提取和洗涤步骤当然是鉴定相互作用蛋白质的决定因素。使用较高的盐浓度(>150 mM)将增加分解蛋白质复合物的风险。我们手稿中的其他数据,包括内源性co-IP、BiFC(不使用细胞提取或盐洗)和遗传学研究,进一步支持了TET-SMCHD1相互作用。
根据我们的数据,我们提出了一个模型,在该模型中,SMCHD1通过抑制靶序列中TET蛋白的活性而起到负调节作用(). 这种调节可能涉及“屏蔽”机制,因为DNA低甲基化在已知的SMCHD1结合基因组区域最为明显(例如。,杜克斯和Pcdha公司基因簇)。SMCHD1可以通过直接DNA结合或异染色质中的存在来抑制TET。SMCHD1对TET的局部抑制或“捕获”也可能导致全球5mC氧化的轻微减少,在SMCHD1-缺失导致适度的全球DNA低甲基化时被逆转。我们的数据在概念上与其他模型一致,这些模型假设SMCHD1在染色质中作为对抗CCCTC结合因子(CTCF)结合的拮抗蛋白发挥作用(40)通过屏蔽机制或通过促进DNA甲基化干扰CTCF的结合。SMCHD1也已被证明是防止多梳复合物形成H3K27me3的保护因子(25).
SMCHD1功能丧失突变,经常影响其ATP酶域,是人类肌营养不良症(FSHD2)的一个特征,其特征是不适当激活DUX4型基因,它是小鼠的人类同源物杜克斯(55–57). 我们有兴趣推测,SMCHD1功能障碍导致TET限制性缺失可能导致TET诱导的DUX4型对照区和非计划表达DUX4型可能在人类胚胎发育期间就已经开始了,后来又在肌肉疾病中表现出来。
我们的数据表明,SMCHD1对于杜克斯mESCs中的抑制,从而控制类似2c的状态。此外,SMCHD1在小鼠发育过程中非活性X染色体上CpG岛的从头甲基化中起着关键作用(23). 然而,最近的数据表明,体细胞中SMCHD1的缺失不会导致X染色体的重新激活(24,25). 总之,现有数据表明,SMCHD1在发育过程中促进DNA从头甲基化,而不是介导甲基化维持,我们提出了以下机制:SMCHAD1通过抑制TET介导的靶区5mC氧化和去甲基化,在这些关键DNA甲基化事件中起作用,正如我们在这项研究中所显示的那样,从而将甲基化与去甲基化的平衡转移到甲基化状态(). 当SMCHD1丢失,但在没有TET的情况下DNA甲基化仍然很高(DNA甲基化动力学降低),杜克斯由于DNA甲基化对转录的抑制,表达可能不会发生。另一方面,在缺乏SMCHD1和TET活性的情况下,以及因此较高的甲基化-去甲基化动力学,杜克斯将被激活。该途径在抑制ES细胞的全能性(2c样状态)方面很重要。尽管SMCHD1在灭活杜克斯最近有人提出在2c晚期使用小鼠胚胎(58),该事件最初似乎独立于DNA甲基化,因为杜克斯2c和4c小鼠胚胎的启动子区几乎完全非甲基化(59); 因此,在发育过程中的后期必须发生从头甲基化事件。需要进一步研究以确认SMCHD1是否负责杜克斯早期胚胎发育中的位点以及TET蛋白的抑制是否在这一过程中起重要作用。
方法
质谱法
FLAG-标记的TET3FL或FLAG-标签的TET3S质粒(31)转染293T细胞。48小时后,在10 mM三氯化钠(pH 7.4)、150 mM氯化钠、0.125%NP-40和2.5 mM EDTA中溶解细胞。将裂解产物添加到M2抗FLAG亲和珠(Sigma-Aldrich)中,在4°C下搅拌过夜。在用含有200 mM NaCl的裂解缓冲液进行大量洗涤,然后用20 mM三氯化氢(pH 7.6)和200 mM氯化钠进行洗涤后,将IP珠与5×SDS加载缓冲液混合,并在80°C下加热10 min。将每个蛋白质样品加载到12%十二烷基硫酸钠-聚丙烯酰胺凝胶电泳(PAGE)凝胶上。使用考马斯蓝进行可视化后,将凝胶层切割成八段,并切成小块用于凝胶内消化。凝胶片用蒸馏水洗涤三次以除去SDS,并用100%乙腈脱水。在50 mM NH中用10 mM二硫苏糖醇(DTT)处理蛋白质4HCO公司三在56°C下保持45分钟。用100%乙腈洗涤后,在50 mM NH中用55 mM碘乙酰胺对半胱氨酸进行烷基化4HCO公司三最后,在50 mM NH中用序列级改性胰蛋白酶(12.5 ng/μl;威斯康星州麦迪逊市普罗米加)处理每个脱水凝胶片4HCO公司三缓冲液(pH 7.8)在37°C下过夜。消化后,在室温下用5%甲酸在50%乙腈溶液中提取胰蛋白酶肽20分钟。收集上清液并在SpeedVac中干燥。样品在0.1%甲酸中重新悬浮,并在MS分析之前使用C18 ZipTips(Millipore,MA)进行纯化和浓缩。
使用Dionex UltiMate 3000 RSLCnano系统(Thermo Fisher Scientific)进行肽分离。使用0.1%甲酸对珠状色谱柱中的色氨酸肽进行重组,并在50-cm EASY-Sraph色谱柱上分离,该色谱柱内径为75-μm,填充有2-μm C18树脂(美国Thermo Scientific公司),使用0至45%的乙腈梯度在50°C的0.1%甲酸中120分钟(300 nl/min)。将液相色谱(LC)耦合到具有纳米ESI源的Q Exactive Plus质谱仪(Thermo Fisher Scientific)。质谱是在数据相关模式下采集的,可在全扫描和10个数据相关串联质谱(MS/MS)扫描之间自动切换。全扫描MS光谱的目标值为3000000,最大注入时间为120 MS,质量/电荷比下的分辨率为70000(米/z(z))第页,共400页。MS/MS的离子目标值设置为1000000,最大注入时间为120 MS,分辨率为17500米/z(z)400.动态排除重复肽20秒。
使用SequestHT on Proteome Discoverer(2.2版,Thermo Fisher Scientific)根据Swiss-Prot数据库搜索获得的MS/MS光谱。简而言之,前体质量容限设置为±10 ppm(百万分之一),MS/MS容限设置在0.02 Da。使用“Percolator”进行每次分析时,FDR设置为1%。从Sequest搜索输出中,肽数据是Proteome Discoverer的默认值。使用每个蛋白质的独特肽和剃刀肽的峰值强度进行无标签定量。使用总肽量进行归一化。
为了鉴定TET2相互作用伙伴,我们用N-末端FLAG和HA标签(Addgene质粒no.41710;a.Rao的礼物)将FLAG标记的TET2FL转染到293T细胞中,48小时后收获细胞,并对其进行类似于下文所述的ES细胞的处理。将SMCHD1蛋白内源性标记为C末端FLAG标签的ES细胞制备如下:我们遵循CETCh-seq方案(60). 简单地说,我们设计了导向RNA(gRNA;5′GTCTTCAGAAATGCTCAGTT),并将其克隆到pSpCas9-2A-尿霉素(PX459,Addgene;F.Zhang的礼物)中,以靶向SMCHD1的终止密码子附近并切割。我们克隆了700到800个碱基对的长同源臂Smchd1号机组通过吉布森组装反应将其导入pFETCh-door主干载体(Addgene质粒编号63934;由E.Mendenhall和R.M.Myers赠送)。然后,我们以2:1的比例共转染供体质粒和gRNA质粒。在嘌呤霉素(1.5μg/ml)和G418(200μg/ml。提取选定克隆的DNA并测序,以检测是否存在FLAG标签。用抗FLAG抗体和抗SMCHD1抗体进行Western blot检测标记的SMCHAD1蛋白。
收集细胞,并在由10 mM tris-HCl(pH 7.4)、150 mM NaCl、0.125%(v/v)NP-40、cOmplete蛋白酶抑制剂片(Sigma-Aldrich;1片/10 ml)和2.5 mM EDTA组成的冰溶缓冲液中在4°C下溶解1小时。我们将细胞裂解液离心至40000克在4°C下培养60分钟,然后将上清液转移到平衡的抗FLAG M2亲和珠(Sigma-Aldrich)上,并在4°C下在转轮上培养浆液过夜。我们用含有10 mM三氯化氢(pH 7.4)、250 mM氯化钠、0.125%(v/v)NP-40、cOmplete(1片/10 ml)和2.5 mM EDTA的冰镇洗涤缓冲液在4°C的转轮上洗涤珠子5分钟,并重复洗涤五次。最终清洗后,用含有20 mM三氯化钠(pH 7.5)、150 mM氯化钠、0.02%(v/v)吐温20和3×FLAG肽(150μg/ml)的洗脱缓冲液将珠子洗脱两次5分钟。然后将洗脱样品与5×SDS负载缓冲液混合,并在99°C下变性10分钟。将蛋白质样品装载并分离在迷你凝胶(Bio-Rad mini-PROTEAN TGX 4至20%)上。凝胶用考马斯蓝和去污水染色。切割的凝胶样品用胰蛋白酶消化,然后注入马萨诸塞大学蛋白质组学核心设施的Thermo Orbitrap Fusion Lumos质谱仪。通过Proteome Discoverer软件,使用吉祥物搜索引擎在Swiss-Prot人/鼠数据库中搜索数据。
蛋白质纯化和体外TET活性测定
全长SMCHD1被克隆到带有FLAG标签的pFastBac载体(Thermo Fisher Scientific)中。我们通过Sanger测序确认了所有表达载体。对于FLAG标记的SMCHD1和TET2蛋白表达,将杆状病毒DNA转染到Sf9细胞(Bac-to-Bac杆状病毒表达系统;Thermo Fisher Scientific)中,在转染后96小时获得第0代(P0)杆状病毒。然后,我们用P0杆状病毒感染细胞,继续产生P1杆状毒。在转染P1病毒后,使用1000 ml昆虫细胞(200万个细胞/ml)表达蛋白质72小时,并将细胞颗粒重新悬浮在裂解缓冲液中[50 mM Hepes(pH 7.5)、300 mM NaCl、0.2%(v/v)NP-40、cOmplete、无EDTA-蛋白酶抑制剂鸡尾酒(Roche,1片/10 ml)和苯甲酸核酸酶(10 U/ml)(Millipore)破坏核酸]。在20000下通过离心法清除裂解液克60分钟。按照制造商的说明,在裂解缓冲液中平衡抗-FLAG M2亲和凝胶(Sigma-Aldrich)。我们将清除的裂解物与平衡的FLAG M2亲和凝胶在4°C下孵育2小时。然后用洗涤缓冲液[50 mM Hepes(pH 7.5)、150 mM NaCl和15%(v/v)甘油]洗涤结合蛋白五次。我们用含有3×FLAG肽(100μg/ml)(Sigma-Aldrich)的洗涤缓冲液洗脱蛋白质。用Amicon超离心过滤器浓缩纯化的FLAG标记蛋白,并将DTT添加至1 mM,然后将等分样品在液氮中闪速冷冻,并储存在−80°C下。如上所述,使用抗FLAG纯化法从哺乳动物细胞中纯化TET蛋白。
我们在已建立的TET氧化反应的基础上进行了TET蛋白体外检测(详细信息请参见TAB测序反应)。对于P.C.,使用18μg TET2-CD蛋白处理500 ng Sss I甲基化基因组DNA,以获得含有5caC的完全氧化DNA。对于阴性对照(N.C.),未使用TET蛋白。对于测试样品,使用1.15μg TET蛋白处理Sss-I-甲基化基因组DNA,并在TET氧化反应中添加不同数量的重组全长SMCHD1。对照组为牛血清白蛋白(BSA)。对于空白对照,仅使用用于蛋白质纯化的洗脱缓冲液来保持反应的体积相同。TET氧化反应后,我们使用EZ DNA甲基化金试剂盒(Zymo Research)对纯化的DNA进行亚硫酸氢盐转化处理。这种治疗将TET反应产物5caC转化为尿嘧啶。对于COBRA,BstU I用于消化亚硫酸氢盐转化后获得的PCR产物。为了进行序列分析,将亚硫酸氢盐转化后获得的PCR产物克隆到Topo-TA克隆载体中,并对克隆进行测序。
利用CRISPR-Cas9进行细胞培养和KO-mESC系的建立
J1 mESCs(来自美国型培养物收集)在无饲料条件下,在KO DMEM(Dulbecco改良的Eagle's培养基;Gibco,10829-018)中的0.1%明胶涂层组织培养板上培养,补充15%胎牛血清、LIF(1000 U/ml)(Millipore,ESG1106)、1×非必需氨基酸(Gibco、11140-050)、,100μMβ-巯基乙醇(Invitrogen,21985-203)和2 mM我-谷氨酰胺(Gibco,25030-081)。
mESCs转染pSpCas9-2A-尿霉素(PX459)质粒(Addgene质粒编号62988;来自F.Zhang的礼物),携带合适的Smchd1号机组sgRNAs,根据制造商的说明使用BioT转染试剂(Bioland,B01-01)。在嘌呤霉素(1.5μg/ml)中选择单细胞克隆。要停用杜克斯野生型和Smchd1号机组KO ES细胞克隆,我们转染WT细胞或Smchd1号机组带有pSpCas9-2A-塑性蛋白质粒的KO ES细胞杜克斯sgRNA。用速溶素(8μg/ml)选择单细胞克隆。我们使用相同的pSpCas9-2A-puromycin-gRNA载体敲除Smchd1号机组在里面测试1/测试2/Tet3型三敲除ES细胞。提取DNA并测序,以检测WT和/或突变等位基因的存在。三个独立衍生的野生型,三个纯合突变体Smchd1号机组-KO克隆,三个纯合杜克斯-敲除克隆,三个纯合Smchd1/Dux公司双敲除克隆和三个纯合突变体测试1/测试2/Tet3型/Smchd1号机组本研究选用了四个敲除克隆。
质粒构建和相互作用研究
对于哺乳动物表达载体Tet3FL公司,Tet3S公司、和测试1如前所述构建表达载体(31). pEF-Smchd1号机组-FLAG表达载体是M.Blewitt的礼物。pFastBac1-hTET2-CS结构由R.Kohli提供(61). TET3和SMCHD1片段被克隆到pEF-DEST51表达载体(Invitrogen,430106)。对于外源性表达的全长蛋白的co-IP,293T细胞通过使用BioT转染试剂转染,质粒表达适当的FLAG或V5标记蛋白(每个质粒在10厘米的培养皿上5μg)。在转染后48小时收集293T细胞,并根据制造商的说明使用NE-PER核和细胞质提取试剂(Thermo Fisher Scientific,78835)纯化核裂解物。核裂解物与2μg适当抗体孵育2小时,然后与20μl Dynabeads蛋白g(Invitrogen,00671375)孵育过夜,以收集免疫复合物。我们用含有10 mM三氯化氢(pH 7.4)、150 mM氯化钠、0.125%(v/v)NP-40、cOmplete(1片/10 ml)和2.5 mM EDTA的冰镇洗涤缓冲液洗涤免疫复合物。将样品在SDS-PAGE加载缓冲液中煮沸,然后进行SDS-PAGE和蛋白质印迹。对于蛋白结构域的co-IP,293T细胞转染表达适当FLAG或V5标记蛋白的质粒(每个质粒在10厘米培养皿上5μg)。转染后48小时收集293T细胞,并在IP缓冲液中溶解[10 mM tris-HCl(pH 7.4)、150 mM NaCl、0.125%NP-40和2.5 mM EDTA],补充蛋白酶抑制剂鸡尾酒(Roche)。细胞裂解液在12000℃离心克在4°C下培养15至30分钟,与2μg适当抗体孵育2小时,然后与20μl Dynabeads蛋白g(Invitrogen,00671375)孵育过夜。然后用IP缓冲液[10 mM tris-HCl(pH 7.4)、150 mM NaCl、0.125%NP-40和2.5 mM EDTA]清洗珠子六次。最后,将样品在SDS-PAGE样品加载缓冲液中煮沸,然后进行SDS-PACE,并用所示抗体进行Western印迹。对于内源性co-IP、核提取物制备、缓冲液制备和co-IP,我们根据制造商的说明使用了核复合物co-IP试剂盒(Active Motif,54001)。我们使用了5μg内源性co-IP抗体:SMCHD1(Bethyl,A302-871A)、TET1抗体(GeneTex,GTX124207)、TET2抗体(Cell Signaling Technology,92529)和TET3抗体(31). IP反应后,我们用所示抗体进行了Western blotting。
荧光激活细胞分选
采用贝克曼细胞分选系统进行FACS分析。Smchd1号机组-使用MoFlo Astrios仪器(Beckman Coulter)对含有2C::tdTomato报告子的KO mESCs或WT细胞(Addgene质粒编号40281;S.Pfaff赠送)进行FACS分类。
荧光素酶报告分析
我们播种了1×10粒5293T细胞在转染前放入24孔板。用TET3S和SMCHD1表达载体、47.5 ng pGL3荧光素酶报告载体(甲基化或非甲基化)和2.5 ng内部对照Renilla荧光素酶报告载体转染细胞(pRL-CMV,Promega,Madison,WI)。我们在转染后48小时收获细胞。所有转染至少在三个独立实验中进行,共三次。根据制造商的说明,使用双荧光素酶检测试剂盒(Promega)对萤火虫和Renilla荧光素酶活性进行检测。萤火虫荧光素酶活性相对于Renilla活性进行了标准化。
BiFC分析
进行BiFC分析以确定SMCHD1和TET3之间的体内相互作用。该检测基于诱饵和猎物蛋白质之间的相互作用,这些蛋白质将荧光蛋白(GFP)的两个非荧光片段聚集在一起,然后形成一个功能性发色团。在本研究中,所有重组表达载体均构建在HA-GFP1-10-pDEST-C和FLAG-GFP11-pDEST-C的空主干上(Addgene质粒编号118369和118367;来自M.Vartiainen的礼物)。我们使用人类胚胎肾293T细胞,这些细胞使用BioT转染试剂与pEF-SMCHD1-HA-GFP1-10和pEF-TET3-FLAG-GFP11表达载体共转染。转染后48小时,通过共焦显微镜(蔡司LSM 880显微镜)和细胞计数仪(Celigo)分析细胞,以确定相互作用。以pEF-OGT-HA-GFP1-10和pEF-TET3-FLAG-GFP11的共转染作为P.C.共转染pEF-SMCHD1-HA-GFP1-10和pEF-ccdB-FLAG-GFP21,共转染P EF-ccdB-HA-GFP10和P EF-TET3-FLAG-GFP11为N.C。
AlphaScreen分析
按照制造商的方案,进行AlphaScreen(PerkinElmer)分析,以确定生物素SMCHD1和His-tagged TET蛋白之间的体外相互作用。简单地说,200 nM SMCHD1-生物素和200 nM TET2FL-His或TET2-CD-His在室温下培养1小时。然后在总体积为100μl的AlphaScreen缓冲液中,将蛋白质样品与链霉亲和素涂层供体小球(最终浓度为10μg/ml)和镍相关受体小球(最终密度为10μg/ml)孵育在含有50 mM MOPS(pH 7.4)、50 mM NaF、50 mM3-[(3-胆酰胺丙基)二甲基氨]-1-丙基磺酸钠的AlphaScreen缓冲溶液中,和BSA(0.1mg/ml)在黑暗中在室温下保持1小时。EnVision Alpha阅读器(PerkinElmer)在384孔板中检测到光子计数。
蛋白质印迹和斑点印迹分析
如前所述进行蛋白质印迹和斑点印迹(31),稍作修改。对于Western blots,我们在含有50 mM tris-HCl(pH 7.4)、150 mM NaCl、1%Triton X-100、1 mM EDTA和蛋白酶抑制剂混合物(Roche,11873580001)的缓冲液中在冰上溶解细胞60分钟,然后在12000离心克在4°C下保持15分钟。在4至15%SDS-聚丙烯酰胺凝胶上分离裂解产物,并在4°C下通过湿转移将其转移到PVDF(聚偏二氟乙烯)膜(Bio-Rad)上。我们在室温下将膜与封闭缓冲液(5%脱脂牛奶和0.1%吐温20,PBS)孵育1小时,然后在4°C下与指示的一级抗体孵育过夜。用PBS-Tween(0.1%)清洗后,在室温下用过氧化物酶偶联二级抗体孵育膜1小时。使用ECL Prime检测试剂(GE Healthcare)检测信号。用于蛋白质印迹的抗体如下:抗SMCHD1(1:2500;Abcam,ab31865)、抗SMCHD1(1:2500,Bethyl,A302-871A)、抗TET1(1:1000;GeneTex,GTX124207)、抗TEM2(1:2000;Cell Signaling Technology,92529)或抗TET2(1:100;ProteinTech,21207-1-AP)、抗DNMT1(1:1000,Novus Biologicals,NB100-56519)、抗-DNMT3A(1:1000);Novus Biologicals公司,NB120-13888),抗DNMT3B(1:1000;Novus Biologicals,NB300-516),抗-α-微管蛋白(1:10000;Abcam,ab7291),抗ZSCAN4(1:2500;Millipore,AB4340),HRP(辣根过氧化物酶)山羊抗兔免疫球蛋白G(IgG)(1:10000,活性Motif,15015),以及HRP山羊抗鼠IgG(1:10000)。对于斑点杂交,使用Quick-DNA Miniprep Plus试剂盒(Zymo Research,D4070)纯化基因组DNA,然后进行核糖核酸酶A处理。然后使用QIAquick PCR纯化试剂盒(Qiagen,28104)对DNA进行超声处理和纯化。将纯化的DNA在98°C的TE缓冲液中连续稀释并变性10分钟,然后立即在冰上冷冻10分钟。然后使用Bio-Dot仪器(96-well;Bio-Rad)将DNA标记在湿的GeneScreen Plus杂交尼龙膜(PerkinElmer,NEF988001PK)上。印迹膜是紫外线交联的。在室温下用封闭缓冲液(5%脱脂牛奶和0.15%吐温20在PBS中)培养2小时后,然后在室温下将膜与抗5hmC抗体(1:8000;活性Motif,39769)或抗5mC抗体(1:1000;活性Moti,39649)培养1小时。用PBS-Tween(0.15%)清洗后,在室温下用过氧化物酶偶联二级抗体孵育膜1小时。使用ECL Prime检测试剂(GE Healthcare)检测信号。
亚硫酸氢盐测序和TAB测序
使用Quick-DNA Miniprep Plus试剂盒(Zymo Research,D4070)纯化DNA。根据制造商的说明,使用EZ DNA甲基化金试剂盒(Zymo Research,D5005)进行亚硫酸氢盐转化。用于扩增亚硫酸氢盐处理的DNA中特定靶点的PCR引物序列为5′TTTGTTAGGGATGGTT(正向)和5′AAACCTATAAAACCTCTTA(反向)杜克斯发起人。为了进行序列分析,将亚硫酸氢盐转化后获得的PCR产物克隆到Topo-TA克隆载体(Thermo Fisher Scientific,450030)中,并对克隆进行测序。对于TAB测序,500 ng基因组DNA与T4–β-葡萄糖基转移酶(10 U/μl)[New England Biolabs(NEB)]、2 mM尿苷二磷酸-葡萄糖(NEB。接下来,我们按照如下方式进行TET氧化反应:将纯化的DNA与12.5μg内部纯化的TET2-CD蛋白、明胶(1600μg/ml)、TET氧化缓冲液1[1.5 mM Fe(NH4)2(销售代表4)2]和TET氧化缓冲液2[83 mM NaCl、167 mM Hepes(pH 7.5)、4 mM ATP、8.3 mM DTT、3.3 mMα-酮戊二酸和6.7 mM抗坏血酸钠]在37°C下放置2小时。然后,我们向反应中添加1μl蛋白酶K(20 mg/ml),充分混合,并在50°C下培养10分钟。我们进行苯酚/氯仿纯化和乙醇沉淀,并将纯化的DNA溶解在TE缓冲液中[10 mM三氯化氢(pH 8.0)和0.1 mM乙二胺四乙酸]。最后,我们用EZ DNA甲基化金试剂盒(Zymo Research)对纯化的DNA进行亚硫酸氢盐转化处理。为了进行序列分析,将亚硫酸氢盐转化后获得的PCR产物克隆到Topo-TA克隆载体中,并对克隆进行测序。
RNA测序
根据制造商的说明,使用PureLink RNA迷你试剂盒(Ambion,12183020)从整个细胞中提取总RNA。总RNA完整性由安捷伦2100生物分析仪(安捷伦科技公司)验证,并用NanoDrop 8000仪器(赛默飞世尔科技公司)定量。RNA-seq文库是用KAPA RNA HyperPrep试剂盒和核糖核酸酶(KAPA Biosystems)从总RNA中制备的。在生物分析仪(安捷伦科技公司)上验证了库大小分布。使用Illumina NextSeq500机器进行测序,获得75-bp的单端读数。按照Illumina标准执行库多路复用。
RNA-seq数据分析
Trim-Galore(版本0.4.0)用于修剪75bp的单端读数。使用STAR(版本2.5.1)将读取结果与小鼠基因组mm9对齐,并使用STAR进行基因计数。基因计数矩阵导入R(版本3.5.1)。使用Limma(版本3.38.2)统计软件包19测定差异基因表达。差异表达P(P)在stats包中,使用Benjamini-Hochberg方法对数值进行多次测试校正。差异表达基因的统计显著性为折叠变化>2q个< 0.05. 热图是用Pheatmap包生成的。GSEA是使用Broad Institute的GenePattern算法的GSEA预排序模块执行的(62). 对于GSEA分析,所有数据都与Macfarlan的2c类基因集进行了比较等. (42). 根据前面描述的方法,使用1000个基因列表排列来确定FDR值和经典评分方案(49). 通过计算完全落在RepeatMasker注释重复元素内的读取计数,进行重复元素分析,并使用R生成密度图。
全基因组亚硫酸氢盐文库的制备和测序
对于WGBS文库制剂,根据制造商的说明,我们使用了Swift、Accel NGS甲基序列DNA文库试剂盒(Swift Biosciences,30024)和Zymo的EZ DNA甲基化Lightning试剂盒(Zymo Research,D5030)。使用Illumina HiSeq X进行测序,并进行150-bp配对读取运行。
WGBS数据分析
使用TrimGalore!对双端全基因组亚硫酸氢盐读数进行修剪!,版本0.5.0(https://github.com/FelixKrueger/TrimGalore网站)使用以下参数删除库准备工件和低质量基础:--length 50、--clip_R1 10、--clip _R2 18、--three_prime_clipR1 10和--three-prime_crip_R2 10。使用Bismark 0.19.0版将修剪后的读数与mm9初级染色体对齐(63)和Bowtie2版本2.3.3.1(64)使用以下参数:-X 1000、--nucleotide_coverage和--bowtie2。使用bismark提供的去重复_bismark脚本标记并去除重复。使用bismark提供的bismark_methylation_extractor脚本和以下参数提取CpG甲基化值:-no_overlap、--comphensive、--merge_non_CpG和--cytosine_report。我们使用了DMRseq 0.99.0版(41)识别DMR。简言之,DMR调用不考虑读取次数少于五次的CpG基因座,候选区域使用单个CpG系数截止值0.05。使用q个值<0.05。每个CpG甲基化值是基于组的平均值。t吨测试显示WT和KO之间存在显著的甲基化差异(P(P)< 2.2 × 10−16). DMR相关基因通过定义基因邻近范围内的DMR来确定。DMR通过床具(TSS±2K)和基因组区域富集注释工具(GREAT)进行鉴定(65)以及DMR和差异表达基因之间的长期相互作用。我们通过分析从GEO(Gene Expression Omnibus)数据集下载的J1 ESC中的Hi-C数据,确定了DMR和差异表达基因之间的长期相互作用{“类型”:“entrez-geo”,“属性”:{“文本”:“GSM862720”,“term_id”:“862720“}}GSM862720型(SRR443885)。Trim Galore(版本0.4.3)用于Hi-C数据的适配器微调;HICCUP(版本0.5.9)用于绘图和执行质量控制。重要交互(默认:P(P)<0.001和z(z)得分>1.0),用HOMER识别,分辨率为40kb。Hi-C基因注释涉及识别与基因启动子的相互作用,定义为基因TSS的±2 kb(图S5G)。
5hmC下拉式qPCR和逆转录qPCR(RT-qPCR)
根据制造商的说明,使用EpiJET 5hmC浓缩试剂盒(Thermo Fisher Scientific,K1491BID)对含有5hmC的DNA进行浓缩。然后使用富集的DNA进行qPCR分析杜克斯轨迹。目标特异性引物的qPCR反应包括正向(5′GCTTTGCTACCAGGGAGG)和反向(5′GATCTTAGCTGGGCCTG)引物杜克斯区域1和正向(5′CTAGCGACTTTGCCCTCCTTC)和反向(5′GCTGATCAAGGAGGTTCC)引物杜克斯区域2。在CFX96实时PCR循环器(Bio-Rad)上,使用Power SYBR Green主混合液(Applied Biosystems,1809579),在95°C下进行PCR反应10分钟,然后在95℃下进行50个循环,持续15秒,在57°C下持续30秒,在72°C下继续30秒。
使用PureLink RNA迷你试剂盒(Ambion)从培养细胞中分离出总RNA。根据制造商的说明,SuperScriptIII逆转录酶(Invitrogen,18080051)用于RNA的逆转录。使用TaqMan基因表达主混合(Applied Biosystems,4369016)在CFX96实时PCR循环器(Bio-Read)上,在50°C下进行2分钟和95°C下10分钟的实时qPCR反应,然后在95°C上进行15秒和60°C下1分钟的50个循环。使用比较法分析目标基因的cDNA水平C类t吨方法并归一化为内标β-actin。
ChIP qPCR
如前所述执行ChIP(31),稍作修改。简言之,在室温下,用1%甲醛(Thermo Fisher Scientific,28908)在固定缓冲液[50mM Hepes(pH 7.5)、100mM NaCl、1mM EDTA和0.5mM EGTA]中交联细胞10分钟,并使用Covaris E220声波仪(Covaris;Woburn,MA)将裂解细胞核的染色质剪切成300-500bp的片段。染色质片段与5μg适当抗体[SMCHD1(Abcam,ab31865)、TET1(GeneTex,GTX125888)或IgG对照品(Santa Cruz Biotechnology;SC-2027)]在4°C下隔夜培养,并旋转。对于ChIP-qPCR,使用CFX96实时PCR循环器(Bio-Rad)进行实时qPCR。每个样品分析四份。数据根据2进行分析−(C类t IP样品−C类t IgG样本)方法和表示为输入百分比的−倍变化。PCR引物序列可根据要求提供。