1.简介
转录激活物样效应器(TALE)组成一个毒力蛋白家族,在植物细胞中充当转录激活因子(Boch&Bonas,2010)). TALE被组织成三个不同的结构域:一个参与细菌分泌系统蛋白质移位的N末端区域(Bogdanove等。, 2010),一个中心DNA结合域和一个C末端区域,包含核定位信号序列和一个酸性转录激活区。中心DNA结合域由识别DNA靶点的串联重复序列阵列组成。重复序列包含一个由30–-42个残基组成的保守序列,构成一个新的DNA结合基序(Boch&Bonas,2010). TALE蛋白的DNA-结合域中的重复数在1.5到33.5之间;DNA结合结构域的最后一个重复只包含一半的残基(Boch&Bonas,2010; 博克等。, 2009). 较小的TALE很可能是无功能的,因为诱导靶基因表达(Boch等。, 2009). 每个重复序列的氨基酸序列都很保守,但12和13位的两个相邻氨基酸除外,这两个氨基酸被称为重复变量双残基(RVD)。每个重复序列识别的DNA碱基由RVD的氨基酸序列指定,在每个重复序列中的这些氨基酸对和核苷酸在目标序列中(Boch等。, 2009; 莫斯科和博格达诺夫,2009年).
迄今为止,在检查的不同TALE中,已发现20多种不同的RVD(Cong等。, 2012). 然而,一些二肽可以结合几个碱基,促进蛋白质-DNA识别码的退化(Boch等。, 2009; 斯特鲁贝尔等。, 2012). RVD二肽以外的其他残基对基对特异性没有显著影响(Moscou&Bogdanove,2009; Morbitzer公司等。, 2010). 结构数据表明,只有RVD第13位的残基对靶DNA识别具有特异性接触,而第12位的氨基酸似乎稳定了重复序列(Deng等。, 2012; 马克等。, 2012). 简单的RVD核苷酸编码允许设计用新重复组合生成的新TALE。在重新设计的识别新DNA靶标的TALE中组装几个重复序列,证实了这些DNA结合结构域的模块化及其在生物技术应用中的应用(Bogdanove&Voytas,2011; 米勒等。, 2011). TALE–DNA相互作用使蛋白质在N端到C端的重复方向与5′–3′-义DNA链接触。所有天然靶点都含有5′T(也称为T0)在公认的DNA之前,据报道,该DNA对TALE活动很重要(Bogdanove&Voytas,2011).
在这里,我们展示了晶体结构AvrBs3的DNA结合区campestris黄单胞菌与胡椒Bs3启动子中的目标序列结合,包括与初始胸腺嘧啶相互作用的N末端区域。该结构揭示了该域与T的一种新的相互作用模式0这些数据,以及蛋白质与DNA结合的分析在体外和活动体内,表明AvrBs3能够识别其目标,尽管基数位于零位。
2.材料和方法
2.1. 蛋白质表达和纯化
本研究中使用的AvrBs3包含一些修饰,似乎可以在不改变特异性的情况下改善蛋白质表达。NI RVD用于靶向腺嘌呤(第一个重复除外),其中一个NG RVD与野生型序列不同。将AvrBs3的编码cDNA克隆到pET衍生的载体中,并转化为大肠杆菌BL21。细胞在310 K的LB培养基中生长,在1 m的培养基中诱导蛋白表达M(M)IPTG 2 h,当培养物在600 nm处达到OD 1。缓冲液中的超声作用破坏了诱导细胞A类(50米M(M)HEPES pH 8.0,150 mM(M)氯化钠,0.5米M(M)咪唑,0.5米M(M)TCEP)。通过离心去除细胞碎片,并将上清液加载到Ni–NTA(GE Healthcare)柱上。在广泛的柱洗后,蛋白质以线性梯度洗脱至500 mM(M)咪唑。将含有该蛋白质的组分混合并装入肝素柱(GE Healthcare)中,在缓冲液中平衡B类(50米M(M)HEPES pH 8.0,150 mM(M)氯化钠,0.5米M(M)TCEP)。使用线性梯度1洗脱蛋白质M(M)氯化钠。将含有该蛋白质的组分混合并装入Superdex 200(GE Healthcare)凝胶过滤柱中,在缓冲液中平衡A类蛋白质组分汇集并储存在193 K。
2.2. 结晶、数据收集、结构求解、建模和细化
纯化的AvrBs3 DNA结合域与含有辣椒Bs3启动子目标序列的21-base-pair DNA双链复合物结晶(见图1一寡核苷酸序列和补充图S11蛋白质序列)。结晶用21 bp DNA(IDT)在25 m内通过慢冷退火M(M)HEPES pH 8.0,150 mM(M)最终双相浓度为0.5 m的NaClM(M)将相对于DNA 1.2摩尔过量的TALE AvrBS3在7 mg ml的蛋白质-DNA浓度下在冰上孵育10分钟−1在25 m的溶液中M(M)HEPES pH值8150 mM(M)氯化钠,0.2米M(M)TCEP。对复合物进行20 m透析M(M)MES pH 6.0,100 mM(M)氯化钠,5米M(M)氯化镁2在277 K下持续1 h。使用笛卡尔4000 XL机器人,使用0.8µl坐滴液进行结晶。在298 K温度下,使用1:1的复合溶液和储层溶液[100 mM(M)MES pH 6.5,5–15%(v(v)/v(v))PEG 3350,5–15%(v(v)/v(v))2-丙醇]。在2–3天后生长的晶体通过添加30%进行低温保护(v(v)/v(v))2-丙醇至母液,并在液氮中闪蒸冷却。在瑞士维利根SLS的PXI-XS06光束线上,使用同步辐射在100K下收集衍射数据。数据处理和缩放是通过XDS公司(卡布施,2010年; 表1). 通过结合Ta的信息获得初始相6英国12-簇单波长反常衍射(SAD)数据集和从以前的部分模型获得的分子重定位信息相位器(麦考伊等。, 2007)(见表1和补充图S2)。异常Patterson显示存在两个可能的位点,以及两个Ta6英国12使用SHELX公司一揽子计划(Sheldrick,2008年). 的搜索模型分子置换是基于PDB条目衍生的三个RVD重复序列的多胺骨架3v6吨(邓等。, 2012). 最初的分子重定位阶段显示出在几个蛋白质区域中没有很好定义的密度。重原子团簇相与分子置换溶液的结合产生了改进的电子密度图。这些初始阶段使用更高分辨率的原生数据集扩展到2.55Å分辨率自动编译中的例程菲尼克斯(亚当斯等。, 2010). 建造该结构,并使用库特(埃姆斯利等。, 2010)和精炼通过组合REFMAC公司(穆尔舒多夫等。, 2011)和菲尼克斯(亚当斯等。, 2010). 蛋白质-DNA氢键和范德瓦尔斯接触的鉴定和分析用蛋白质界面、表面和组装服务(国际学生成绩评估)在欧洲生物信息研究所(https://www.ebi.ac.uk/msdsrv/port_int/pistart.html).
| 本地 | 助教6英国12SAD峰值 | 数据收集 | “空间”组 | C类2 | C类2 | 单位-细胞参数(Ω,°) | 一= 151.11,b条= 100.25,c(c)= 61.37,β= 102.55 | 一= 152.27,b条= 100.53,c(c)= 61.40,β=102.84 | 分辨率(Ω) | 32.31–2.55 (2.61–2.55) | 50–3.70 (3.90–3.70) | R(右)合并† | 0.044 (0.62) | 0.041 (0.23) | 反射次数 | 29077 | 19214 | 〈我/σ(我)〉 | 11.79 (1.31) | 8.27 (2.2) | 完整性(%) | 93.26 (95.1) | 97.6 (94.7) | 多重性 | 2.22 (2.07) | 2.9(2.8) | 波长(Å) | 1 | 1.254 | 光束线 | SLS-XS06A型 | SLS-XS06A型 | 精炼 | 分辨率(Ω) | 32.29–2.55 | | 反射次数 | 25764 | | R(右)工作/R(右)自由的 | 0.24/0.29 | | 原子数 | 蛋白质 | 4777 | | 核酸 | 874 | | 水 | 180 | | R.m.s.偏差 | 粘结长度(Ω) | 0.012 | | 结合角(°) | 1.897 | | 平均B类系数(Ω2) | 72.2 | | Ramachandran图,残留物(%) | 允许的区域 | 92.85 | | 充分允许的区域 | 6.27 | | 不允许的区域 | 0.98 | | | †R(右)合并定义依据XDS公司(卡布施,2010年). |
| 图1 AvrBs3–DNA复合物的晶体结构。(一)TALE域结构示意图。N端为绿色,C端为蓝色。中心DNA结合域包含参与DNA识别的RVD。图中显示了AvrBs3的第一个重复序列(青色),指示了每个氨基酸在重复序列中的位置。结晶中使用的寡核苷酸和不同二肽的序列如下所示。(b条)蛋白质的卡通表示–垂直于DNA目标(上面板)和沿着DNA螺旋(下面板)的DNA结构。AvrBs3的螺旋显示为圆柱体,重复序列-1、0、1、2和3分别为红色、石灰色、青色、绿色和米色,以指示初始DNA结构域构建块。双链寡核苷酸以棒状模式表示,每条核苷酸的序列用相应的二肽表示。二肽用单字母氨基酸代码表示。(c(c))AvrBs3蛋白与其DNA靶标复合体的静电表面表征。上面的面板描绘了超级螺旋排列上从氨基末端到羧基末端的电正性条带(蓝色)。下面板中描绘了沿着对面蛋白质的电负性条带(红色)。感测链为洋红色,反义链为绿色。 |
2.3. 荧光各向异性
TALE蛋白和DNA之间的离解常数由蛋白质添加后荧光偏振的变化估算,使用寡核苷酸在其5′端标记为6-FAM的。通过测量连续稀释的6-FAM-DNA样品(Molina等。, 2012). 6-FAM标记的DNA的浓度在20到40 n之间M(M)TALE蛋白增加到1000 nM(M)蛋白质和DNA都在由25米组成的缓冲液中透析M(M)HEPES pH值8150 mM(M)氯化钠,0.2米M(M)TCEP。在298 K下孵育10分钟后,用Wallac 1420 VICTOR2多标记计数器(PerkinElmer)在黑色96 well分析板中测量荧光偏振。数据拟合和K(K)天按照Molina中的描述进行计算等。(2012). 对于竞争性结合分析,24 bp非特异性DNA双链(5′-TCAGACTTCCACAGAGTCAGA-3′)的浓度为100µM(M).
2.4. 等温滴定法热量测定法化验
等温滴定法热量测定法(ITC)实验在298 K下使用MicroCal ITC200仪器(英国MicroCal GE Healthcare)进行。缓冲区由25 m组成M(M)HEPES pH值8150 mM(M)氯化钠,0.2米M(M)TCEP。为了确保最小的缓冲区错配,蛋白质和DNA样本在同一缓冲区中进行透析。配体注射器含有浓度范围为0.06–0.2 m的DNA双工体M(M)恒温细胞含有浓度范围为0.006–0.02 m的TALE蛋白M(M)使用强结合配体A(靶DNA)作为注射剂,在含有第二竞争配体B(竞争DNA)和TALE(T)的细胞中进行竞争性结合研究。然后,该系统有两个平衡点,每次注入时都会发生位移:
的值K(K)B类和ΔH(H)B类对于竞争配体,首先在传统的ITC实验中测量,在确定K(K)A类从竞争实验的结果来看。对于竞争实验,竞争对手的总浓度[B]总数使用公式计算
其中`K(K)A类'是在最佳浓度范围(10)内获得的目标DNA的TALE的估计关联常数5–108 M(M)−1)用于ITC的测量。恒温池含有浓度范围为0.006–0.01 m的TALE蛋白M(M)和竞争对手DNA的浓度为0.005 mM(M)配体注射器中含有浓度范围为0.06–0.1 m的DNA双链体M(M)实验包括向恒温细胞中的200µl蛋白质溶液中连续注射4µl DNA,初始延迟为60 s,注射持续时间为4 s,注射间隔为180s.使用单位点和竞争性结合模型非线性最小二乘分析拟合校正的结合等温线原产地7.0软件(MicroCal)获得平衡结合常数的值(K(K)A类),化学计量(n个)和焓更改(ΔH(H))和T型ΔS公司与DNA结合有关。这个K(K)天是计算值的倒数K(K)A类使用误差传播计算器估计相关误差(https://laffers.net/tools/error-propagation-calculator网站/).
2.5. TALE核酸酶(TALEN)表达克隆的配对及酵母筛选
表达待测TALEN的酵母菌株与含有报告质粒的菌株进行配对,报告质粒包含所选靶点,其两侧是重叠截短的lacZ公司基因(LAC和ACZ)。靶细胞分裂后,串联-重复重组恢复功能性lacZ公司可以使用标准方法监测的基因。使用高网格密度(约20点厘米)在覆盖YPD板的尼龙过滤器上对人才进行网格化−2). 在相同的过滤器上进行第二次网格化处理,以确定第二层,该层由每个目标的报告人宿主酵母菌株组成。将膜放置在富含YPD的固体琼脂培养基上,并在303 K下培养过夜以进行交配。接下来,将过滤器转移到以半乳糖(2%)为碳源的缺乏亮氨酸和色氨酸的合成培养基中,并在310K下孵育5天,以选择携带表达载体和靶载体的二倍体。5天后,将过滤器置于0.02%的固体琼脂糖培养基上(w个/v(v))0.5中的X-GalM(M)磷酸钠缓冲液pH 7.0,0.1%(w个/v(v))SDS,6%二甲基甲酰胺(DMF),7 mM(M) β-巯基乙醇,1%(w个/v(v))琼脂糖并在310K下孵育以监测β-半乳糖苷酶活性。通过扫描分析结果并进行量化。β-半乳糖苷酶活性与同源重组的效率直接相关。使用酵母中具有不同重组活性的几个纯化I-CreI突变体的实验表明,酵母中量化的重组效率(Afilter值)与裂解活性相关在体外(阿诺德等。, 2007; 格里佐等。, 2009).
3.结果和讨论
3.2. 蛋白质-DNA相互作用
有趣的是,一条电正带沿着超级螺旋AvrBs3排列的一侧运行(邓等。, 2012)在另一侧观察到一条电负性条带(图1c(c)). 这个阳性极性带是由每个重复序列中16位的赖氨酸构建的,涉及到与DNA感觉链磷酸骨干的非特异性相互作用,而阴性带主要由重复序列中4位的谷氨酸盐和13位的一些天冬氨酸盐协同构建,位于反义DNA链附近(图1c(c)). 这些极性带沿着蛋白质的排列表明了一种可能的机制,有助于识别核苷酸RVD的感测链,同时避免来自核苷酸在另一股中。事实上,反义链没有显示与蛋白质的接触(补充图S3)。
TALE AvrBs3与DNA的序列特异性接触仅由每个RVD中位置13处的残基与感测链上相应的碱基相互作用而形成(补充图S4)。相反,每个RVD位置12处的残基侧链在每个重复的位置8处与主链羰基O原子接触,限制了含有RVD的环。此外,单个重复序列核心内的位置完全由小的脂肪族残基占据,而重复序列之间界面上的几个位置对应于极性残基对。
3.6. 0位核苷酸的功能相关性
TALE蛋白与启动子区域结合,增强和调节植物基因的转录(Boch&Bonas,2010). 例如,PthXo1结合位点位于TATA盒的下游,而AvrBs3靶点位置0处的T似乎是TATA盒中的一部分。初始T0据报道,靶序列中的位置是TALE功能的重要核苷酸(Boch等。, 2009; 罗默等。, 2010)以及蛋白质与靶蛋白的结合(Mahfouz等。, 2011). 该核苷酸的识别涉及保守度较低的重复序列-1和0。然而,我们没有观察到这些重复序列与T碱基的直接相互作用0在AvrBs3–DNA结构中。在PthXo1–DNA结构中检测到类似情况,其中T0不显示与蛋白质的直接相互作用(Mak等。, 2012). 相反,在AvrBs3中,我们观察到一种新的构象,它允许N末端结构域与T相互作用0(图2b条和2c(c)).
为了解决AvrBs3对其靶DNA 0位核苷酸的偏好,我们使用Bs3A评估了其结合和热力学参数0,G0和C0 寡核苷酸其中T0被相应的底座取代(图3b条, 3c(c)和3(f)). TALE AvrBs3结合Bs3A0和C0具有类似的K(K)天到原始T0竞争DNA的存在几乎没有改变亲和力(图3天, 3e(电子)和3(f)). 只有G0增长了四倍;然而,这种结合仍然显示出合理的亲和力,几乎不受竞争DNA的干扰。ITC数据支持FA结合测量,尽管在ΔH(H)反应的结果。因此,当T0由C替换0当在位置0处发现诸如a之类的体积较大的基底时K(K)天使用这两种方法,反应速率略高(图3b条, 3c(c)和3(f))和ΔH(H)反应的负性较小,表明即使结合反应的效率较低,但较大的碱的存在并不妨碍结合。只有G的存在0显示亲和力下降,即使在存在竞争对手DNA的情况下也不会妨碍目标识别(图3b条–3(f)). 因此,在体外AvrBs3可以绑定其目标序列,包括C0,G0和A0具有与野生型DNA靶点相似亲和力的突变。位于0位置的庞大基地似乎并不妨碍与AvrBs3目标的绑定在体外这与该区域的蛋白质-DNA相互作用相一致,该区域仅涉及DNA主干。
要分析此效果体内,我们使用单链退火分析(SSA)来评估靶序列零位的变化是否会影响融合到FokI核酸酶域的AvrBs3的结合,从而干扰其活性(参见材料和方法; 阿诺德等。, 2007; 塞尔马克等。, 2011; 格里佐等。, 2009; 图4一). 含有T的同二聚体Bs3靶序列0,A0,C0或G0将其插入一个上位质粒中,以评估AvrBs3对0位核苷酸的偏好。该试验表明,AvrBs3–FokI(TALEN)能够独立于0位的核苷酸靶向其位点。尽管T0-包含目标显示更高的活动(图4b条),我们的结果表明T0替代在TALE结合中似乎没有表现出很大的影响,只有G0基地最庞大的目标显示活动显著减少,与在体外绑定测量,表明此方法可用于估计体内应用。对激活内源性人类NTF3基因的工程化TALE的功能分析也表明,含有重复序列-1和0的构建物可以靶向缺乏T的DNA序列0 体内(米勒等。, 2011). 因此,我们的在体外数据表明T0可能在TALE AvrBs3的DNA结合中不起重要作用,从而增加了该支架可能靶向的DNA序列数量。T在天然TALE靶标中0位的流行可能归因于启动子区内富含at的序列,而不是该位置核苷酸的选择性识别。
| 图4 (一)酵母筛选分析原理。携带编码TALEN的表达载体的菌株与携带报告质粒的菌株交配。报告质粒带有lacZ公司报告基因被包含TALEN靶位点的插入物中断,该靶位点两侧有两个直接重复序列。交配后,TALEN在感兴趣的位置产生双链断裂,允许功能恢复lacZ公司通过SSA基因表达,并在X-Gal存在下生成蓝色。颜色被量化并记为Afilter值,这是一个与TALEN核酸酶活性相关的参数。(b条)AvrBs3 TALEN对Bs3同二聚体靶点的核酸酶活性,该靶点在位置0处包含T、A、C或G。显示了用四个不同的Bs3同二聚体靶点获得的滤波值。虚线表示实验背景水平。获得的值是三个独立实验的平均值。 |