研究论文\(第5em段)

期刊徽标结构
生物学
国际标准编号:2059-7983

AvrBs3–DNA复合物的结构为胸腺嘧啶重新识别的初始机制提供了新的见解

十字标记_颜色_方形_文本.svg

西班牙癌症研究中心(CNIO)结构生物学和生物计算项目,Melchor Fernandez Almagro,28029 Madrid,西班牙b条Cellectis,8 Rue de la Croix Jarry,75013巴黎,法国
*通信电子邮件:gmontoya@cnio.es

(2013年4月26日收到; 2013年6月12日接受; 2013年8月15日在线)

转录激活物样效应器包含串联重复序列中组织的DNA结合域。重复序列包括两个相邻的残基,称为重复变量双残基,它识别一个碱基对,在二肽和目标DNA之间建立直接代码。这一特征表明,这种支架是产生生物技术应用的新蛋白质-DNA特异性的最佳候选材料。这里晶体结构提出了AvrBs3(残基152-895,分子量82kDa)与其靶DNA序列的复合物,揭示了与靶序列的初始胸腺嘧啶相互作用的新模式,并对AvrBs 3的结合特异性和热力学性质进行了分析。本研究量化了AvrBs3与其靶DNA之间的亲和力和特异性。此外,在体外体内分析表明,AvrBs3对DNA零位的核苷酸没有严格的核苷酸结合偏好,从而扩大了该支架可能靶向的序列数量。

1.简介

转录激活物样效应器(TALE)组成一个毒力蛋白家族,在植物细胞中充当转录激活因子(Boch&Bonas,2010)【Boch,J.&Bonas,U.(2010),《植物疗法年度评论》,第48期,第419-436页。】). TALE被组织成三个不同的结构域:一个参与细菌分泌系统蛋白质移位的N末端区域(Bogdanove等。, 2010[Bogdanove,A.J.,Schornack,S.和Lahaye,T.(2010)。《植物生物学》第13期,第394-401页。]),一个中心DNA结合域和一个C末端区域,包含核定位信号序列和一个酸性转录激活区。中心DNA结合域由识别DNA靶点的串联重复序列阵列组成。重复序列包含一个由30–-42个残基组成的保守序列,构成一个新的DNA结合基序(Boch&Bonas,2010【Boch,J.&Bonas,U.(2010),《植物疗法年度评论》,第48期,第419-436页。】). TALE蛋白的DNA-结合域中的重复数在1.5到33.5之间;DNA结合结构域的最后一个重复只包含一半的残基(Boch&Bonas,2010【Boch,J.&Bonas,U.(2010),《植物疗法年度评论》,第48期,第419-436页。】; 博克等。, 2009【Boch,J.、Scholze,H.、Schornack,S.、Landgraf,A.、Hahn,S.和Kay,S.,Lahaye,T.、Nickstadt,A.和Bonas,U.(2009),《科学》,第326期,第1509-1512页。】). 较小的TALE很可能是无功能的,因为诱导靶基因表达(Boch等。, 2009【Boch,J.、Scholze,H.、Schornack,S.、Landgraf,A.、Hahn,S.和Kay,S.,Lahaye,T.、Nickstadt,A.和Bonas,U.(2009),《科学》,第326期,第1509-1512页。】). 每个重复序列的氨基酸序列都很保守,但12和13位的两个相邻氨基酸除外,这两个氨基酸被称为重复变量双残基(RVD)。每个重复序列识别的DNA碱基由RVD的氨基酸序列指定,在每个重复序列中的这些氨基酸对和核苷酸在目标序列中(Boch等。, 2009【Boch,J.、Scholze,H.、Schornack,S.、Landgraf,A.、Hahn,S.和Kay,S.,Lahaye,T.、Nickstadt,A.和Bonas,U.(2009),《科学》,第326期,第1509-1512页。】; 莫斯科和博格达诺夫,2009年【Moscou,M.J.和Bogdanove,A.J.(2009),《科学》,3261501。】).

迄今为止,在检查的不同TALE中,已发现20多种不同的RVD(Cong等。, 2012[聪,L.,周,R.,郭,Y.-C.,坎尼夫,M.和张,F.(2012).自然公社.3,968.]). 然而,一些二肽可以结合几个碱基,促进蛋白质-DNA识别码的退化(Boch等。, 2009【Boch,J.、Scholze,H.、Schornack,S.、Landgraf,A.、Hahn,S.和Kay,S.,Lahaye,T.、Nickstadt,A.和Bonas,U.(2009),《科学》,第326期,第1509-1512页。】; 斯特鲁贝尔等。, 2012[Streubel,J.,Blücher,C.,Landgraf,A.和Boch,J.(2012)。《自然生物技术》,第30期,593-595页。]). RVD二肽以外的其他残基对基对特异性没有显著影响(Moscou&Bogdan­ove,2009【Moscou,M.J.和Bogdanove,A.J.(2009),《科学》,3261501。】; Morbitzer公司等。, 2010【Morbitzer,R.,Römer,P.,Boch,J.&Lahaye,T.(2010)。美国国家科学院院刊,107,21617-21622。】). 结构数据表明,只有RVD第13位的残基对靶DNA识别具有特异性接触,而第12位的氨基酸似乎稳定了重复序列(Deng等。, 2012[Deng,D.,Yan,C.,Pan,X.,Mahfouz,M.,Wang,J.,Zhu,J.-K.,Shi,Y.&Yan,N.(2012).科学,335720-723.]; 马克等。, 2012[Mak,A.N.,Bradley,P.,Cernadas,R.A.,Bogdanove,A.J.&Stoddard,B.L.(2012),《科学》,第335、716-719页。]). 简单的RVD核苷酸编码允许设计用新重复组合生成的新TALE。在重新设计的识别新DNA靶标的TALE中组装几个重复序列,证实了这些DNA结合结构域的模块化及其在生物技术应用中的应用(Bogdanove&Voytas,2011【Bogdanove,A.J.和Voytas,D.F.(2011),《科学》,3331843-1846。】; 米勒等。, 2011[Miller,J.C.等人(2011),《自然生物技术》,第29143-148页。]). TALE–DNA相互作用使蛋白质在N端到C端的重复方向与5′–3′-义DNA链接触。所有天然靶点都含有5′T(也称为T0)在公认的DNA之前,据报道,该DNA对TALE活动很重要(Bogdanove&Voytas,2011【Bogdanove,A.J.和Voytas,D.F.(2011),《科学》,3331843-1846。】).

在这里,我们展示了晶体结构AvrBs3的DNA结合区campestris黄单胞菌与胡椒Bs3启动子中的目标序列结合,包括与初始胸腺嘧啶相互作用的N末端区域。该结构揭示了该域与T的一种新的相互作用模式0这些数据,以及蛋白质与DNA结合的分析在体外和活动体内,表明AvrBs3能够识别其目标,尽管基数位于零位。

2.材料和方法

2.1. 蛋白质表达和纯化

本研究中使用的AvrBs3包含一些修饰,似乎可以在不改变特异性的情况下改善蛋白质表达。NI RVD用于靶向腺嘌呤(第一个重复除外),其中一个NG RVD与野生型序列不同。将AvrBs3的编码cDNA克隆到pET衍生的载体中,并转化为大肠杆菌BL21。细胞在310 K的LB培养基中生长,在1 m的培养基中诱导蛋白表达M(M)IPTG 2 h,当培养物在600 nm处达到OD 1。缓冲液中的超声作用破坏了诱导细胞A类(50米M(M)HEPES pH 8.0,150 mM(M)氯化钠,0.5米M(M)咪唑,0.5米M(M)TCEP)。通过离心去除细胞碎片,并将上清液加载到Ni–NTA(GE Healthcare)柱上。在广泛的柱洗后,蛋白质以线性梯度洗脱至500 mM(M)咪唑。将含有该蛋白质的组分混合并装入肝素柱(GE Healthcare)中,在缓冲液中平衡B类(50米M(M)HEPES pH 8.0,150 mM(M)氯化钠,0.5米M(M)TCEP)。使用线性梯度1洗脱蛋白质M(M)氯化钠。将含有该蛋白质的组分混合并装入Superdex 200(GE Healthcare)凝胶过滤柱中,在缓冲液中平衡A类蛋白质组分汇集并储存在193 K。

2.2. 结晶、数据收集、结构求解、建模和细化

纯化的AvrBs3 DNA结合域与含有辣椒Bs3启动子目标序列的21-base-pair DNA双链复合物结晶(见图1[链接]寡核苷酸序列和补充图S11蛋白质序列)。结晶用21 bp DNA(IDT)在25 m内通过慢冷退火M(M)HEPES pH 8.0,150 mM(M)最终双相浓度为0.5 m的NaClM(M)将相对于DNA 1.2摩尔过量的TALE AvrBS3在7 mg ml的蛋白质-DNA浓度下在冰上孵育10分钟−1在25 m的溶液中M(M)HEPES pH值8150 mM(M)氯化钠,0.2米M(M)TCEP。对复合物进行20 m透析M(M)MES pH 6.0,100 mM(M)氯化钠,5米M(M)氯化镁2在277 K下持续1 h。使用笛卡尔4000 XL机器人,使用0.8µl坐滴液进行结晶。在298 K温度下,使用1:1的复合溶液和储层溶液[100 mM(M)MES pH 6.5,5–15%(v(v)/v(v))PEG 3350,5–15%(v(v)/v(v))2-丙醇]。在2–3天后生长的晶体通过添加30%进行低温保护(v(v)/v(v))2-丙醇至母液,并在液氮中闪蒸冷却。在瑞士维利根SLS的PXI-XS06光束线上,使用同步辐射在100K下收集衍射数据。数据处理和缩放是通过XDS公司(卡布施,2010年【Kabsch,W.(2010),《结晶学报》,D66,125-132。】; 表1[链接]). 通过结合Ta的信息获得初始相6英国12-簇单波长反常衍射(SAD)数据集和从以前的部分模型获得的分子重定位信息相位器(麦考伊等。, 2007【McCoy,A.J.,Grosse-Kunstleve,R.W.,Adams,P.D.,Winn,M.D.,Storoni,L.C.&Read,R.J.(2007),《应用结晶杂志》,第40期,第658-674页。】)(见表1[链接]和补充图S2)。异常Patterson显示存在两个可能的位点,以及两个Ta6英国12使用SHELX公司一揽子计划(Sheldrick,2008年[Sheldrick,G.M.(2008),《水晶学报》,A64112-122。]). 的搜索模型分子置换是基于PDB条目衍生的三个RVD重复序列的多胺骨架3v6吨(邓等。, 2012[Deng,D.,Yan,C.,Pan,X.,Mahfouz,M.,Wang,J.,Zhu,J.-K.,Shi,Y.&Yan,N.(2012).科学,335720-723.]). 最初的分子重定位阶段显示出在几个蛋白质区域中没有很好定义的密度。重原子团簇相与分子置换溶液的结合产生了改进的电子密度图。这些初始阶段使用更高分辨率的原生数据集扩展到2.55Å分辨率自动编译中的例程菲尼克斯(亚当斯等。, 2010【Adams,P.D.等人(2010),《水晶学报》,D66,213-221。】). 建造该结构,并使用库特(埃姆斯利等。, 2010【Emsley,P.、Lohkamp,B.、Scott,W.G.和Cowtan,K.(2010),《水晶学报》D66、486-501。】)和精炼通过组合REFMAC公司(穆尔舒多夫等。, 2011【Murshudov,G.N.,Skubák,P.,Lebedev,A.A.,Pannu,N.S.,Steiner,R.A.,Nicholls,R.A..,Winn,M.D.,Long,F.&Vagin,A.A..(2011),《晶体学报》,D67,355-367。】)和菲尼克斯(亚当斯等。, 2010【Adams,P.D.等人(2010),《水晶学报》,D66,213-221。】). 蛋白质-DNA氢键和范德瓦尔斯接触的鉴定和分析用蛋白质界面、表面和组装服务(国际学生成绩评估)在欧洲生物信息研究所(https://www.ebi.ac.uk/msdsrv/port_int/pistart.html).

表1
数据收集和精炼统计学

括号中的值表示最高分辨率外壳。

  本地 助教6英国12SAD峰值
数据收集
“空间”组 C类2 C类2
单位-细胞参数(Ω,°) = 151.11,b条= 100.25,c(c)= 61.37,β= 102.55 = 152.27,b条= 100.53,c(c)= 61.40,β=102.84
分辨率(Ω) 32.31–2.55 (2.61–2.55) 50–3.70 (3.90–3.70)
R(右)合并 0.044 (0.62) 0.041 (0.23)
反射次数 29077 19214
 〈/σ()〉 11.79 (1.31) 8.27 (2.2)
完整性(%) 93.26 (95.1) 97.6 (94.7)
多重性 2.22 (2.07) 2.9(2.8)
波长(Å) 1 1.254
光束线 SLS-XS06A型 SLS-XS06A型
精炼
分辨率(Ω) 32.29–2.55  
反射次数 25764  
R(右)工作/R(右)自由的 0.24/0.29  
原子数
  蛋白质 4777  
  核酸 874  
   180  
R.m.s.偏差
  粘结长度(Ω) 0.012  
  结合角(°) 1.897  
平均B类系数(Ω2) 72.2  
Ramachandran图,残留物(%)
  允许的区域 92.85  
  充分允许的区域 6.27  
  不允许的区域 0.98  
R(右)合并定义依据XDS公司(卡布施,2010年【Kabsch,W.(2010),《结晶学报》,D66,125-132。】).
[图1]
图1
AvrBs3–DNA复合物的晶体结构。()TALE域结构示意图。N端为绿色,C端为蓝色。中心DNA结合域包含参与DNA识别的RVD。图中显示了AvrBs3的第一个重复序列(青色),指示了每个氨基酸在重复序列中的位置。结晶中使用的寡核苷酸和不同二肽的序列如下所示。(b条)蛋白质的卡通表示–垂直于DNA目标(上面板)和沿着DNA螺旋(下面板)的DNA结构。AvrBs3的螺旋显示为圆柱体,重复序列-1、0、1、2和3分别为红色、石灰色、青色、绿色和米色,以指示初始DNA结构域构建块。双链寡核苷酸以棒状模式表示,每条核苷酸的序列用相应的二肽表示。二肽用单字母氨基酸代码表示。(c(c))AvrBs3蛋白与其DNA靶标复合体的静电表面表征。上面的面板描绘了超级螺旋排列上从氨基末端到羧基末端的电正性条带(蓝色)。下面板中描绘了沿着对面蛋白质的电负性条带(红色)。感测链为洋红色,反义链为绿色。

2.3. 荧光各向异性

TALE蛋白和DNA之间的离解常数由蛋白质添加后荧光偏振的变化估算,使用寡核苷酸在其5′端标记为6-FAM的。通过测量连续稀释的6-FAM-DNA样品(Molina等。, 2012【Molina,R.,Redondo,P.,Stella,S.,Marenchino,M.,D'Abramo,M..,Gervasio,F.L.,Epinat,J.C.,Valton,J.,Grizot,S.、Duchateau,P.、Prieto,J.和Montoya,G.(2012)。核酸研究40,6936-6945。】). 6-FAM标记的DNA的浓度在20到40 n之间M(M)TALE蛋白增加到1000 nM(M)蛋白质和DNA都在由25米组成的缓冲液中透析M(M)HEPES pH值8150 mM(M)氯化钠,0.2米M(M)TCEP。在298 K下孵育10分钟后,用Wallac 1420 VICTOR2多标记计数器(PerkinElmer)在黑色96 well分析板中测量荧光偏振。数据拟合和K(K)按照Molina中的描述进行计算等。(2012【Molina,R.,Redondo,P.,Stella,S.,Marenchino,M.,D'Abramo,M..,Gervasio,F.L.,Epinat,J.C.,Valton,J.,Grizot,S.、Duchateau,P.、Prieto,J.和Montoya,G.(2012)。核酸研究40,6936-6945。】). 对于竞争性结合分析,24 bp非特异性DNA双链(5′-TCAGACTTCCACAGAGTCAGA-3′)的浓度为100µM(M).

2.4. 等温滴定法热量测定法化验

等温滴定法热量测定法(ITC)实验在298 K下使用MicroCal ITC200仪器(英国MicroCal GE Healthcare)进行。缓冲区由25 m组成M(M)HEPES pH值8150 mM(M)氯化钠,0.2米M(M)TCEP。为了确保最小的缓冲区错配,蛋白质和DNA样本在同一缓冲区中进行透析。配体注射器含有浓度范围为0.06–0.2 m的DNA双工体M(M)恒温细胞含有浓度范围为0.006–0.02 m的TALE蛋白M(M)使用强结合配体A(靶DNA)作为注射剂,在含有第二竞争配体B(竞争DNA)和TALE(T)的细胞中进行竞争性结合研究。然后,该系统有两个平衡点,每次注入时都会发生位移:

[\eqalign{&{\rm A}+{\rm T}{\buildrel{\Delta H_{\rm A}}\over{\longleft-rightarrow}}{\rm AT},\quad K_{\rm A}=[{\rm AT}]/[{\rm A}][{\rm T}],\cr&{\rm B}+{\rm T}{\buildrel[{\rm T}].}]

的值K(K)B类ΔH(H)B类对于竞争配体,首先在传统的ITC实验中测量,在确定K(K)A类从竞争实验的结果来看。对于竞争实验,竞争对手的总浓度[B]总数使用公式计算

[`K_{rm A}{\hbox{'}}/K_{\rm B}[{\rmB}]_{\rma tot}\simeq 10^{5}{\hbox{$-$}}10^{8}\,\,M,]

其中`K(K)A类'是在最佳浓度范围(10)内获得的目标DNA的TALE的估计关联常数5–108M(M)−1)用于ITC的测量。恒温池含有浓度范围为0.006–0.01 m的TALE蛋白M(M)和竞争对手DNA的浓度为0.005 mM(M)配体注射器中含有浓度范围为0.06–0.1 m的DNA双链体M(M)实验包括向恒温细胞中的200µl蛋白质溶液中连续注射4µl DNA,初始延迟为60 s,注射持续时间为4 s,注射间隔为180s.使用单位点和竞争性结合模型非线性最小二乘分析拟合校正的结合等温线原产地7.0软件(MicroCal)获得平衡结合常数的值(K(K)A类),化学计量(n个)和更改(ΔH(H))和T型ΔS公司与DNA结合有关。这个K(K)是计算值的倒数K(K)A类使用误差传播计算器估计相关误差(https://laffers.net/tools/error-propagation-calculator网站/).

2.5. TALE核酸酶(TALEN)表达克隆的配对及酵母筛选

表达待测TALEN的酵母菌株与含有报告质粒的菌株进行配对,报告质粒包含所选靶点,其两侧是重叠截短的lacZ公司基因(LAC和ACZ)。靶细胞分裂后,串联-重复重组恢复功能性lacZ公司可以使用标准方法监测的基因。使用高网格密度(约20点厘米)在覆盖YPD板的尼龙过滤器上对人才进行网格化−2). 在相同的过滤器上进行第二次网格化处理,以确定第二层,该层由每个目标的报告人宿主酵母菌株组成。将膜放置在富含YPD的固体琼脂培养基上,并在303 K下培养过夜以进行交配。接下来,将过滤器转移到以半乳糖(2%)为碳源的缺乏亮氨酸和色氨酸的合成培养基中,并在310K下孵育5天,以选择携带表达载体和靶载体的二倍体。5天后,将过滤器置于0.02%的固体琼脂糖培养基上(w个/v(v))0.5中的X-GalM(M)磷酸钠缓冲液pH 7.0,0.1%(w个/v(v))SDS,6%二甲基甲酰胺(DMF),7 mM(M) β-巯基乙醇,1%(w个/v(v))琼脂糖并在310K下孵育以监测β-半乳糖苷酶活性。通过扫描分析结果并进行量化。β-半乳糖苷酶活性与同源重组的效率直接相关。使用酵母中具有不同重组活性的几个纯化I-CreI突变体的实验表明,酵母中量化的重组效率(Afilter值)与裂解活性相关在体外(阿诺德等。, 2007【Arnould,S.、Perez,C.、Cabaniols,J.-P.、Smith,J.、Gouble,A.、Grizot,S.,Epinat,J.-C.、Duclert,A.、Duchateau,P.&Páques,F.(2007)。《分子生物学杂志》371、49-65。】; 格里佐等。, 2009【Grizot,S.,Smith,J.,Prieto,J.、Daboussi,F.、Redondo,P.、Merino,N.、Villate,M.、Thomas,S.、Lemaire,L.、Montoya,G.、Blanco,F.J.、Páques,F.和Duchateau,P.(2009)。核酸研究37,5405-5419。】).

3.结果和讨论

3.1. AvrBs3–DNA复合物的总体结构

蛋白质-DNA复合物的结构通过结合Ta来解决6英国12SAD数据集和分子置换解决方案(表1[链接]). 模型被细化到2.55º分辨率。结晶蛋白包括AvrBs3的152–895残基(附图S1)和一个21-base双链寡核苷酸,该双链寡核苷酸的5′端有一个T悬垂(图1[链接]和1[链接]b条)显示了一个相对未受干扰的B型DNA,其主沟整体较宽(补充图S2)。由于蛋白质的灵活性,30个氨基末端和羧基末端残基的电子密度是模糊的。然而,在残基830中,从第一次重复到重复17的中间,电子密度的质量很好;在N末端区域,电子密度被定义为可以从残基230开始观察到侧链。17.5 AvrBs3重复序列的超螺旋排列紧密地结合了主曲线核苷酸DNA分子(图1[链接]b条和2[链接]). DNA结合的AvrBs3结构中的所有重复形成高度相似的两个螺旋束(图1[链接]b条). 螺旋跨越重复中的位置3-11和14-33,定位RVD(位置12和13;见图1[链接])在连接它们的循环中。第27位的脯氨酸在第二螺旋中产生一个扭结,似乎对串联重复序列与DNA双螺旋的顺序排列和关联至关重要。该蛋白质显示出单个重复序列内部和之间的连续螺旋的左手堆积。

[图2]
图2
对A的认可1和T0AvrBs3的头寸。()与靶序列中第一个腺嘌呤相关的最初HD二肽。Asp301与碱的氨基形成氢键。(b条)T的相互作用0AvrBs3的N末端区域。核苷酸的磷酸盐通过氢键与Thr270、Gln305和Gly268相互作用。(c(c))T的详细视图0通过非极性范德华相互作用与Arg236和Arg266相互作用。所有图中的地图都是2F类o(o)F类c(c) σA类-加权贴图的等高线为1.0σ()PthXo1的叠加(紫色;PDB条目3美元; 马克等。, 2012[Mak,A.N.,Bradley,P.,Cernadas,R.A.,Bogdanove,A.J.&Stoddard,B.L.(2012),《科学》,第335、716-719页。]),dHax3(黄色;PDB条目3v6吨; 等。, 2012[Deng,D.,Yan,C.,Pan,X.,Mahfouz,M.,Wang,J.,Zhu,J.-K.,Shi,Y.&Yan,N.(2012).科学,335720-723.])和AvrBs3(橙色)蛋白质结构。为了清楚起见,省略了DNA部分。可以观察到N末端区域(包括0和−1重复)中三个TALE结构之间的差异(参见结果和讨论[链接]和补充图S5)。

3.2. 蛋白质-DNA相互作用

有趣的是,一条电正带沿着超级螺旋AvrBs3排列的一侧运行(邓等。, 2012[Deng,D.,Yan,C.,Pan,X.,Mahfouz,M.,Wang,J.,Zhu,J.-K.,Shi,Y.&Yan,N.(2012).科学,335720-723.])在另一侧观察到一条电负性条带(图1[链接]c(c)). 这个阳性极性带是由每个重复序列中16位的赖氨酸构建的,涉及到与DNA感觉链磷酸骨干的非特异性相互作用,而阴性带主要由重复序列中4位的谷氨酸盐和13位的一些天冬氨酸盐协同构建,位于反义DNA链附近(图1[链接]c(c)). 这些极性带沿着蛋白质的排列表明了一种可能的机制,有助于识别核苷酸RVD的感测链,同时避免来自核苷酸在另一股中。事实上,反义链没有显示与蛋白质的接触(补充图S3)。

TALE AvrBs3与DNA的序列特异性接触仅由每个RVD中位置13处的残基与感测链上相应的碱基相互作用而形成(补充图S4)。相反,每个RVD位置12处的残基侧链在每个重复的位置8处与主链羰基O原子接触,限制了含有RVD的环。此外,单个重复序列核心内的位置完全由小的脂肪族残基占据,而重复序列之间界面上的几个位置对应于极性残基对。

3.3. 二肽–DNA相互作用

AvrBs3–DNA结构显示七个HD RVD。第一重复序列中的对含有与腺嘌呤相关的独特HD(图2[链接]). 其他HD二肽沿着靶序列与胞嘧啶相互作用。其余的腺嘌呤与NI二肽相关,四种胸腺嘧啶与NG二肽相互作用(图1[链接]). 每个重复的观察接触(补充图S3和S4)揭示了其不同特异性和保真度的分子基础,如前所述通过计算和遗传分析(Moscou&Bogdanove,2009【Moscou,M.J.和Bogdanove,A.J.(2009),《科学》,3261501。】; 斯特鲁贝尔等。, 2012[Streubel,J.,Blücher,C.,Landgraf,A.和Boch,J.(2012)。《自然生物技术》,第30期,593-595页。]). HD RVD接触A1显示第一个RVD中Asp301侧链和NH之间的氢键(3.01Ω)2底座的组。这种相互作用与HD识别胞嘧啶时的作用相同。相比之下,初始RVD中的His300不与DNA相互作用,其侧链与后续重复序列的主链骨架接触,从而稳定了第一重复序列和第二重复序列之间的界面(图2[链接]).

其余的HD RVD显示与NH相关的天冬氨酸残基2一组胞嘧啶通过长度从2.95到3.5μ的氢键沿着感觉DNA链排列。胞嘧啶和酸性侧链之间的接触排除了选择性碱识别通过空间和静电碰撞(Rohs等。, 2010【Rohs,R.,Jin,X.,West,S.M.,Joshi,R..,Honig,B.&Mann,R.S.(2010),《生物化学年鉴》79,233-269。】). NI二肽与其他腺嘌呤具有不寻常的相互作用模式。异亮氨酸残基的脂肪族侧链与嘌呤环进行非极性范德华相互作用,天冬酰胺残基的作用类似于HD二肽中组氨酸的作用,稳定了重复间的相互作用。事实上,它们中的五个被分为两个区域,包含三个和两个连续的腺嘌呤,这使这两个类似的相互作用区域沿着DNA靶延伸。最后,NG重复序列通过甘氨酸主链与碱的甲基的非极性范德华相互作用与胸腺嘧啶结合。这种相互作用在T中几乎没有观察到18由于最后一次重复的混乱。

TALE重复序列似乎被组织成两个与感觉支架相互作用的区域,而反义链没有显示任何蛋白质接触。第一个区域参与间接读出,由重复序列16和17位的赖氨酸和谷氨酰胺组成,并与感觉链DNA主干相互作用(图1[链接]). 这种排列在PthXo1和dHax3中都是保守的。第二个区域涉及RVD,RVD直接与基地相互作用。在不同结构中具有结构特征的RVD中,NN和HD与目标物形成氢键核苷酸,而NI和NG通过范德瓦尔斯相互作用与目标碱基关联。因此,不同相互作用中涉及的能量在不同RVD(斯特鲁贝尔等。, 2012[Streubel,J.,Blücher,C.,Landgraf,A.和Boch,J.(2012)。《自然生物技术》,第30期,593-595页。]). 然而,即使HD二肽与胞嘧啶有优先的相互作用,是能量选择性RVD之一,也可以通过氢键将腺嘌呤调节到NH2组(图2[链接])这表明,即使在能量选择性更强的RVD中,二肽也存在一定的杂乱性。虽然存在RVD核苷酸偏好,但二肽与碱基的相互作用并不能建立严格的二进制代码,因为同一个二肽可以与不同的碱基相互作用,从而促进蛋白质DNA识别的某种程度的退化。因此,不同二肽在结合过程中的能量贡献似乎对产生选择性TALE至关重要,这表明TALE的特异性将取决于间接读出所涉及区域之间的能量平衡(图1[链接]c(c))以及RVD的贡献。

3.4。T型钢0识别

在该支架中构建新的识别序列可能受到限制,这是因为在5′端目标DNA的零位置存在T。该碱基与蛋白质的N末端相互作用,似乎对TALE–DNA相互作用至关重要(Boch等。, 2009【Boch,J.、Scholze,H.、Schornack,S.、Landgraf,A.、Hahn,S.和Kay,S.,Lahaye,T.、Nickstadt,A.和Bonas,U.(2009),《科学》,第326期,第1509-1512页。】; Bogdanove&Voytas,2011年【Bogdanove,A.J.和Voytas,D.F.(2011),《科学》,3331843-1846。】). 虽然晶体结构TALE dHax3 DNA结合域缺乏N末端结构域(Deng等。, 2012[Deng,D.,Yan,C.,Pan,X.,Mahfouz,M.,Wang,J.,Zhu,J.-K.,Shi,Y.&Yan,N.(2012).科学,335720-723.]),PthXo1–DNA复合物的结构表明保守的Trp232参与了T的识别机制05′端(Mak等。, 2012[Mak,A.N.,Bradley,P.,Cernadas,R.A.,Bogdanove,A.J.&Stoddard,B.L.(2012),《科学》,第335、716-719页。]). 然而,该残留物并不显示与基底的直接相互作用。AvrBs3的N末端区域表明,两个简并重复序列似乎与RVD指定序列之前的保守胸腺嘧啶相互作用(图2[链接]b条). 我们将这些称为0和-1重复(图1[链接]b条,补充图S1)分别由225–254和255–288残基组成。它们在13位含有精氨酸残基(分别为Arg266和Arg236),与DNA相互作用(图2[链接]c(c)). 这些残基的侧链在邻近T附近收敛−1和T0碱,通过范德瓦尔斯相互作用接触这些碱的甲基。此外,Thr270、Gln305和Gly267的侧链与围绕T的磷酸盐的氢键网络有关0与PthXo1相反,AvrBs3中的Trp232位于远离DNA的四个位置。PthXo1和AvrBs3之间的差异源于这些残基之前的蛋白质段中的不同构象,AvrBs结构中的构象更细长,取代了Trp232远离DNA(图2[链接]和补充图S5)。

这些差异可能源于TALE重复序列的内在灵活性,这些重复序列似乎显示出巨大的构象变化(Murakami等。, 2010[村上春树,M.T.,斯福萨,M.L.,内维斯,J.L.,佩瓦,J.H.,多明格斯,M.N.,佩雷拉,a.L.,泽里,a.C.&贝内德蒂,C.E.(2010).蛋白质,78,3386-3395.]). SAXS(村上春树等。, 2010[村上春树,M.T.,斯福萨,M.L.,内维斯,J.L.,佩瓦,J.H.,多明格斯,M.N.,佩雷拉,a.L.,泽里,a.C.&贝内德蒂,C.E.(2010).蛋白质,78,3386-3395.]). 此外晶体结构没有目标DNA的dHax3(Deng等。, 2012[Deng,D.,Yan,C.,Pan,X.,Mahfouz,M.,Wang,J.,Zhu,J.-K.,Shi,Y.&Yan,N.(2012).科学,335720-723.])显示了一个拉长的形状,表明蛋白质构象被调整到目标DNA,并在核酸结合后稳定。TALE的这种灵活行为可以促进DNA结合。另一方面,结晶蛋白缺少一段N末端序列的事实可能有利于这些构象的改变。

3.5. TALE–DNA结合和热力学

为了表征AvrBs3与其靶DNA相互作用的热力学参数,我们通过荧光各向异性(FA)和等温滴定法定量分析了它们之间的关联热量测定法(ITC)(图3[链接]).寡核苷酸初步测试了含有不同长度的靶序列(补充图S6和S7),并选择21 bp探针作为TALE AvrBs3特异性识别的最小结合长度(图3[链接]). 这个K(K)与FA实验相比,ITC测得的值显示出较高的值,约为2-4倍。这种差异与实验变化一致,可能由每种方法测量的物理性质引起,这需要不同的浓度范围。然而,尽管存在这些差异,这两种技术在同一组实验中显示出相同的趋势。为了检测TALE AvrBs3区分靶DNA和其他DNA序列的能力,我们在24 bp非特异性DNA的存在下进行了FA和ITC实验(见补充材料)。

[图3]
图3
TALE AvrBS3与野生型Bs3和Bs3A结合的热力学0,C0和G0靶DNA。()荧光各向异性和ITC结合分析中使用的Bs3 DNA的DNA序列(另请参见补充图S6和S7)。(b条e(电子))描述了竞争对手DNA缺失(实心圆圈)和存在(开放圆圈)时的DNA结合谱。蛋白质浓度[蛋白质]以n为单位M(M)ITC分析显示,当反应中存在竞争对手DNA时,使用单位点结合模型(实心圈)和竞争结合模型(开放圈)对数据进行非线性回归曲线拟合。((f))报道了结合的热力学参数。获得的值是四个独立实验的平均值。这个K(K)A类AvrBs3关联的显示用于比较。星号表示n个,K(K)A类ΔH(H)使用竞争性结合拟合模型获得(见补充材料)。1卡=4.186焦耳。

TALE AvrBs3与Bs3双链寡核苷酸结合,解离常数为33 nM(M)通过FA(图3[链接]b条). 当在竞争DNA存在的情况下测量亲和力时,TALE–DNA的结合不受影响(K(K)d、 传真=36.5牛顿M(M); 图3[链接]). ITC结合测量显示出相同的行为(图3[链接]c(c)和3[链接]e(电子)). 此外,ITC揭示了蛋白质与DNA的结合是放热的(ΔH(H)=−31.6千卡摩尔−1)化学计量比接近于1。在存在竞争对手DNA的情况下测量反应(参见材料和方法[链接]和图3[链接]和3[链接]e(电子))仅显示热力学参数的微小变化,表明TALE AvrBs3能够在自发反应中以高度特异性结合其DNA靶点(图3[链接](f)).

3.6. 0位核苷酸的功能相关性

TALE蛋白与启动子区域结合,增强和调节植物基因的转录(Boch&Bonas,2010【Boch,J.&Bonas,U.(2010),《植物疗法年度评论》,第48期,第419-436页。】). 例如,PthXo1结合位点位于TATA盒的下游,而AvrBs3靶点位置0处的T似乎是TATA盒中的一部分。初始T0据报道,靶序列中的位置是TALE功能的重要核苷酸(Boch等。, 2009【Boch,J.、Scholze,H.、Schornack,S.、Landgraf,A.、Hahn,S.和Kay,S.,Lahaye,T.、Nickstadt,A.和Bonas,U.(2009),《科学》,第326期,第1509-1512页。】; 罗默等。, 2010[Römer,P.、Recht,S.、Strauss,T.、Elsaeser,J.、Schornack,S.、Boch,J.、Wang,S.和Lahaye,T.(2010)。新植物。1871048-1057。])以及蛋白质与靶蛋白的结合(Mahfouz等。, 2011【Mahfouz,M.M.、Li,L.、Shamimuzzaman,M.、Wibowo,A.、Fang,X.和Zhu,J.-K.(2011)。美国国家科学院院刊,108,2623-2628。】). 该核苷酸的识别涉及保守度较低的重复序列-1和0。然而,我们没有观察到这些重复序列与T碱基的直接相互作用0在AvrBs3–DNA结构中。在PthXo1–DNA结构中检测到类似情况,其中T0不显示与蛋白质的直接相互作用(Mak等。, 2012[Mak,A.N.,Bradley,P.,Cernadas,R.A.,Bogdanove,A.J.&Stoddard,B.L.(2012),《科学》,第335、716-719页。]). 相反,在AvrBs3中,我们观察到一种新的构象,它允许N末端结构域与T相互作用0(图2[链接]b条和2[链接]c(c)).

为了解决AvrBs3对其靶DNA 0位核苷酸的偏好,我们使用Bs3A评估了其结合和热力学参数0,G0和C0 寡核苷酸其中T0被相应的底座取代(图3[链接]b条, 3[链接]c(c)和3[链接](f)). TALE AvrBs3结合Bs3A0和C0具有类似的K(K)到原始T0竞争DNA的存在几乎没有改变亲和力(图3[链接], 3[链接]e(电子)和3(f)[链接]). 只有G0增长了四倍;然而,这种结合仍然显示出合理的亲和力,几乎不受竞争DNA的干扰。ITC数据支持FA结合测量,尽管在ΔH(H)反应的结果。因此,当T0由C替换0当在位置0处发现诸如a之类的体积较大的基底时K(K)使用这两种方法,反应速率略高(图3[链接]b条, 3[链接]c(c)和3[链接](f))和ΔH(H)反应的负性较小,表明即使结合反应的效率较低,但较大的碱的存在并不妨碍结合。只有G的存在0显示亲和力下降,即使在存在竞争对手DNA的情况下也不会妨碍目标识别(图3[链接]b条–3[链接](f)). 因此,在体外AvrBs3可以绑定其目标序列,包括C0,G0和A0具有与野生型DNA靶点相似亲和力的突变。位于0位置的庞大基地似乎并不妨碍与AvrBs3目标的绑定在体外这与该区域的蛋白质-DNA相互作用相一致,该区域仅涉及DNA主干。

要分析此效果体内,我们使用单链退火分析(SSA)来评估靶序列零位的变化是否会影响融合到FokI核酸酶域的AvrBs3的结合,从而干扰其活性(参见材料和方法[链接]; 阿诺德等。, 2007【Arnould,S.、Perez,C.、Cabaniols,J.-P.、Smith,J.、Gouble,A.、Grizot,S.,Epinat,J.-C.、Duclert,A.、Duchateau,P.&Páques,F.(2007)。《分子生物学杂志》371、49-65。】; 塞尔马克等。, 2011【Cermak,T.、Doyle,E.L.、Christian,M.、Wang,L.、Zhang,Y.、Schmidt,C.、Baller,J.A.、Somia,N.V.、Bogdanove,A.J.和Voytas,D.F.(2011)。核酸研究39,e82。】; 格里佐等。, 2009【Grizot,S.,Smith,J.,Prieto,J.、Daboussi,F.、Redondo,P.、Merino,N.、Villate,M.、Thomas,S.、Lemaire,L.、Montoya,G.、Blanco,F.J.、Páques,F.和Duchateau,P.(2009)。核酸研究37,5405-5419。】; 图4[链接]). 含有T的同二聚体Bs3靶序列0,A0,C0或G0将其插入一个上位质粒中,以评估AvrBs3对0位核苷酸的偏好。该试验表明,AvrBs3–FokI(TALEN)能够独立于0位的核苷酸靶向其位点。尽管T0-包含目标显示更高的活动(图4[链接]b条),我们的结果表明T0替代在TALE结合中似乎没有表现出很大的影响,只有G0基地最庞大的目标显示活动显著减少,与在体外绑定测量,表明此方法可用于估计体内应用。对激活内源性人类NTF3基因的工程化TALE的功能分析也表明,含有重复序列-1和0的构建物可以靶向缺乏T的DNA序列0 体内(米勒等。, 2011[Miller,J.C.等人(2011),《自然生物技术》,第29143-148页。]). 因此,我们的在体外数据表明T0可能在TALE AvrBs3的DNA结合中不起重要作用,从而增加了该支架可能靶向的DNA序列数量。T在天然TALE靶标中0位的流行可能归因于启动子区内富含at的序列,而不是该位置核苷酸的选择性识别。

[图4]
图4
()酵母筛选分析原理。携带编码TALEN的表达载体的菌株与携带报告质粒的菌株交配。报告质粒带有lacZ公司报告基因被包含TALEN靶位点的插入物中断,该靶位点两侧有两个直接重复序列。交配后,TALEN在感兴趣的位置产生双链断裂,允许功能恢复lacZ公司通过SSA基因表达,并在X-Gal存在下生成蓝色。颜色被量化并记为Afilter值,这是一个与TALEN核酸酶活性相关的参数。(b条)AvrBs3 TALEN对Bs3同二聚体靶点的核酸酶活性,该靶点在位置0处包含T、A、C或G。显示了用四个不同的Bs3同二聚体靶点获得的滤波值。虚线表示实验背景水平。获得的值是三个独立实验的平均值。

4.结束语

重新设计的识别新DNA靶标的TALE的组装已经证实了这些DNA结合结构域的模块化,以设计新的特异性。这一特性使该支架成为一个很好的候选材料,用于定制与其他催化结构域(如核酸酶、甲基化酶和乙酰化酶)融合的器件等。,能否穿梭到特定的基因组位点,以确定控制基因表达、基因组修改或基因修复的活性(普列托等。, 2012【Prieto,J.、Molina,R.和Montoya,G.(2012),《生物化学与分子生物学评论》47,207-221。】). 然而,尚不清楚结合机制是否依赖于给定DNA目标长度内的最小完美匹配数,或者是否涉及RVD和核苷酸(博赫等。, 2009【Boch,J.、Scholze,H.、Schornack,S.、Landgraf,A.、Hahn,S.和Kay,S.,Lahaye,T.、Nickstadt,A.和Bonas,U.(2009),《科学》,第326期,第1509-1512页。】; 斯特鲁贝尔等。, 2012[Streubel,J.,Blücher,C.,Landgraf,A.和Boch,J.(2012)。《自然生物技术》,第30期,593-595页。]). 在这种情况下,活性分析支持了T0目标识别中(Boch等。, 2009【Boch,J.、Scholze,H.、Schornack,S.、Landgraf,A.、Hahn,S.和Kay,S.,Lahaye,T.、Nickstadt,A.和Bonas,U.(2009),《科学》,第326期,第1509-1512页。】). 只有嘌呤的存在会影响靶结合。鸟嘌呤是最笨重的碱,这种作用在鸟嘌呤》中得到了强调。因此,其他核苷酸可以容纳在这个位置,从而增加可能在此支架中设计的目标序列的数量。

支持信息


脚注

1补充材料已保存在IUCr电子档案中(参考:YT5053年). 期刊后面介绍了访问这些材料的服务。

致谢

我们感谢瑞士光源和欧洲同步辐射设施光束线工作人员的支持。我们感谢巴勃罗·梅萨、丹尼尔·利塔和圣地亚哥·拉蒙的讨论和有益评论。这项工作得到了经济竞争力部(JCI-­2011-09308至RM,BFU2011-23815/BMC至GM)、拉蒙地区基金会和马德里自治委员会(CAM-S2010/BMD-2305至GM)的支持。SS由欧盟玛丽·居里“SMARTBREAKER”(2010-276953)拨款和教育部(SB2010-0105)拨款支持。

参考文献

第一次引用P.D.亚当斯。等。(2010).《水晶学报》。D类66, 213–221. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Arnould,S.、Perez,C.、Cabaniols,J.-P、Smith,J.、Gouble,A.、Grizot,S.、Epinat,J.-C、Duclert,A.、Duchateau,P.&Pâques,F.(2007年)。分子生物学杂志。 371, 49–65. 科学网 交叉参考 公共医学 中国科学院 谷歌学者
第一次引用Boch,J.&Bonas,U.(2010年)。每年。植物疗法评论。 48, 419–436. 科学网 交叉参考 公共医学 中国科学院 谷歌学者
第一次引用Boch,J.、Scholze,H.、Schornack,S.、Landgraf,A.、Hahn,S.和Kay,S.,Lahaye,T.、Nickstadt,A.和Bonas,U.(2009年)。科学,326, 1509–1512. 科学网 交叉参考 公共医学 中国科学院 谷歌学者
第一次引用Bogdanove,A.J.,Schornack,S.&Lahaye,T.(2010年)。货币。操作。植物生物学。 13, 394–401. 科学网 交叉参考 中国科学院 公共医学 谷歌学者
第一次引用Bogdanove,A.J.和Voytas,D.F.(2011年)。科学,333, 1843–1846. 科学网 交叉参考 中国科学院 公共医学 谷歌学者
第一次引用Cermak,T.、Doyle,E.L.、Christian,M.、Wang,L.、Zhang,Y.、Schmidt,C.、Baller,J.A.、Somia,N.V.、Bogdanove,A.J.和Voytas,D.F.(2011年)。核酸研究。 39,e82科学网 交叉参考 公共医学 谷歌学者
第一次引用Cong,L.、Zhou,R.、Kuo,Y.-C.、Cunniff,M.和Zhang,F.(2012)。自然社区。 , 968. 科学网 交叉参考 谷歌学者
第一次引用Deng,D.,Yan,C.,Pan,X.,Mahfouz,M.,Wang,J.,Zhu,J.-K.,Shi,Y.和Yan,N.(2012)。科学,335, 720–723. 科学网 交叉参考 中国科学院 公共医学 谷歌学者
第一次引用Emsley,P.、Lohkamp,B.、Scott,W.G.和Cowtan,K.(2010年)。《水晶学报》。D类66, 486–501. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Grizot,S.,Smith,J.,Prieto,J.、Daboussi,F.、Redondo,P.、Merino,N.、Villate,M.、Thomas,S.、Lemaire,L.、Montoya,G.、Blanco,F.J.、Páques,F.和Duchateau,P.(2009年)。核酸研究。 37, 5405–5419. 科学网 交叉参考 公共医学 中国科学院 谷歌学者
第一次引用Kabsch,W.(2010年)。《水晶学报》。D类66, 125–132. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Mahfouz,M.M.、Li,L.、Shamimuzzaman,M.、Wibowo,A.、Fang,X.和Zhu,J.-K.(2011)。程序。美国国家科学院。科学。美国,108, 2623–2628. 科学网 交叉参考 中国科学院 公共医学 谷歌学者
第一次引用Mak,A.N.、Bradley,P.、Cernadas,R.A.、Bogdanove,A.J.和Stoddard,B.L.(2012)。科学,335, 716–719. 科学网 交叉参考 中国科学院 公共医学 谷歌学者
第一次引用McCoy,A.J.、Grosse-Kunstleve,R.W.、Adams,P.D.、Winn,M.D.、Storoni,L.C.和Read,R.J.(2007年)。J.应用。克里斯特。 40, 658–674. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用J.C.米勒。等。(2011年)。自然生物技术。 29,143-148科学网 交叉参考 中国科学院 谷歌学者
第一次引用Molina,R.、Redondo,P.、Stella,S.、Marenchino,M.、D'Abramo,M.,Gervasio,F.L.、Epinat,J.C.、Valton,J.、Grizot,S.,Duchateau,P.,Prieto,J.和Montoya,G.(2012年)。核酸研究。 40, 6936–6945. 科学网 交叉参考 中国科学院 公共医学 谷歌学者
第一次引用Morbitzer,R.、Römer,P.、Boch,J.和Lahaye,T.(2010年)。程序。美国国家科学院。科学。美国,107, 21617–21622. 科学网 交叉参考 中国科学院 公共医学 谷歌学者
第一次引用Moscou,M.J.和Bogdanove,A.J.(2009年)。科学,326, 1501. 科学网 交叉参考 公共医学 谷歌学者
第一次引用Murakami,M.T.、Sforça,M.L.、Neves,J.L.,Paiva,J.H.、Domingues,M.N.、Pereira,a.L.、Zeri,a.C.和Benedetti,C.E.(2010年)。蛋白质类,78, 3386–3395. 科学网 交叉参考 中国科学院 公共医学 谷歌学者
第一次引用Murshudov,G.N.、Skubák,P.、Lebedev,A.A.、Pannu,N.S.、Steiner,R.A.、Nicholls,R.A、Winn,M.D.、Long,F.&Vagin,A.(2011)。《水晶学报》。D类67, 355–367. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Prieto,J.、Molina,R.和Montoya,G.(2012)。批评。生物化学评论。分子生物学。 47, 207–221. 科学网 交叉参考 中国科学院 公共医学 谷歌学者
第一次引用Rohs,R.、Jin,X.、West,S.M.、Joshi,R.、Honig,B.和Mann,R.S.(2010)。每年。生物化学评论。 79,233–269科学网 交叉参考 中国科学院 公共医学 谷歌学者
第一次引用Römer,P.,Recht,S.,Strauss,T.,Elsaesser,J.,Schornack,S.、Boch,J.、Wang,S.和Lahaye,T.(2010年)。新植物醇。 187, 1048–1057. 科学网 公共医学 谷歌学者
第一次引用Sheldrick,G.M.(2008)。《水晶学报》。A类64, 112–122. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Streubel,J.、Blücher,C.、Landgraf,A.和Boch,J.(2012)。自然生物技术。 30, 593–595. 科学网 交叉参考 中国科学院 谷歌学者

这是一篇根据知识共享署名(CC-BY)许可证,允许在任何媒体上不受限制地使用、分发和复制,前提是引用原始作者和来源。

期刊徽标结构
生物学
国际标准编号:2059-7983