条件等位基因正迅速成为分析基因功能的一种选择方法,特别是对于导致胚胎死亡的突变,或当需要研究基因在特定组织或发育阶段中的作用时。最常用的条件等位基因是这样的等位基因,其中感兴趣基因的一部分被位点特异性重组酶识别位点(SRS)侧翼,其方式使得由同源重组酶的作用诱导的SRS侧翼序列的缺失或反转将导致无效等位基因的产生。结合时空控制重组酶表达和/或活性的能力,该方法能够以细胞类型选择和时间调节的方式诱导零状态。因此,重组酶调节的条件性空等位基因为查询目标基因在特定细胞类型或组织中的功能和/或模型生物体生命中不同时间点的功能提供了强有力的工具(1).
然而,条件等位基因可能很难设计和工程,它们可能需要费力的载体构建以及ES细胞中的多次操作(参考文献中的例子)。2). 涉及用SSR位点将目标基因的整个外显子-内含子区域侧翼,同时试图避免相关转录控制元件被破坏的方法仅适用于外显子–内含子结构紧凑且调控区域定位良好的基因。因此,已经开发出了替代方法,其中只有被认为对基因功能至关重要的外显子两侧有液氧P站点(三)通过将可逆元件插入内含子和目标基因的反义,可以完全避免或缺失,目的是这些元件在其初始方向上保持惰性,但在有条件地反转到义链时使基因失效(4) (SI附录,图S17). 这两种方法都存在局限性,即它们不适用于单外显子基因。此外,尽管后一种方法在理论上更适用于更广泛和更少定制的用途,但在实践中,它受到可靶向内含子的可用性和位置的限制,并且它可能在反转前产生亚形态,在反转后产生不完全零态(4,5). 最后,目前可用的大多数条件方法都没有包含一个报告器,该报告器可以标记条件等位基因被激活的单个细胞,因此很难评估复杂组织中目标基因失活的效率和细胞类型特异性。
为了纠正目前可用的条件无效等位基因方法的固有缺陷,我们试图开发一种独特的等位基因设计,该设计结合了四个特性:
我)简单、模块化和标准化设计,可在单个细菌同源重组(BHR)步骤和ES细胞中的单个靶向事件中进行工程设计。
ii(ii))无论基因的外显子-内含子结构如何,对绝大多数基因都具有普遍适用性,通过允许通过创建人工内含子插入外显子,最大限度地减少了定义目标基因中转录控制元件或功能域的需要。
三)条件缺失等位基因的最佳特性(诱导前沉默,重组酶诱导后缺失)。
四)通过在诱导条件等位基因的同时启动报告基因的表达来标记靶基因已失活的细胞的能力。
我们在这里提出了条件反演(COIN),这是一种结合了这些属性的方法。通过对一组研究充分的基因进行严格的条件性测试,我们确立了COIN条件性空报告基因等位基因作为一种可靠和通用的基因修饰方法,开辟了独特的设计模式。
结果
COIN条件等位基因的结构。
与所有条件等位基因一样,COIN等位基因设计用于修改目标基因,使基因的表达和功能保持正常,直到等位基因被位点特异性重组酶灭活,从而引发物理重排,使基因失活或改变基因产物的功能。COIN设计()由两个链接的元素组成。第一个元素是传统元素FRT公司-侧翼药物选择盒(DSC),在使用COIN之前被Flp重组酶移除。第二个元件是COIN模块,是等位基因的功能部分,它由最初的倒置序列组成,包括编码报告蛋白的末端外显子,例如增强型GFP(eGFP),前面是3′剪接位点(3′SS圆周率)然后是聚腺苷酸化区(pA)。3′SS替代序列的广泛测试圆周率执行pA及其定位以优化COIN模块(SI附录,图S1). 为了使其能被Cre重组酶转化,COIN模块的两侧是液氧66和液氧71个站点以面对面的方式(6).
COIN等位基因的设计。(A类)COIN内含子的详细示意图(版本eGFP,阶段0;新). COIN模块已插入MfeI公司HBB2内含子2的位点(Mf),它由一个3′不锈钢圆周率-eGFP-rßglpA两侧有液氧71和液氧66在镜像配置中启用反转3英寸圆周率-eGFP-rßglpA基因; 3′不锈钢圆周率是HBB2内含子2的3′剪接区(SI附录,图S14). 后反转(PI)表明该3′SS参与捕获COIN模块反转后COIN等位基因的信息。rßglpA主要是HBB2的3′UTR区域(SI附录,图S15).FRTed DSC公司是FRT侧翼药物选择小基因[例如。,P(P)UBC公司-驱动新霉素磷酸转移酶(Npt公司)] (SI附录,图S16); FTR站点显示为灰色箭头。rßgl i2的5′剪接位点(5′SS)和3′剪接部位(3′SS)标记了COIN内含子(蓝线)的边界。限制位点显示在序列线下方。毫升,穆卢伊; P、,PspOMI公司; 十、 圣诞节。所有图元均按比例绘制。(比例尺:200 bp。)(B类)一种假设的基因,由n个通过在外显子1中插入COIN内含子(未按比例绘制的元素),外显子的数量被视为条件无效(C类)将外显子1分裂为左外显子(1L)和右外显子。在BHR、靶向和去除DSC后,产生的exCOIN等位基因编码一个WT转录物,因为COIN模块位于反义链中,因此隐形转录。(D类)COIN模块的反转导致编码包含外显子1L和eGFP的转录物的空等位基因。此外,C介导的COIN模块的反转通过液氧71和液氧66产生一个双突变体lox位点,液氧72(红色箭头),和loxP(黑色箭头)。COIN模块由C类和D类以便于可视化正在反转的区域。
尽管COIN可以被设计成原生内含子(SI附录,图S6),正是它们被引入外显子的能力使得COIN成为适用于大多数基因的通用策略。通过将COIN模块(和DSC)嵌入外源人工内含子,可以插入外显子()(以下简称COIN内含子)。该战略要求(我)COIN内含子被有效剪接,因此COIN等位基因在其原始方向上保持沉默(ii(ii))当COIN模块倒置到感觉方向时,它作为末端外显子工作。我们基于兔β-血红蛋白(HBB2)内含子2构建COIN内含子,因为它已被证明在多个基因的背景下发挥作用(7). 当COIN模块在不同的基因组环境中运行时,为了最大限度地提高高效剪接的机会,我们选择了一个(8,9) (SI附录,图S1)和共同进化的3′SS圆周率–HBB2的pA对(10). 详细说明COIN内含子放置位置的协议可以在中找到材料和方法。
COIN等位基因靶向载体由BHR设计,以将连接的DSC和COIN模块元件插入目标基因内的指定位点(),使得COIN模块的蛋白质编码、剪接和pA序列与目标基因的转录方向相反,从而确保COIN模块不并入目标基因的翻译(). 靶向ES细胞后,我们使用FLPe重组酶(11)切除DSC,导致沉默的COIN等位基因准备诱导(). 我们的经验与其他人报告的观察结果一致(12,13)(即,去除DSC对于避免产生部分缺陷的低形态等位基因至关重要)。
当C介导COIN模块的反转时,其报告编码外显子被引入位置,通过剪接到该模块的3′SS并在该模块的pA处终止转录,从而捕获目标基因的转录物,同时消除目标基因下游外显子的转录(). 此外,反转的COIN被有效地固定到感觉方向,因为Cre介导的反转将液氧66-液氧71配对为液氧72-液氧磷配对,不支持再转换(14); 事实上,在这些研究过程中,我们从未观察到再创新事件。
为了验证COIN方法,我们为26个蛋白编码基因设计了COIN等位基因,这些基因的失活将导致已知或预测的表型,并对其进行评分()使用以下标准:(我)小鼠的正常孟德尔遗传和野生型(WT)表型要么是未转化的纯合子,也就是沉默的COIN等位基因(硬币/硬币)或具有相应无效等位基因的复合杂合子(COIN/空); (ii(ii))与KO小鼠相同的表型和遗传模式(空/空)在小鼠中,反转COIN等位基因为纯合子(货币兑换/货币兑换)或具有相应空等位基因的复合杂合子(COIN-INV/空); (三)与未修饰基因相比,COIN等位基因的正常靶基因表达;和(四)COIN模块报告器对COIN的反转表达式。值得注意的是,在ES细胞中研究了一些COIN等位基因的表型。根据这些标准,几乎所有COIN等位基因在转化前均为完全WT,在转化后均为完全零(); 我们的广泛测试揭示了COIN设计规则,以帮助防止罕见的故障(即,防止反转前WT功能的扰动,并确保完全为空,而不是反转后的次态)。以下章节描述了COIN等位基因示例,这些示例显示了设计的有效性,并说明了可能影响等位基因性能的特征和属性。
表1。
基因 | VG编号。 | COIN模块的放置 | 初始外显子或内含子大小 | 外显子L或内含子L大小 | 外显子R或内含子R大小 | 预转化表型 | 反转后表型 |
Acvr1b公司 | 1601 | 外显子2 | 240 | 125 | 115 | 重量 | 无效的 |
Chrd公司 | 不适用。 | 简介2 | 372 | 206 | 105 | 重量 | HYPO公司 |
细胞生长因子 | 1511 | 外显子2 | 223 | 120 | 103 | 重量 | 无效的 |
骰子1 | 1399 | 内含子6 | 4,162 | 3,770 | 446 | 重量 | 无效的 |
Dkk4型 | 4003 | 内含子1 | 953 | 730 | 223 | 重量 | 未注明日期。 |
Dll4型 | 1407, 1513 | 内含子3 | 808 | 631 | 144 | 重量 | 无效的 |
外显子3 | 1788 | 内含子3 | 649 | 235 | 327 | 重量 | 无效的 |
外显子10 | 1790 | 内含子2 | 1,328 | 412 | 1,018 | 重量 | 无效的 |
Gdf11型 | 1422 | 外显子1 | 472 | 297 | 175 | 重量 | 无效的 |
Gpr124型 | 1402 | 外显子1 | 371 | 133 | 238 | 重量 | 无效的 |
Gt(ROSA)26Sor公司 | 2154, 2234 | 内含子1 | 5,632 | 1,036 | 4,595 | 重量(Tg) | 空(Tg) |
Hprt1(小时) | 1272 | 外显子3 | 184 | 85 | 99 | 重量 | 无效的 |
Il2rg公司 | 1253 | 外显子1 | 201 | 89 | 112 | 重量 | 无效的 |
Il2rg公司 | 1452 | 外显子1 | 201 | 89 | 112 | 无效的* | 未注明日期。 |
百万分之一 | 1427 | 外显子1 | 478 | 185 | 293 | 无效的† | 未注明日期。 |
第1页 | 1618 | 外显子2 | 177 | 97 | 80 | 重量 | 无效的 |
Ret公司 | 1541 | 外显子2 | 264 | 121 | 143 | 重量 | 无效的 |
德罗莎 | 1390 | 内含子3 | 6,536 | 5548个 | 925 | 重量 | 次谐波 |
德罗莎 | 1483 | 外显子4 | 834 | 625 | 209 | 重量 | 无效的 |
Scn9a公司 | 1589 | 外显子2 | 308 | 105 | 203 | 重量 | 未注明日期。 |
Sirt1(信号1) | 不适用。 | 外显子3 | 242 | 141 | 101 | 重量 | 未注明日期。 |
索斯特 | 1445 | 内含子2 | 2,492 | 938 | 1,504 | 重量 | 无效的 |
Sox2系统 | 1413 | 外显子1 | 2,457 | 441 | 2,016 | 重量 | 无效的 |
Sox10型 | 不适用。 | 内含子3 | 2,493 | 94 | 2,358 | 重量 | DN(公称直径) |
德 | 1379 | 外显子1 | 393 | 354 | 40 | 重量 | 无效的 |
Tgfbr1型 | 1602 | 外显子2 | 246 | 90 | 156 | 重量 | 无效的 |
第1级 | 1260 | 外显子1 | 424 | 380 | 34 | 重量 | 无效的 |
素食R1 | 1308 | 外显子1 | 347 | 291 | 56 | 重量 | 未注明日期。 |
素食主义者R2 | 1345 | 外显子1 | 327 | 272 | 55 | 重量 | 无效的 |
Hprt1(小时)不包括3COIN:细胞零表型的严格测试。
COIN方法最初使用X键次黄嘌呤鸟嘌呤磷酸核糖转移酶1进行测试(Hprt1(小时))基因,因为它在培养的靶向XY ES细胞中提供了快速而严格的功能测试:6-硫鸟嘌呤(6-TG)的毒性取决于Hprt1(小时)(15)只有5%的WT Hprt1蛋白水平足以导致6-TG介导的细胞死亡。这个Hprt1(小时)不包括3COIN通过将COIN内含子插入Hprt1(小时),从而将这个184nt的外显子分为两个新的外显子,3L和3R,分别为85和99nt。选择外显子3而不是外显子1和2,因为它们都太短,无法容纳COIN内含子的插入。正如预期的那样,如果COIN等位基因在转化前和转化后完全无效的功能上与WT相当Hprt1(小时)不包括3COIN/Y(Y)与未经修饰的亲代ES细胞一样,经6-TG处理的ES细胞也会死亡,而转化后的ES细胞会死亡Hprt1(小时)不包括发票/Y(Y)细胞存活().
Hprt1(小时)不包括3COIN在ES细胞中验证COIN方法。(A类)工程Hprt1(小时)不包括3COIN. (我)的示意图Hprt1(小时)不包括3COIN等位基因。的外显子-内含子区域Hprt1(小时)改编自合奏.orgExon 3(ENSMUSE00000491684)与缺失(LOA)探针(TUP,TDP)和引物(TUF,TUR;TDF,TDR)一起突出显示。RT-PCR使用相同的探针和引物进行定量Hprt1(小时)mRNA水平。(ii(ii))COIN内含子位于外显子3的第85个核苷酸之后(SI附录,图S2),将外显子3分裂为外显子3L和3R。(三)在反转之前Hprt1(小时)不包括3COIN当COIN内含子被剪接出来时,等位基因会产生正常的信息。(四)反转后,COIN模块成为修饰基因的末端外显子(Hprt1(小时)不包括发票),取消下游外显子的转录,导致功能性空等位基因。外显子3L和3RHprt1(小时)不包括3COIN等位基因显示为浅灰色方框。蓝线表示COIN内含子序列。L66型,液氧66;L71型,lox71型;1972年,液氧72。液氧和FRT公司网站没有按比例绘制。(比例尺:ii(ii)–四,500个基点)(B类)Hprt1(小时)不包括发票/Y(Y)单元格是Hprt1(小时)-空。在两种情况下培养ES细胞(上部)或存在(下部)将10µM 6-TG固定10 d,然后用Giemsa染色。Hprt1(小时)+/Y(Y)和Hprt1(小时)不包括3COIN/Y(Y)6-TG处理后细胞死亡,而Hprt1(小时)不包括发票/Y(Y)细胞存活。(C类)插入COIN元素不会改变Hprt1(小时)在反转之前,但在反转之后烧蚀它。定量RT-PCR分析Hprt1(小时)和eGFP编码mRNAHprt1(小时)+/Y(Y)(+/Y(Y)),Hprt1(小时)不包括3COIN/年(货币/Y),Hprt1(小时)不包括发票/Y(Y)(投资/年)、和Hprt1(小时)+/是;Gt(ROSA)26Sor公司电子GFP/+(+/是;26兰特电子GFP/+)ES细胞。(左上角)的级别Hprt1(小时)mRNA相对于Hprt1(小时)+/是;Gt(ROSA)26Sor公司电子GFP/+使用探头TUP检测。(右上)的级别Hprt1(小时)mRNA相对于Hprt1(小时)+/是;Gt(ROSA)26Sor公司电子GFP/+使用探头TDP检测。(左下方)的级别Hprt1(小时)mRNA相对于Hprt1(小时)+/是;Gt(ROSA)26Sor公司电子GFP/+使用检测第9外显子的探针检测Hprt1(小时). (右下角)的级别电子GFP-编码mRNA相对于Hprt1(小时)+/是;Gt(ROSA)26Sor公司电子GFP/+使用eGFP探针检测。
定量RT-PCR分析表明,在预转化过程中,人工内含子在外显子3L/3R连接处正确剪接,COIN模块的插入没有改变Hprt1(小时)mRNA水平Hprt1(小时)不包括3COIN/年ES细胞(和SI附录,图S2). 相反,在COIN模块反转后Hprt1(小时)mRNA被完全消融,并被eGFP编码mRNA取代;后者在中不存在Hprt1(小时)+/Y(Y)和Hprt1(小时)不包括3COIN/Y(Y)ES细胞。因此,根据两个不同的标准功能(抗6-TG)和Hprt1(小时)信使核糖核酸表达-Hprt1(小时)ex3COIN公司/Y(Y)ES细胞与WT相同,而它们的反转后对应物,Hprt1(小时)不包括发票/Y(Y)ES细胞表现出与Hprt1(小时)-空ES单元格。
Il2rg公司不包括1号油轮/Y(Y):对小鼠完全空白表型的严格测试。
为了扩展使用Hprt1(小时)COIN等位基因在生物体水平上,我们为编码IL-2和相关细胞因子使用的共同受体γ链的基因创建了一个COIN等等位基因[白细胞介素2受体,γ链(Il2rg公司)]因为与X连锁基因丢失相关的免疫表型已经确立(16–19). 这个Il2rg公司不包括1号油轮通过在起始密码子之后立即将COIN内含子插入外显子1来构建等位基因(启动ATG;和SI附录,图S3).Il2rg公司不包括1号油轮/Y(Y)小鼠的各项免疫参数与WT小鼠相同;相反,后反转的免疫特性Il2rg公司不包括发票/Y(Y)小鼠符合已发表的表型Il2rg公司-空行(SI附录,表S1). 例如,B220+,免疫球蛋白M+逆转录前骨髓和脾淋巴细胞的亚群Il2rg公司不包括1号油轮/Y(Y)小鼠与WT中相应的隔间无法区分Il2rg公司+/Y(Y)小鼠,但在转化后几乎没有这种淋巴细胞Il2rg公司不包括发票/Y(Y)老鼠(和SI附录,图S4). 正如表型所预期的那样Il2rg公司脾脏中的mRNAIl2rg公司不包括1号油轮/Y(Y)老鼠基本上没有受到干扰(),而在Il2rg公司不包括发票/Y(Y)老鼠伊尔2gmRNA被mRNA-表达的eGFP所取代,这可以通过从Il2rg公司不包括发票/Y(Y)老鼠(). 因此,通过COIN模块反转后报告者的表型、mRNA大小和数量以及表达Il2rg公司COIN等位基因按预期发挥作用。因为即使是少数WT细胞也能重建免疫系统Il2rg公司不包括发票/Y(Y)小鼠严格证实,反转的COIN等位基因在所有细胞中赋予一个完全无效的表型。
Il2rg公司不包括发票提供了COIN的体内验证,并显示了报告者的功能。(A类)的示意图Il2rg公司不包括1号油轮等位基因。的外显子-内含子区域Il2rg公司(同种型Il2rg-001型,CCDS30312)显示为改编自合奏.org.COIN内含子位于外显子1的第90个核苷酸之后(SI附录,图S3),将外显子1分裂为外显子1L和1R。在反转之前Il2rg公司不包括1号油轮当COIN内含子被剪接出来时,等位基因会产生正常的信息。在反转后,COIN模块成为修饰基因的末端外显子,消除下游外显子的表达,并产生并入eGFP的功能性无效等位基因。命名约定、缩写和标记如(比例尺:200 bp)(B类)免疫球蛋白M+,B220+B细胞群在骨髓和脾细胞中基本缺失Il2rg公司不包括发票/Y(Y)(288748)但不受影响Il2rg公司不包括1号油轮/Y(Y)(270876)与Il2rg公司+/Y(Y)(290735)只小鼠。数字表示鼠标身份。(C类)插入COIN元素不会改变Il2rg公司在反转之前,但在反转之后烧蚀它。猪脾脏RNA的Northern分析Il2rg公司+/Y(Y)(290736、290735和283124),Il2rg公司不包括1号油轮/Y(Y)(270877、270876和283125),以及Il2rg公司不包括发票/Y(Y)(278947、288748和283126)只小鼠。探针是(顶部)Il2rg公司, (中部)电子GFP、和(底部)Gapdh公司18S和28S rRNA的位置被标记。数字表示属于每个基因型类别的每只小鼠的身份;对相同的小鼠进行表型分析(B类) (SI附录,图S4). (D类)骨髓、胸腺和脾淋巴细胞群Il2rg公司不包括发票/Y(Y)小鼠表达eGFP。eGFP表达缺失于Il2rg公司不包括1号油轮/年淋巴细胞群。
Dll4号机组i3COIN公司:条件敏感性测试。
为了进一步确定前反转COIN等位基因是无害的,我们为δ样4创造了一个COIN(Dll4号机组). 该常染色体基因杂合子缺失的胚胎显示严重的血管生成表型,导致妊娠期间死亡(20–22). 因此,如果预反演Dll4号机组i3COIN公司等位基因甚至会导致Dll4功能的轻微降低,然后可能会在胚胎中产生可观察到的血管生成表型。为了避免破坏保守的CpG岛,我们选择将COIN模块放在内含子3内(). 正如预期的那样,如果Dll4号机组在胚胎第10.5天(E10.5),在WT水平下起作用Dll4号机组i3COIN公司/+胚胎看起来正常(). 此外,E10.5Dll4号机组i3COIN-INV(发票)/+胚胎(即,胚胎杂合子,用于通过育种产生的反转后等位基因Nanog-Cre公司转基因株系)表现出严重的血管生成表型,与在Dll4号机组LacZ公司/+常规无效等位基因杂合的胚胎(、iii和iv以及SI附录,表S2). 这种COIN等位基因在出生后被他莫昔芬/CreER条件性逆转时也起作用t2时间-介导的重组,因为这种倒置再现了药物Dll4阻断在出生后发育的眼睛中看到的血管生成异常(23) (). 最后,在皮肤的动脉血管系统中检测到了eGFP荧光,这与之前常规报告基因的模式类似(21) (),表示COIN模块的报告器反转后的正确表达。
Dll4号机组i3COIN公司提供了对转化前为WT的工程COIN等位基因的严格测试。(A类)示意图Dll4号机组i3COIN公司等位基因。的外显子-内含子区域Dll4号机组改编自合奏.org.将COIN模块插入内含子3。在反转之前Dll4号机组i3COIN公司当COIN内含子被剪接出来时,等位基因会产生正常的信息。为了简洁起见Dll4号机组i3COIN-INV(发票)等位基因没有图示;然而,如中所述,反转后,COIN模块成为修饰基因的末端外显子,取消下游外显子的表达,并导致包含TMeGFP的功能性空等位基因。这个Dll4号机组i3T2ACOIN公司等位基因与Dll4号机组i3COIN公司等位基因,除了引入标记物的T2A肽(TMT2AeGFP)。不同元素的命名约定、缩写和标记如。(比例尺:500 bp。)(B类)Dll4号机组i3COIN-INV(发票)等位基因对应于一个空等位基因。来自Dll4号机组i3COIN公司在E10.5收集×Nanog-Cre杂交,通过光学显微镜观察,基因分型,并与Dll4号机组LacZ公司/+E10.5胚胎。具有基因型的胚胎和卵黄囊(i和v(v))Dll4号机组+/+; LocX(位置X)Nanog-Cre公司/+(+/+); (ii(ii)和不及物动词)Dll4号机组i3COIN公司/+(货币/+); (三和vii(七))Dll4号机组i3COIN-INV(发票)/+LocX(位置X)Nanog-Cre公司/+(新币/+); 和(四和vii(七))Dll4号机组LacZ公司/+(LacZ公司/+)如图所示。Dll4号机组i3COIN-INV(发票)/+胚胎物镜检查Dll4号机组LacZ公司/+胚胎。(C类)中COIN模块的反转Dll4号机组i3COIN公司出生后第5天(P5)的小鼠会导致视网膜血管成熟消失。用三苯氧胺处理P5小鼠以激活CreERt2时间或车辆;48h后收集视网膜,观察其血管结构。两者都不是(我和v(v))纯合子中的COIN等位基因[Dll4号机组i3COIN/i3COIN; Gt(ROSA)26SOR公司+/+,表示为COIN/COIN;CreERt2/+]或(三和vii(七))CreER的激活t2时间他莫昔芬(+/+;乘员ERt2/+)对视网膜血管生成和(四和viii(八))物镜检查DII4(DII4)+/+; Gt(ROSA)26SOR公司CreER2公司/+. (ii(ii)和不及物动词)CreER的激活t2时间在里面Dll4号机组i3COIN/i3COIN; Gt(ROSA)26SOR公司CreER2公司/+结果视网膜血管系统的成熟被取消。建议使用三苯氧胺治疗。(D类)T2A纳入Dll4号机组i3T2ACOIN公司恢复报告者(TMT2AeGFP)的功能。皮肤荧光显微照片Dll4号机组i3T2ACOIN公司/+; Gt(ROSA)26SOR公司CreER2公司/+老鼠(我)在和之前(ii(ii))用三苯氧胺治疗后。注意eGFP仅在动脉(A)中表达,而在静脉(V)中不表达ii(ii)。
通过将等位基因重组为外显基因,纠正了内含子等位基因不能作为KO后反转基因发挥作用的问题。
迄今为止,绝大多数被设计为COIN并进行分析的条件性空等位基因的功能都符合预期:它们是WT前反转和空后反转(). 这种经历的例外是两个内含子COIN,Chrd公司i2COIN公司和德罗莎i3COIN公司,这两个函数都用作不完全null后反转。例如,携带后反转基因的老鼠德罗莎i3COIN公司等位基因与传统的空等位基因结合(德罗莎i3COIN-INV/LacZ公司)出生并存活下来(尽管是矮小的),而这个相同的空等位基因,德罗莎LacZ公司纯合子导致胚胎死亡(德罗莎拉奇/拉奇) (SI附录,表S3). 后反转的原因德罗莎i3COIN-INV(发票)等位基因并非完全无效,因为它仍然产生低水平的WT mRNA,显然是因为选择性剪接去除了反转的COIN模块(SI附录,图S19); 传统的基因陷阱也有类似的观察结果,解释了许多基因陷阱所观察到的低形态特征(24,25)并强调了基因捕获的一个主要弱点。
我们假设,通过将包含在离散人工内含子(内含子COIN)内的COIN模块放入附近的外显子中,可以纠正内含子COIN后反转的低形态表型。该假说通过在基因外显子4中设计COIN等位基因来验证德罗莎(德罗莎不包括4号油轮) (和SI附录,图S5); 反转后,该等位基因与传统的空等位基因配对时会导致早期胚胎死亡(德罗莎不包括4COIN-INV/LacZ),表明COIN模块的外显子位置纠正了内含子位置观察到的问题(SI附录,表S4). 与内含子COIN等位基因不同德罗莎,反转后外显子COIN完全缺乏WT德罗莎信使核糖核酸()废除德罗莎的职能(26)在pri-miR处理中(). 这些数据表明,与将COIN模块放置在天然内含子中相比,COIN模块的外显子放置更可靠地生成完全无效的等位基因反转后。
外显子COIN德罗莎是后转换函数null。(A类)的示意图德罗莎不包括4号油轮等位基因。的外显子-内含子区域德罗莎(剪接变异体001,转录ID ENSMUST00000090292)改编自合奏.org.浅蓝色垂直箭头表示COIN内含子在外显子4内的插入点(SI附录,图S5). 反转前,德罗莎ex4COIN公司当COIN内含子被拼接出来时,生成一个正常的消息。为了简洁起见,德罗莎不包括发票未进行示意性描述;但是,如所示,反转后,COIN模块成为修饰基因的末端外显子,取消下游外显子的表达,导致包含eGFP的功能性空等位基因。在中替换的区域德罗莎LacZ公司等位基因VG549用括号标记。不同元素的命名约定、缩写和标记如(比例尺:100 bp)(B类–D类)COIN模块的反转将导致德罗莎以及microRNA成熟和伴随的pri-miRs积累。使用外显子4(ENSMUSE00000563117)作为探针对Drosha进行的Northern分析显示Drosha mRNA缺失(B类,上部,白色箭头)in德罗莎不包括4COIN-INV/LacZES细胞和编码外显子1–21的混合/融合信息的存在德罗莎加LacZ公司(B类,上部,黑色箭头),也使用LacZ公司探针(C类,黑色箭头)。Drosha表达缺失导致pri-miR293的积累(B类,下部,灰色箭头)和成熟miR-293的丢失(D类,上部,灰色箭头)in德罗莎不包括4COIN-INV/LacZES细胞。miR的成熟不受Cre活性诱导或eGFP表达的影响(D类,车道2)。18S和28S rRNA的位置(B类和C类)以及U6、miR-293和小RNA阶梯的位置(D类)已标记。基因型密钥:+/+,德罗莎+/+;+/LacZ公司,德罗莎+/LacZ公司;CreERt2/COIN-INV公司,德罗莎+/+;Gt(ROSA)26Sor公司CreERt2/COIN-INV公司;货币-INV/LacZ,德罗莎不包括4COIN-INV/LacZ;Gt(ROSA)26Sor公司CreER2公司/+,+/+;货币/拉茨,德罗莎ex4COIN/拉奇.c1和c2表示的克隆1和克隆2德罗莎不包括4COIN-INV/LacZ;Gt(ROSA)26Sor公司CreER2公司/+来源于三苯氧胺治疗。
讨论
COIN为工程条件零等位基因提供了最先进的方法。
作为生成条件等位基因的一种灵活且广泛适用的方法,COIN等位基因解决了其他条件方法固有的局限性,同时开辟了独特的设计模式。COIN几乎不受设计约束;他们使用优化的基因陷阱样盒COIN模块,该模块是模块化的并且适用于高通量方案,同时克服了现有基因陷阱和条件无效等位基因方法的局限性和不足。COIN方法适用于大多数基因,因为它独立于目标基因的内含子-外显子结构,消除了用重组酶识别元件包围整个基因或定义关键区域的需要,还减少了对破坏或删除基本调控元件的担忧。虽然检测COIN的大多数基因都是蛋白质编码基因,但该方法适用于非编码基因,如COIN等位基因所示Gt(ROSA26)Sor公司。
除了广泛的适用性外,COIN等位基因设计还包括一个报告者(例如。,电子GFP)这样可以可视化等位基因发生条件诱导的细胞。COIN报告基因可以很容易地被任何选择的转基因或工程外显子取代。后一种能力被用来产生条件突变等位基因以模拟人类遗传疾病(29). 然而,COIN引入的最独特的技术进步是分离外显子和利用人工内含子的工程模式。外显子分裂使COIN技术得以应用,甚至可以应用于单个外显子基因,这些外显子包含小鼠基因组中约15%的蛋白质编码基因(30). EUCOMMTOOLS使用此属性为单个外显子基因生成条件无效等位基因(www.knockoutmouse.org/about/eucommtools/vectors).
以前,条件等位基因设计方法,如FlEx(5)和KO-first(三),试图解决与传统条件-空方法相关的一些问题(SI附录,图S17). 在这两种方法中,FlEx与COIN最为相似,因为它依赖于包含报告子的可逆条件基因陷阱盒,但它保留了基因陷阱的局限性,因为它必须插入内含子;只有一个例外(5),它仅用于基因捕获(4). 虽然FlEx的价值尚未实现,但KO-first是大型鼠标KO项目(如EUCOMM和KOMP)所采用的方法之一(31). KO-first等位基因是靶向基因陷阱,可在靶向后转换为空或条件空等位基因(SI附录,图S17). 然而,KO-first等位基因仅限于具有关键外显子的基因(即具有缺失的外显子,其将下游外显子编码序列置于框架之外;因此,预测它们将通过非传感介导的衰变过程导致零)(32)可以被识别,并且他们缺少一个报告者,可以标记出发生Cre介导的条件等位基因失活的细胞。为了克服这两种方法的局限性,COIN提供了一种可靠的替代条件等位基因设计策略。
外源COIN为工程条件通道提供了独特可靠的工程模式。
大多数外显子和内含子COIN等位基因在COIN模块反转前为WT,反转后为空(). 一个有指导意义的例外是两个内含子COIN的反转后亚型,Chrd公司i2COIN公司和德罗莎i3COIN公司对于后者,这个问题通过设计外显版本得到了纠正(德罗莎不包括4号油轮)在直接下游外显子中,表明外显子COIN通过选择性剪接后反转降低了WT mRNA再生的可能性,因此与内含子COIN相比,更可靠地生成完全无效的等位基因。虽然外显子COINs的这一特性尚未完全理解,但3′SS圆周率COIN模块和3′SS的圆周率COIN内含子的5′SS和pA位点是相同的,并且以一种尝试和真实的排列方式匹配,其中COIN模块3′SS圆周率pA位点占主导地位,导致COIN模块的外显子作为末端外显子被充分利用,并在反转后伴随转录终止。不管机制如何,我们的发现是,即使是优化的基因捕捉盒,例如COIN模块(SI附录,图S1),当放入一些显性的天然内含子中时可以剪接出来,这为使用基因陷阱作为空等位基因提供了一个警告(24,25)并表明外显子COINs为产生条件缺失等位基因提供了更可靠的方法。
毫无例外,这里描述的等位基因被设计为条件-空。然而,显而易见的是,COIN方法扩大了可能的等位基因设计的储备。例如,COIN内含子可以用于外显子的简单分裂()在部分外显子缺失是理想结果的情况下,尤其是能够为单个外显子基因设计简单、基于缺失的floxed等位基因。更复杂的设计,例如杂交COIN–FlEx等位基因(和SI附录,图S19)在需要COIN模块功能和删除部分floxed序列的能力的情况下,同样可以实现和使用。其他可能性包括拯救COIN等位基因,其中起始等位基因是突变的,WT状态是在反转后诱导的(29)(例如,VG1452Il2rg公司) (). 鉴于COIN模块中存在的报告者可以替换为多种功能序列,利用COIN生成点突变、外显子互换、结构域互换、,和融合蛋白,甚至与这些工程蛋白或报告基因与小的非编码RNA共存,都是目前使用的COIN主题的变体。
COIN方法支持独特的工程模式。(A类)外显子分裂可以使单个外显子基因以及缺乏关键外显子的基因漂浮。由单个外显子组成的假想蛋白编码基因(1)如图所示。该外显子使用包含液氧磷网站。另一个液氧磷该位点位于外显子1R的下游,呈平行构型,使得外显子1 R易于被Cre删除。黑色三角形表示液氧磷位点,蛋白质编码序列用灰色表示,剪接用黑色虚线表示。所有其他元件如所述. (B类)使用FlEx–COIN混合设计将非关键外显子转换为关键外显基因。描述了一个由三个外显子组成的假想蛋白质编码基因,其中外显子处于同一阶段(阶段0)。外显子显示为灰色方框,拼接用黑色虚线表示,每个外显子的开始和结束阶段用每个外显器上相应点上方的数字表示,黑色和黄色三角形表示液氧磷和lox2372型网站。外显子1变得至关重要(三)通过使用COIN内含子将其分裂,使外显子1L在第2阶段结束。Cre的重组导致COIN模块的反转和外显子1R的同时缺失。(外显子1R保留的版本如SI附录,图S18因此,外显子1L和2不同步;因此,即使COIN模块被剪接出来,产生的mRNA也会为截断的非功能蛋白编码。
设计可靠的条件等位基因仍然是一项具有挑战性的技术。任何方法,包括目前描述的COIN方法,都会有一定的失败率。我们报告了可能是最广泛的条件等位基因方法测试和表征,并发现可能是有记录以来最低的失败率。因此,我们提供的数据表明,COIN方法非常可靠,普遍适用,并且足够灵活,允许广泛采用和利用来设计条件空值以外的等位基因。
材料和方法
工程COIN修改磁带。
COIN模块由一个3′SS组成圆周率(表示为这样表示,在将COIN模块倒置到修改基因的有义链后,它将作为3′SS发挥作用),序列为5′-CGG GCC CCT CTG CTA ACC ATG TTC ATG CCT TCT TCC TAC AG-3′,源自兔HBB2的第二内含子(GeneID 100009084)(SI附录,图S14) (9)其次是eGFP的ORF(33)HBB2的pA区域(rßglpA;坐标32041:32560,单位为gb|{“类型”:“entrez-notide”,“属性”:{“文本”:“M18818.1”,“term_id”:“164790”,“term_text”:“M10818.1”}}M18818.1型|兔子球)(SI附录,图S15). 3′SS圆周率-eGFP-rßglpA模块两侧为左元件/右元件(勒/雷)突变体液氧地点,液氧66和液氧71(6),以生成完整的COIN模块,[lox66]-3′不锈钢圆周率-eGFP-rßglpA-液氧71,其中lox66型和lox71型相互之间是一种面对面的配置,这种关系表示为液氧66在括号内([…]) ().
将COIN模块插入HBB2内含子2的反义链中MfeI公司现场。将COIN模块放置在反义链中,可以将COIN内含子引入外显子,从而使COIN等位基因的工程化成为可能,即使是由单个外显子组成的基因。此外,为了适应在感兴趣基因内任何特定位置的帧内插入,通过改变eGFP编码序列的相位,在所有三个不同的读取帧中生成COIN模块。此外,如果感兴趣基因的基因产物是一种带有分泌信号的蛋白质,则使用跨膜版本的eGFP(TMeGFP)作为报告物,随后,它还结合了T2A肽(34)在TMeGFP和eGFP(TM-T2A-eGFP)的跨膜结构域之间,以实现最小修饰eGFP的表达。
促进BHR大肠杆菌在ES细胞中,一个抗生素/DSC小基因被放置在其反义链的COIN内含子内,并且在普莱和PspOMI公司地点。使用的DSC要么是新霉素磷酸转移酶人工小基因(新)或潮霉素B磷酸转移酶人工小基因(湿度)两侧为翻转酶识别靶(FRT)位点,允许移除新或湿度Flp重组酶或其衍生物(35). 除了编码新霉素磷酸转移酶的ORF(核动力装置)或潮霉素B磷酸转移酶(马力),两个小基因的元素是相同的。的表达式核动力装置或马力在哺乳动物细胞中,由人类泛素C(UBC)基因的启动子区域驱动(坐标125398319:125399530位于人类12号染色体的反义链中;人类CCDS集合:CCDS9260)(36),而在中的表达式大肠杆菌由EM7启动子(Invitrogen)驱动。确保新或湿度消息,鼠标的3′区域第1页含有pA和相关序列的基因(37)(X染色体坐标103398979–103399440)被克隆通过核动力装置或马力ORF。有关最佳COIN模块工程的详细信息,请参阅SI附录。
等位基因、ES细胞系和小鼠系的基因工程。
Velocigene技术用于生成本研究中使用的转基因ES细胞和小鼠(38). 简言之,靶向载体是通过使用BHR修饰BAC生成的(39). 靶向F1H4 ES细胞、129S6/ScEvTac-C57BL/6NTac杂交系或F1H4衍生的ES系(通过基因靶向)。如有注明,基因名称、ch坐标和染色体数对应于2010年5月58日发布的小鼠基因组集成中的核苷酸坐标;我们提供了这些坐标,以便精确定义正在设计的等位基因,并便于将来将这些等位基因注释到基因组中。基因名称也出现在2010年5月的Ensembl 58版中。用于基因分型的引物和探针组的详细信息以及每个等位基因的靶向频率列于数据集S1除非另有说明,否则所有基因分型均采用所述的等位基因丢失(LOA)分析(38). 通过显微注射或使用VelociMouse方法生成小鼠系(40)如前所述。本研究中使用的每个等位基因的设计,以及ES细胞靶向和COIN等位基因分型的详细方案,见SI附录。
COIN等位基因的基因工程:指南和实践。
一组简单的规则指导COIN的设计:
我)通常应避免短于100 bp的外显子分裂,因为短于50 bp的外显子在小鼠基因组中很少见(41). ii(ii))原始外显子分裂后,产生的每个新外显子[左(L)和右(R)]最好不小于50 bp。(然而,对于外显子1L短于50 bp的四个COIN等位基因-德ex1COIN公司,第1级不包括1号油轮,素食者1不包括1号油轮、和素食者2不包括1号油轮()-没有明显的负面后果,所有这些COIN等位基因都按预期发挥作用。)
三)COIN内含子对外显子的分裂最好发生在外显子中的MAG三核苷酸基序之后,因此保持了MAG/gtragt 5′SS的一致性(其中M=A或C,r=A或g,“/”表示分裂位点;大写的核苷酸是外显的,小写的核苷酸是内含子的)(42). 如果靶外显子中没有MAG,可以通过引入适当的沉默突变来构建MAG;这个Gpr124型ex1COIN公司等位基因提供了这样一个例子(SI附录,图S9). 四)首选在第一个外显子或内含子内插入,以使尽可能多的基因序列无法转录。
v(v))尽可能避免破坏CpG岛和保守的监管区域。(然而,我们发现,在两个等位基因中,CpG岛被COIN内含子的插入所破坏-Gdf11型不包括1号油轮和Sox2系统exCOIN公司-分别造成了最小和无明显后果。)
不及物动词)最后,有必要注意使用。在使用COIN等位基因之前,必须去除DSC,以避免修饰基因的剪接及其表达水平出现异常(13)或者避免对邻近基因产生影响(12,43,44).
对于本文提出的所有COIN等位基因,DSC相对于COIN模块的方向放置在反义链中,对于外显子COIN,它包含在COIN内含子中(). 此外,所有COIN等位基因只有在用FLPe切除DSC后才进行研究(11). 为每个基因生成的COIN等位基因类型-外显子(exCOIN)或内含子(iCOIN)列在.COIN盒的选择取决于放置要求:在exCOIN的情况下,修改盒是完整的COIN内含子加DSC,而在iCOIN的情形下,修改盒带是COIN模块加DSC而没有COIN内含物序列5′到COIN内含体的序列穆卢伊和3′至其圣诞节场地(和SI附录,图S6). 此外,记者的阶段(电子GFP,TMeGFP公司,或TM-T2A-eGFP公司)使得在将COIN模块转化为编码靶基因的链之后,报告基因将与COIN模块插入点上游的靶基因编码序列在同一帧中。用于每个等位基因的COIN修饰盒的特定版本显示为“报告者;相数;DSC”。有关每个等位基因的COIN修饰盒放置的详细信息,请参见数据集S1。