更广泛的目标容量
通过利用各种CRISPR-Cas系统的独特属性,如PAM特异性、蛋白质大小和核酸酶活性,一系列基于CRISPR–Cas的DNA靶向工具已被开发用于基因组编辑应用。此外,检测靶向和非靶向相互作用方法的发展提高了CRISPR-Cas工具的靶向特异性(补充信息框1).
CRISPR-Cas9工具
Cas9属于2类II型CRISPR系统,是应用最广泛的基因组编辑工具。明确地,化脓性链球菌Cas9(SpCas9)是第一个在原核细胞外使用的10并重新编程用于哺乳动物细胞的基因组编辑11,12; 它仍然是最常用的Cas9。在DNA目标识别后,SpCas9通常会产生钝性双链断裂(DSB)()13SpCas9的DNA靶向依赖于20核苷酸长间隔区和PAM 5'-NGG10,14Cas9系统是双RNA引导的:crRNA负责DNA靶向,也与反激活crRNA(tracrRNA)杂交,后者负责与Cas9形成复合物15,16crRNA和tracrRNA的功能可以用工程化的单导向RNA(gRNA)进行重述10().
PAM 5'-NGG(N代表任何核苷酸)的识别将人类基因组中SpCas9靶位点的可用性限制为每八个碱基对平均一个靶位点9为了提高目标站点的可用性,定向进化【G】这些方法产生了PAM特异性改变的变体()17,18例如,扩展的PAM SpCas9变体xCas9识别5'-NG、5'-GAA和5'-GAT PAM序列18工程化Cas9变体的另一个动机是增加靶向特异性。事实上,一些研究已经描述了在质粒中表达Cas9和gRNAs后,突变的Cas9变体的离靶切割减少19-22或其作为核糖核蛋白(RNP)复合物的递送23或者,通过在gRNAs间隔区上以RNA发夹的形式设计二级结构,增加了靶向CRISPR-Cas特异性,从而增加了crRNA或gRNA链入侵非靶向位点的热力学屏障,同时通常保持了靶向活性24.
表1。
姓名 | 包括突变 | PAM(5'至3') | 笔记 |
---|
SpCas9型 | 本地化脓性链球菌案例9 | NGG公司249 | 1368个氨基酸 |
VRER SpCas9公司 | D1135V、G1218R、R1335E、T1337R | NGCG公司17 | 更改的PAM变体;基于细菌选择的筛选 |
VQR SpCas9公司 | D1135V、R1335Q、T1337R | NGAN或NGNG17 | 更改的PAM变体;基于细菌选择的筛选 |
EQR SpCas9公司 | D1135E、R1335Q、T1337R | NGAG公司17 | 更改的PAM变体;基于细菌选择的筛选 |
xCas9-3.7型 | A262T、R324L、S409I、E480K、E543D、M694I、E1219V | NG、GAA、GAT18 | 更改的PAM变体;噬菌体辅助的持续进化 |
eSpCas9(1.0) | K810A、K1003A、R1060A | NGG公司 | 特异性增强;结构导向蛋白质工程19 |
eSpCas9(1.1) | K810A、K1003A、R1060A | NGG公司 | 特异性增强;结构导向蛋白工程19 |
案例9-HF1 | N497A、R661A、Q695A、Q926A | NGG公司 | 增强的特异性20 |
HypaCas9型 | N692A、M694A、Q695A、H698A | NGG公司 | 增强的特异性21 |
evoCas9基因 | M495V、Y515N、K526E、R661Q | 天然气 | 特异性增强;基于酵母的筛选22 |
高保真Cas9 | R691A型 | NGG公司 | 增强核糖核蛋白递送的特异性23 |
ScCas9型 | 本地犬链球菌案例9 | NNG公司250 | 1375个氨基酸 |
标准案例9 | 本地嗜热链球菌案例9 | NNAGAAW公司11,25 | 1121个氨基酸 |
编号案例9 | 本地脑膜炎奈瑟菌案例9 | NNNNGATT公司26-28 | 1082个氨基酸 |
安全案例9 | 本地金黄色葡萄球菌案例9 | NNGRRT公司29 | 1053个氨基酸 |
CjCas9公司 | 本地空肠弯曲菌案例9 | NNNVRYM公司30 | 984个氨基酸 |
CasX公司 | Deltaproteobacteria和Planctomycetes门 | TTCN公司32 | 980个氨基酸 |
识别不同PAM序列的其他Cas9同源序列的发现和开发提供了更多的靶位点选择。例如,嗜热链球菌Cas9识别PAM 5'-NNAGAAW(W代表A或T)11,25和脑膜炎奈瑟菌Cas9识别5'-NNNGATT26-28这些Cas9同源基因已被重新用于细菌和哺乳动物细胞中的DNA靶向。此外,PAM通过金黄色葡萄球菌Cas9(SaCas9)为5'-NNGRRT(R代表A或G)29值得注意的是,SaCas9的基因编辑效率与SpCas9相当,而SaCas9较小的大小(1053个氨基酸,而SpCas9的1368个氨基酸)使其能够用于限制大小的传递载体,如腺相关病毒(AAV)29最近,来自空肠弯曲菌(984个氨基酸),据报道可识别PAM 5'-NNNNVRYM(V代表A、C或G;Y代表C或T)30并用于目标基因组编辑体内31进一步努力鉴定Cas9同源基因,发现了CasX(980个氨基酸),这是迄今为止最小的Cas932.
CRISPR–案例12a
另一种已被重新编程用于人类细胞基因编辑的II类RNA引导的内切酶是Cas12a(以前叫Cpf1)33作为V型系统,Cas12a在DNA靶位点产生一个5’悬垂的交错切割,并且不使用tracrRNA(). 与Cas9产生钝端相反,Cas12a产生交错端可能有利于应用,例如在精确方向上整合DNA序列。此外,Cas12a可以切割crRNA阵列【G】生成自己的crRNAs。这种crRNA处理能力促进了单个定制crRNA阵列的使用,从而简化了多重crRNA的基因组编辑34.
Cas12a来自酸性氨基球菌spp.(AsCas12a)和毛螺菌科spp.(LbCas12a)是第一个在哺乳动物细胞中表现出活性的Cas12a同源序列,它识别目标序列上游的PAM序列5'-TTTTV。为了提高它们的基因组编辑活性,一种增强型AsCas12a变体(enAsCas12a)被改造35为了增加Cas12a的靶向范围,最近设计了AsCas12a变体以识别PAMs 5'-TYCV和5'-TATV36,或PAM 5'-VTTTV、5'-TTTT、5'/TTCN和5'-TATV35Cas12a的独特特性和切割机制提供了一个基因组编辑工具,扩展了CRISPR工具箱。
级联和Cas3
1类I型系统是自然界中最常见的CRISPR-Cas系统类型,包括多聚DNA靶向复合物Cascade和内切酶Cas3(). 在将Cas3招募到目标DNA序列之前,Cascade必须首先通过PAM和间隔区识别与DNA结合37-42Cascade对PAM序列的混杂识别提供了更大的靶点灵活性43Cas3的补充产生了一个单链缺口,随后通过3'到5'的核酸外切酶活性对靶DNA进行降解37,39,44,45Cas3的镍酶和解旋酶活性对原核生物中外源DNA的降解至关重要38Cas3独特的切割机制被用作一种抗菌工具,通过将原生或外源I型系统引导至细菌基因组进行降解和随后的细胞死亡46探索重新利用Cas3的缺口酶、解旋酶和核酸外切酶活性可能会在哺乳动物细胞中带来新的应用。
在I型系统中,crRNA阵列由级联亚基Csy4处理47像Cas12a一样,这种内切酶活性被重新用于定向RNA加工。例如铜绿假单胞菌I-F型Csy4已被用于在人类细胞中生成多个Cas9 gRNAs48,49.
基因编辑的机制和应用
基因编辑核酸酶(包括Cas9)通过产生靶向DNA断裂来发挥作用,靶向DNA破裂可诱导DNA损伤反应并通过各种内源性机制刺激修复50利用不同DNA修复机制的独特特性,开发了特定的基因组编辑策略。
NHEJ与HDR
真核生物主要通过易出错的非同源末端连接(NHEJ)途径修复DSB,导致小插入或缺失(indels)的积累【G】)经过反复的破坏和修复(). 或者,与目标位点同源的修复模板可以与Cas9一起交付,以刺激无错误的同源定向修复(HDR),但通常效率低于NHEJ介导的修复(). NHEJ可用于产生基因敲除(缺失),而HDR可用于在靶基因位点引入特定变化,例如点突变或插入更长的DNA片段。在核酸酶介导的DNA断裂后提高HDR的效率被广泛追求,以充分利用基因组编辑的力量来引入精确的基因组改变51-55.
基因组编辑策略。核酸酶产生靶向DNA双链断裂(DSB),可以通过不同的修复途径进行修复。一非同源末端连接(NHEJ)介导的修复容易出错,并诱导小的插入或删除突变(indels)。通过对两个基因组位点同时靶向核酸酶产生的两个DSB之间的修复,可以产生大的靶向缺失。或者,通过提供独立靶向切割的供体DNA,同源性无关靶向整合(HITI)可以定向到单个切割位点65.b条同源定向修复(HDR)途径可用于基因组编辑,方法是提供双链或单链寡核苷酸(ssODN)供体模板,该供体模板包含切割靶点的同源臂。单核苷酸的改变或较大序列的插入可以通过将变异引入供体模板来介导,供体模板也可能由质粒DNA、病毒DNA组成248或长单链DNA71HDR发生后,沉默突变(也称为阻断突变(B))可与预期的改变一起纳入供体模板,该沉默突变可阻止核酸酶随后对靶点的识别和NHEJ介导的吲哚的形成73.c(c)对于单核苷酸C→T(或G→A)转换,Cas9镍酶已融合到胞苷脱氨酶,如APOBEC179为了提高碱基编辑效率,将两种尿嘧啶糖基化酶抑制剂(UGI)融合到一个碱基编辑器中,以防止细胞碱基切除修复88.
基因缺失
在Cas9裂解后,NHEJ介导的DNA修复可以被用来产生基因敲除。当靶向编码外显子时,indel介导的移码突变,通常也会在靶位点下游引入过早的终止密码子,会破坏基因表达。或者,通过同时靶向基因中的两个位点,可以在DSB之间产生缺失11,56-58,包括megabase-size删除59(). 对Cas9介导的缺失效率的系统研究表明,缺失大小与其频率呈负相关60除细胞研究外,还制定了促进斑马鱼等生物体可遗传基因组缺失的策略61和老鼠62-64广泛的可能Cas9介导的基因组缺失正在加速基因和遗传元素的研究。
基因插入
将编码表位标签或荧光蛋白的DNA序列插入蛋白质编码基因以监测内源性表达的蛋白质是研究天然细胞环境中蛋白质功能的一种有价值的策略。基于核酸酶裂解位点线性DNA片段的整合,已开发出Cas9介导和NHEJ介导的基因标记策略。在同源非依赖靶向整合(HITI)中,标签两侧有gRNA靶点,因此Cas9可以同时从质粒中释放它,并切割与感兴趣基因相邻的受体基因组靶点65(). 创造内源性氨基末端的通用质粒系统66或羧基末端66,67使用非靶向通用供体序列的基因标签融合技术也已经开发出来。由于这些模块化Cas9-介导系统的简单性,现在可以进行大规模的基因标记。HITI利用NHEJ修复DSB,产生了两个问题:indels的生成和随机定向的供体整合。为了克服这些障碍,供体序列两侧可以有同源臂。为了避免对靶向特定供体序列进行分子克隆的需要,使用单链DNA(ssDNA)用GFP编码序列标记内源性人类基因68(). 使用小鼠胚胎干细胞中的多重HDR生成具有多个精确单点突变的小鼠69.通过HDR介导插入错义的功能缺失突变,也可以在小鼠中建立癌症模型70为了通过插入大的可调节盒高效产生条件敲除小鼠,RNP与含有短同源臂的长ssDNA供体共同递送71最近,开发了一种称为CORRECT的HDR-依赖性策略(连续再引导或再Cas步骤以消除CRISPR–Cas-block靶点),用于产生疾病相关突变的无疤痕靶向敲除72通过改变供体模板,包括人类多能干细胞在内的编辑细胞系可以产生致病性突变和其他沉默突变,这些突变会阻止核酸酶随后的靶向识别和NHEJ介导的indels的形成73().
翻译
在癌症发展过程中,致癌融合基因经常通过染色体易位产生。位于两条非同源染色体上的DSB的非法NHEJ可介导易位。为了建立研究融合蛋白致癌特性的模型,在两个基因组位点上同时进行Cas9介导的切割已被用于设计人类细胞中与癌症相关的易位74,75Cas9诱导的染色体重排导致致癌基因融合也在小鼠中得到了重述76这些基因工程模型对于理解肿瘤发生和开发针对致癌融合蛋白的治疗策略非常重要。
单库编辑
与人类疾病相关的最常见的遗传变异是点突变。编辑单核苷酸碱基的能力对于创建遗传病模型和开发纠正疗法非常重要。靶向HDR介导的单碱基编辑可以通过将Cas9与含有编辑的选择核苷酸的同源供体序列共同递送来实现72然而,这种策略仍然效率低下,尤其是在HDR活性降低的有丝分裂后细胞中。此外,创建DSB以诱导有效HDR的需要可能导致非靶向突变,甚至DNA修复途径的靶向激活也可能对细胞活力产生不利影响77,78.
为了改进单碱基编辑,已经开发了一些工具,利用Cas9镍酶(nCas9)或催化缺陷的Cas9(dCas9)进行特定位点靶向,而不生成DSB。对于单核苷酸的直接转化,dCas9或nCas9已与胞苷脱氨酶融合。与脱氨酶(如大鼠APOBEC1和七鳃鳗胞苷脱氨酶1)融合可以在间隔序列内的5 bp活性窗口内实现靶向C→T(或G→A)核苷酸转换79,80(). 细胞DNA修复反应可以拮抗这一过程并恢复编辑碱基,因此还使用尿嘧啶糖苷酶抑制剂来防止碱基切除修复并提高碱基编辑效率79-81。含有APOBEC1的第三代编辑器(BE3)与16个残基的XTEN接头、nCas9和尿嘧啶糖苷酶抑制剂(APOBEC1–XTEN–dCas9(A840H)-UGI)融合,可以在哺乳动物细胞中实现15-75%的靶核苷酸的永久转化79此外,BE3还完成了基础编辑体内通过RNP介导的蛋白质传递到小鼠和斑马鱼胚胎82,83、AAV介导的递送子宫内给老鼠吃84以及向人类胚胎注射mRNA和gRNA85,86在成年小鼠中,BE3被用于将特定位点的无义突变引入件9导致胆固醇水平降低的基因87.
BE3的持续发展改进了单基编辑。例如,通过结合BE3和高保真Cas9,提高了Cas9介导的靶向特异性83为了优化碱基编辑,延长融合蛋白之间的连接子并添加尿嘧啶糖基化酶抑制剂的第二个拷贝,已经产生了由SpCas9(BE4)和SaCas9(SaBE4)设计的第四代碱基编辑程序88在融合APOBEC1后,碱性靶向范围继续扩大到催化非活性dLbCas12a,该dLbCas12a识别富含T的PAM,具有6 bp的活性窗口89最近,enAsCas12a被用于增强基本编辑活动35为了缩小可能发生C→T旁观者改变的目标的编辑窗口,已经用人类APOBEC3A开发了用于人类细胞的基本编辑器90,91和植物92具体而言,eA3A-BE3是一个融合到BE3的工程化APOBEC3A结构域(eA3A),根据TCR>TCY>VCN层次结构优先脱氨基胞苷90此外,APOBEC3A介导的碱基编辑可以在DNA甲基化水平和CpG二核苷酸含量高的区域实现91.
最近,碱基编辑器工具箱已扩展到腺嘌呤碱基编辑器(ABE),它可以执行目标A→G(或T→C)核苷酸转换93使用tRNA腺苷脱氨酶的定向进化和蛋白质工程开发了具有最高编辑效率和靶向活性的第七代ABE93。优化和增强的胞苷和腺嘌呤碱基编辑器包括BE4max、AncBE4max和ABEmax94.
鉴于人类基因组中单碱基替换的普遍性和测序错误的频率,对碱基编辑特异性进行无偏分析尤其困难。对基础编辑器特异性的早期分析显示,非靶点与单独使用Cas9治疗的细胞中检测到的靶点不同95最近,在植物和小鼠的胞嘧啶碱基编辑器中报告了广泛的gRNA-independent非靶向活性,96,97表明存在独立于Cas9–DNA相互作用的碱基编辑活性。因此,未来的工作可能会侧重于将基础编辑活动限制在目标网站上的策略。
由于存在大量与遗传病相关的已知点突变,单碱基编辑器可用于制作无义突变或单氨基酸替换的动物模型。此外,正在探索基础编辑器在纠正或淘汰临床相关人类疾病方面的治疗潜力。98碱基编辑对于多基因靶向可能特别有用,避免在不同染色体上形成可能产生易位的多个DSB尤其可取。
高通量功能损失屏幕
RNA干扰(RNAi)一直是哺乳动物细胞中大规模基因干扰的主要系统,但RNAi的局限性包括对靶基因的不完全抑制和频繁的脱靶效应。基于Cas9的基因敲除筛查方法可以在很大程度上克服这些局限性(方框1). 事实上,基于Cas9的高通量屏幕实现了高比率的目标验证。99-102易于生成大型gRNA文库,再加上高效的慢病毒传递平台,例如基因组CRISPR–Cas9混合慢病毒文库,每个基因可以使用3-4个gRNA敲除18000多个人类基因99-使小鼠基因组敲除筛查成为可能100,101,103和人类细胞99,104,105将这样一个小鼠基因组靶向文库导入肿瘤生长和转移的小鼠模型,并鉴定出已知抑癌基因和新基因中的功能缺失突变体内102为了获得更高含量的混合筛选读数,Cas9的模块化与单细胞RNA测序相结合106-108通过配对基因组微扰和同一细胞内的转录组分析,可以阐明高阶相互作用,包括组合相互作用的功能。在优化gRNA-实验室设计方面取得的巨大进步也在提高这些屏幕的质量和吞吐量109.
方框1
使用基于病例的CRISPR工具进行全基因组联合筛查。
将CRISPR–Cas工具定位于基因组的简单性促进了高通量基因筛查。通过合成导向RNA(gRNA)文库,可以实现Cas9的基因组靶向。gRNA库的宽度可以定制,例如,功能丧失筛查可以使用饱和突变和仅针对人类基因外显子99,104,105,以及注释非编码基因组的屏幕可能以可访问染色质的位点为目标193或转录因子基序123gRNA文库是通过合成寡核苷酸库,将其克隆到质粒中,并产生编码gRNA的慢病毒文库而生成的(见图一). 表达Cas9的细胞系可以在gRNA递送之前生成,或者细胞可以与Cas9和gRNA文库联合转导。将Cas9缺口酶(nCas9)或催化缺陷Cas9(dCas9)融合到不同的效应蛋白可以实现基因组编辑(例如,通过胞苷脱氨酶APOBEC1)或表观基因组和基因调控(例如,p300的组蛋白乙酰化、TET双加氧酶的DNA去甲基化或KRAB结构域的转录抑制;参见图,零件b条). 为了筛选功能元件,必须富集或耗尽引起感兴趣表型的gRNA。例如,阳性选择可以识别在耐药性中起作用的元素237而消极选择可以识别与合成致命性有关的因素238(参见图,零件c(c)). 或者,通过直接免疫荧光染色或用报告人标记内源性基因,通过选择基因表达改变的细胞来鉴定基因调控元件193通过选择低或高报告基因表达的细胞,可以确定影响基因表达的因素(参见第c(c)). 选择后,使用下一代测序和生物信息学将未选择的gRNA文库与选择的gRNA文库进行比较,并鉴定富集和缺失的gRNA,从而鉴定特定的基因组基因座(见图,d日). 基于CRISPR的屏幕可以实现广泛的应用。基因功能的查询可以识别与细胞生存和增殖有关的基因或癌症基因100,105,238,239; 药物靶点可以根据对药物、毒素或病原体的耐药性或敏感性来确定238,240靶向筛选也通过干扰增强子序列来绘制非编码基因组的功能113或调节特定的基因集-例如,靶向激活所有转录因子基因,以识别参与干细胞分化的因子241虽然基于CRISPR的筛选集合到目前为止使用了基于Cas9的工具,但在未来,其他Cas蛋白可以用于其他功能或正交筛选。
除了针对治疗靶向策略的单基因微扰外,组合研究还可以用于剖析遗传相互作用。对于癌症治疗,同时敲除合成-致死基因对可以通过多重靶向实现细胞杀伤。因此,基于CRISPR–Cas的双敲除筛选已经被开发出来,用于分析基因相互作用和鉴定癌症基因的合成致死药物靶对110,111.
Cas9诱导的DSB导致的过度DNA损伤和细胞死亡可能会混淆敲除筛选得出的结论。最近的Cas9功能丧失筛查提出的另一点是,并不是所有的indels都会导致基因敲除。为了解决这些问题,一种独立于DSB的淘汰方法,称为CRISPR-STOP79是使用CRISPR碱基编辑器开发的,通过单核苷酸转换创建终止密码子。为了扩大这种终止密码子诱导(iSTOP)方法,我们编译了一个数据库,其中包含340多万个gRNA,靶向8种真核生物97-99%的基因112这些基于Cas9的敲除筛选证实了已知的对药物和毒素耐药的基本基因和介体,并提供了新的遗传学见解。
尽管基于CRISPR–Cas的基因编辑的许多最初应用都是针对研究基因功能,但这项技术的一个特别重要的用途在于以以前不可能的方式注释非编码基因组。例如BCL11A型基因编码控制胎儿血红蛋白水平的转录因子113; 调制BCL11A型通过扰动细胞类型特异性增强子的表达可以作为治疗β-血红蛋白疾病的一种方法。通过平铺10 kb的BCL11A型带有gRNA文库的增强子区域,揭示了小鼠和人类增强子-基因相互作用的差异,揭示并验证了关键的最小遗传元素是胎儿血红蛋白再诱导的靶点113这项工作涉及在非编码序列中引入indel突变以识别功能性基因调控元件,这导致了针对镰状细胞病和β地中海贫血临床前模型中这些位点的治疗策略的发展114或者,HDR被用于将所有可能的核苷酸替换引入假定的基因调控元件,以破译其功能115许多其他高通量平铺方法被用于识别监管区域中的功能元素116-123最后,采用以剪接位点为靶点的基因组筛选方法来鉴定对细胞生长至关重要的长非编码RNA(lncRNAs)124通过使用相同的文库筛选多个细胞系,基本上确定了lncRNA的细胞类型特异性差异。
分子记录
为了更好地了解细胞对外部(和内部)刺激的反应动力学,开发了CRISPR–基于Cas的工具,通过跟踪核苷酸变化形式的细胞反应,作为分子记录器发挥作用。可以生成自我靶向gRNA(stgRNAs),以便Cas9和stgRNA的表达将导致stgRNA位点的分裂和indel突变积累125,126因此,通过将细胞反应与stgRNA或Cas9的表达联系起来,可以“记录”细胞反应。通过测序stgRNA位点并确定累积突变的水平,可以测量刺激的持续时间或强度。或者,可以使用针对质粒或基因组DNA上指定位置的单碱基编辑器将细胞活动记录为单个核苷酸的改变127这些基于CRISPR–Cas的分子记录系统已被用于跟踪细胞对细菌和人类细胞中存在的小分子、病毒感染、光照和多重刺激的反应125,127.
Cas9介导的核苷酸改变是从创始细胞遗传给其后代的,因此indels可用于细胞线追踪。为了进行全有机体谱系追踪,在将Cas9和gRNA注射到含有多个Cas9靶位点的紧凑DNA条形码的单细胞斑马鱼胚胎后,记录了多轮细胞分裂过程中indel疤痕的积累128通过追踪斑马鱼个体数十万细胞中的这些疤痕,发现大多数器官来源于相对较少的胚胎祖细胞128为了增加可追踪疤痕的数量,将Cas9靶向其自身的gRNA间隔序列。间隔序列中形成indels的DNA修复机制导致瘢痕形成的复杂性增加,这为改进系统发育注释提供了更多信息126另一个合成记录系统,称为带光学原位读出的工程诱变记忆系统(MEMOIR),用于记录并随后在原位读取单个细胞的谱系信息129该系统将基于Cas9的靶向突变与多重单分子RNA荧光杂交(smFISH)相结合,以可视化记录的编辑事件,用于研究谱系追踪,同时保持细胞的相对空间定位129.
另一种记录策略是将核苷酸作为可追踪的分子事件整合到细菌基因组crRNA阵列中。该机制利用原核CRISPR-Cas系统的自然适应过程,其中Cas1和Cas2蛋白捕获入侵质粒或噬菌体遗传物质的短片段,并将外源序列作为间隔物整合到crRNA阵列中5,130由于新的间隔物优先插入crRNA阵列的5'端5该机制可用于跟踪序列间隔区捕获,作为记录分子事件时间顺序的手段。在过度表达Cas1和Cas2的细菌细胞群中,合成的寡核苷酸可以连续电穿孔,以产生多个分子事件的稳定基因组记录131最近,这项技术已被扩展到将编码黑白图像像素值的合成序列和一部短片存储到活细菌的基因组中132这些研究证明了DNA编码和存储模拟数据的能力。