在苍蝇和哺乳动物中已经确定了三种RNA沉默途径:RNA干扰(RNAi),由来源于外源性双链RNA(dsRNA)的小干扰RNA(siRNA)引导;microRNA(miRNA)途径,其中内源性小RNA抑制部分互补mRNA;和Piwi相互作用RNA(piRNA)途径,其小RNA抑制生殖系中的转座子(1-三)并且可以激活异染色质中的转录(4).
内源siRNAs沉默植物中的逆转录转座子(5,6),并且在培养的哺乳动物细胞中检测到与L1逆转录转座子相对应的siRNA(7). 遗传和分子证据表明,除了抑制病毒感染外,RNAi途径还沉默了苍蝇体内自私的遗传元素:RNAi基因的突变62元人民币(8)抑制逆转录因子插入引起的突变(9); 精氨酸蛋白Ago1或Ago2的缺失增加了培养物中转座子的表达果蝇属施耐德2(S2)电池(10); 在果蝇属用于1360转座子(11)并在苍蝇转基因沉默过程中产生(12); 和siRNAs被提议抑制后缀,一种短的散布核元素(SINE)(13).
的定义属性果蝇属siRNAs是Dicer-2(Dcr-2)从长dsRNA中产生的,它产生5′-单磷酸末端;它们装载到Argonaute2(Ago2)中;及其Ago2-依赖,3′-末端,2′-哦-甲基转移酶Hen1甲基化(14-16)与大多数miRNAs不同(17). 体内(,最右侧面板)和体外(18)Dcr-2从外源dsRNA中产生的siRNA几乎都是21个核苷酸(nt)。
高通量焦磷酸测序显示苍蝇体内存在3′末端修饰的21-nt RNA。(A类)表达反向重复序列(IR)的苍蝇头部总小RNA文库中小RNA序列的长度和序列组成白色基因和一个在其3′端修饰的RNA富集的平行文库。(B类)小RNA序列的相似分析果蝇属S2电池。对于标记为“无miRNA”的数据,通过计算删除前miRNA匹配序列。
我们对S2细胞的体细胞小RNA含量进行了表征(19)以及表达RNA发夹的头部沉默白色RNAi基因(20). 为了鉴定内siRNA候选基因,我们分析了两种类型的RNA文库。对于总共18至29个nt RNA文库,89%(S2细胞)和96%(头细胞)被定位到注释的miRNA基因座。相反,含有3′末端、2′的小RNA的文库丰富-哦-甲基化改性(21)miRNA缺失:只有19%(S2细胞)和49%(头)的读数和2.4%(S2细胞;58681个读数;12036个序列)和12%(头;22685个读数;2929个序列)的独特序列被定位到miRNA基因座。
显示了四个库的长度分布和序列组成。总RNA样本主要是miRNA,这一偏差反映在它们的模式长度(22nt)和从尿嘧啶开始的明显趋势上。排除miRNAs后,发现一类小RNA的长度分布较窄,没有以尿嘧啶开始的趋势。除了不寻常的X染色体小RNA簇(图S1)和在第2染色体上具有不寻常假定前体的miRNA-like序列(图S2)外,这些小RNA中很少有可能与新的miRNAs相对应:没有一个小RNA位于发夹臂中,预测其热力学稳定性与大多数前miRNAs(即<−15 kcal/mol)相同。
排除已知miRNAs后,64%(头)()和78%(S2细胞)()文库中富含3′末端修饰小RNA的序列,即那些可能与Ago2相关的21 nt长的序列。对于飞头,37%(8404次读取)来自白色dsRNA发夹。这些外源小RNA的丰度可以通过将其与总小RNA文库中单个miRNA的读取数进行比较来估算,其中1.6%(660个反义和491个正义读取)是21-nt寡聚体(21-mers),与白色dsRNA-表达转基因中的序列。所有人的集体富裕白色exo-siRNAs小于该样本中10个最丰富的miRNAs的个体丰度;任何一种外源siRNA物种的平均丰度为两读。这个白色–反向重复序列(IR)转基因现象复制了白色然而,最丰富的exo-siRNA序列只被读取了37次。
在头部,21-nt,3′-末端修饰的小RNA的序列组成与外源siRNA的序列构成非常相似,往往以胞嘧啶开始和结束。在头部和S2细胞中,21-mers缺乏piRNA的序列特征,piRNA要么以尿嘧啶(辅酶Piwi-bound)开始,要么在位置10(Ago3-bound)含有腺嘌呤,长度为23-29 nt(1,2). 这些数据表明,21-nt小RNA是体细胞内siRNA。
在S2细胞中,内siRNA主要定位于转座子(86%);在苍蝇头上,他们大致相等地映射到转座子、基因间和未标记序列以及mRNA。发现41%的内切siRNAs映射到mRNAs而没有映射到转座子,这表明内切siRNA可能调节mRNA的表达。内源性siRNAs映射到mRNAs的可能性比偶然预测的可能性大10倍以上(5.22×10−161<P(P)< 8 × 10−151)从注释为产生重叠互补转录物的基因组区域衍生(和表S1)。这些数据表明,这种重叠的互补转录物在体内退火形成dsRNA,然后切成内siRNA。我们注意到,在我们检测到互补21-mers的mRNA中前2自身。
表1
样品 | 丰富 | 随机化后的富集
| Z轴分数 | P(P) |
---|
| | 平均值 | 标准偏差 | | |
---|
苍蝇头 | 10.9 | 1 | 0.38 | 26.1 | 7.9 × 10−151 |
S2电池 | 12.3 | 1.1 | 0.42 | 27 | 5.2 × 10−161 |
内切siRNA映射到所有三条大染色体(图S3至S5)。与三种转座子类型相对应的siRNA果蝇属但长末端重复序列(LTR)逆转录转座子,即苍蝇中占主导地位的自私遗传元素,即使考虑到它们在基因组中的丰度,也出现了过度表达(和表S2)。与与转座子不成比例地反义的piRNAs不同,但与来自外源dsRNA的siRNAs一样,检测到大约等量的正义和反义转座子匹配的内切siRNA(和图S6)(1-三,22). 与piRNAs一样,内siRNAs也映射到大型基因组簇(表S3)。在S2细胞中的172个内siRNA簇中,有4个与先前确定的piRNA簇一致(簇1,位于2R染色体42A处;簇7和簇10位于未组装基因组序列中;簇15位于3L染色体异染色质中)。在头部,我们检测到17个簇;其中五个对应于S2细胞中发现的簇,但只有一个与生殖系piRNAs共享:弗拉门戈基因座,与最近的遗传证据一致,Piwi依赖于弗拉门戈-依赖性途径抑制Idefix公司和赞比亚体细胞中的转座子(23). 内siRNAs和piRNAs都可能产生于同一区域,这表明单个转录物可能是piRNA和siRNA产生的底物,或者不同类别的转录物产生于单个位点。单个转座子物种序列中内siRNA的丰度和分布反映了这些元素进入苍蝇基因组的自然历史,而不是它们的转座子机制() (24).
内siRNAs对应转座子。(A类)内siRNA序列基因组匹配注释的分布。Bars总数超过100%,因为一些siRNA既匹配LTR又匹配非LTR逆转录转座子,或者既匹配mRNA又匹配转座子。(B类)转座子衍生的siRNAs具有50个以上的21-nt读码,与正反义方向的映射大致相同。(C类)内切siRNA序列与果蝇属转座子。每个序列的丰度显示为所有转座子匹配siRNA序列的百分比。LTR,长末端重复;TIR,终端反向重复。在这里和随后的图中,对野生型头部的高通量焦磷酸测序和测序旁路合成数据进行了汇总。
观察到siRNA丰度在统计上显著降低dcr-2型L811fsX型对于38个转座子,相对于杂合兄弟姐妹的头部而言,为空的突变头部(图S7和表S4)。标准化测序深度,纯合测序结果dcr-2型与杂合的兄弟姐妹相比,突变体头产生的21个mers总数更少(增加了3.1倍),与转座子相对应的21个mers更少(增加了6.3倍)(P(P)< 2.2 × 10−16; χ2测试)。相比之下,miRNA总丰度与测序深度正常化,在dcr-2型杂合子和纯合子(图S7和表S5)。这些数据表明内源性siRNA是由Dcr-2产生的,但我们还不知道为什么一些内源性siRNAs在dcr-2型L811fsX型突变体。
体细胞中转座子的表达反映了转座子通过转录后和转录机制之一或两者潜在地沉默,以及转座子启动子的组织特异性。果蝇属体细胞可能含有靶向转座子的siRNA,即使没有这些siRNA也不会高表达,因为这些转座子的启动子在一些或所有体组织中不活跃,或者因为它们受到其他机制的抑制。我们分析了来自前2和dcr-2型突变体和通过RNAi去除Dcr-1、Dcr-2或Ago2的S2细胞(和图S8)。我们发现LTR逆转录转座子RNA的稳态丰度297和412增加了来自dcr-2型L811fsX型空突变体(). 同样,来自LTR反转录转座子的RNA的稳态丰度297、412、mdg1、和鲁奥,非LTR反转录转座子F元素和类正弦元素INE-1公司在中增加前2414突变体头部().
转座子沉默需要Dcr-2和Ago2,但不需要Dcr-1。(A类和B类)mRNA表达的变化(平均值±SD,N个=3)之间的每个转座子dcr-2型L811英尺X(A) 或ago2基因414(B) 用定量逆转录聚合酶链反应检测杂合和纯合头部。针对配对基因型之间转座子拷贝数的差异,对数据进行了校正。(C类)转座子表达的变化(平均值±SD,N个=3)在S2细胞中测量相对于对照dsRNA的RNAi耗竭。
在S2细胞中,LTR反转录转座子的RNA表达297、1731、mdg1、血液、和吉普赛人和DNA转座子S型元件均显著增加(0.00001<P(P)<0.002)当Dcr-2耗尽或Dcr-2和Dcr-1都耗尽时,但当仅Dcr-1耗尽时,则不会(). 同样,ago2(RNAi)S2细胞中设计的转座子,包括9个LTR和非LTR转座子以及DNA转座子S型元件(图S8)。
内源性siRNA的产生或积累是否需要Ago2?我们测序了来自前2414纯合子苍蝇头和来自相同小RNA样品的处理以富集3′末端修饰的RNA。在计算去除miRNAs后,未经处理的文库中的序列包含一个显著的21-nt峰()主要从尿嘧啶开始()与野生型头部中的miRNAs和siRNAs很相似,后者通常以胞嘧啶开始(). 也许在缺乏Ago2的情况下,只有能够结合Ago1的内源性siRNA亚群积累。来自前2414富含3′末端修饰序列的文库长度主要为24至27 nt,并且通常以尿嘧啶a长度分布和piRNAs的序列偏差特征开始,与siRNAs一样,其长度为2′-哦-3′端甲基化。细胞中的21-nt小RNA和piRNA-like RNA前2突变体头部映射到转座子、未标记的异色和未组装序列,但piRNA-like序列映射到mRNAs的频率远低于21-mers或野生型内切酶RNA(). 这些类似piRNA的小RNA是如何产生的,以及它们是否有助于苍蝇体内的转座子沉默,目前尚不清楚。
体细胞小RNA的组成在缺乏Ago2的情况下发生改变。(A类和B类)序列的大小分布(A)和序列组成(B前2空突变苍蝇或富集3′-末端修饰的RNA的文库。删除与前miRNA序列匹配的读取。(C类)二者小RNA序列基因组匹配的注释分布前2库。
证据中添加的注释:图S1和S2中描述的位点对应于最近在(25-27).