通过选择性剪接(AS)产生多种mRNA变体是蛋白质组多样性扩展的一种普遍机制,而受调控的AS在许多生理过程中发挥着重要作用(有关综述,请参阅参考文献4,5、和34). 然而,基于序列的预测表明,大约三分之一或更多的AS事件有可能引入提前终止密码子(PTC),该密码子可能针对非传感介导的mRNA衰变(NMD)的拼接转录产物(32). 虽然许多预测的PTC介导的AS事件似乎并不保守,也不受NMD的调节,但AS微阵列分析实验表明,当NMD受到干扰时,大约有10%到20%的这些事件显示出实质性变化(42). AS微阵列分析(40,42)从而为识别由AS-coupled NMD调控的新基因和功能过程以及大规模阐明这种基因调控模式的因子需求提供了基础。
在哺乳动物中,NMD通常是(6,35)取决于终止密码子下游的剪接事件。当终止密码子出现在最终剪接连接上游50到55个核苷酸以上时,通常被认为是过早终止密码子(39),通过沉积“标记”一个剪接后外显子连接复合体(EJC)(30). NMD被认为需要三个核心UPF因子,它们是酵母对人类保守的,即UPF1(也称为无义转录物1的调节器[RENT1])、UPF2(RENT2)和UPF3。在哺乳动物中,UPF2和两种UPF3相关蛋白之一UPF3和UPF3X(分别称为UPF3A和UPF3AB)通过EJC与剪接mRNA相关(23,29). UPF1是一种5′-3′解旋酶和RNA依赖性ATP酶(三)与UPF2和翻译释放因子相互作用(22). 其他保守的NMD因素包括(33)、SMG1(对生殖器1具有形态发生作用的抑制因子)、SMG5、SMG6和SMG7,它们与UPF1的调节磷酸化有关(综述见参考文献1,9、和21).
与UPF1、UPF2和UPF3作用于单一线性途径的初始遗传和生物化学证据一致,酵母微阵列分析研究(18,31)和果蝇单元格(46)揭示了当每个UPF因子失活或耗尽时,一组常见转录物的差异表达。相比之下,最近对人类细胞的研究提供了证据,证明NMD通路中依赖UPF1的替代分支独立于UPF2或UPF3X发挥作用(8,15). 然而,对AS偶联NMD的因子要求还不太清楚。
AS-coupled NMD调节的细胞功能范围也尚未完全阐明。有证据表明,AS偶联NMD在AS因子表达中具有自动调节作用(17,52,56),核糖体蛋白(11,12,37)和其他基因(14,20,27). 此外,在编码AS因子的基因中,包括剪接因子的hnRNP和SR家族成员,PTC介导的AS事件与高度保守的基因组序列相关,这意味着这些事件具有重要的调控作用(28,40).
在本研究中,我们扩展了AS微阵列分析的应用,以比较小干扰RNA(siRNA)介导的UPF1、UPF2和UPF3X基因敲除的效果。我们的结果表明,这些核心NMD因子对AS引起的PTC转录物的降解具有重叠但不同的影响,表明AS偶联NMD可能受不同UPF1依赖机制的调节。出乎意料的是,在含有AS-coupled NMD调节的外显子的功能多样的基因组中,有多个基因编码核心剪接体成分,包括snRNP-相关蛋白和剪接体组装因子。因此,我们的结果提供了证据,证明AS耦合NMD在拼接机制的调节中发挥了比以前想象的更广泛的作用。一致地,核心snRNP SmB/B′(SNRPB)或组装因子SPF30(SMNDC1)的表达影响来自相应基因的PTC相关变体的水平。因此,研究结果也提供了新的证据,表明除了在组成剪接中已经确立的作用外,核心剪接体蛋白也可以在AS的调节中发挥作用。
材料和方法
细胞培养、siRNA和质粒转染。
如前所述进行HeLa细胞培养和瞬时siRNA转染(42). 对照、UPF1、UPF2和UPF3X siRNA也如前所述(24). 对于瞬时蛋白过表达,使用Gateway LR Clonase II(Invitrogen)将来自人类ORFeome集合(开放生物系统)的编码SNRPB、SMNDC1和DDX42的cDNA克隆到pMT3989(Marcia Roy,M.Tyers实验室)。生成的N端标志三-根据制造商的说明,用Lipofectamine 2000(Invitrogen)或Fugene6(Roche Applied Science)将标记的构建物转染到HeLa细胞中。
RT-PCR分析和Western blotting。
反转录(RT)-PCR分析,使用对替代外显子两侧的构成外显子特异的引物(见图。)如前所述执行(42)如前所述,对UPF因子进行Western blotting(24). RT-PCR分析(见图。)用一个特异性引物对备选外显子进行检测,另一个引物对5′非翻译区或另一个编码外显子特异性检测,检测结果如下。使用10纳克输入的总细胞RNA(用RNeasy Mini试剂盒分离;Qiagen),并用QuantityOne(Bio-Rad)定量溴化乙锭染色带。用十二烷基硫酸钠-聚丙烯酰胺凝胶电泳分离放射免疫沉淀分析缓冲液中的总细胞蛋白裂解物。蛋白质印迹(见图。)以抗FlagM2(F3165;Sigma)或抗α-微管蛋白(T6074;Sigma-)作为负荷控制。
代表性RT-PCR分析显示UPF蛋白敲除对PTC诱导的替代外显子水平的影响。RT-PCR分析使用对替代外显子两侧的构成外显子特异的引物进行。所分析的RNA样本显示在通道上方,对应于转染了对照siRNA(−)或特定于所示UPF因子(+)的siRNA的细胞。每个凝胶右侧的箭头表示包含和跳过产品的预期尺寸。每个凝胶面板下方的色条显示了基因芯片(上部颜色)预测的敲除依赖性变化的定量,以及RT-PCR(下部颜色)测量的跳跃百分比。跳跃百分比的变化显示为与图中相同的色标。有关这些AS事件的详细信息,请参阅补充材料中的表S2(PTC-upon inclusion AS事件3、146、957、557、2315和2372;PTC-upon-skipping AS事件750、1268、76、188、1909和2914)。
SNRPB(也称为SmB/B′)或SMNDC1(也称为SPF30)过表达导致相应的含PTC(PTC+)的替代转录物水平增加。标记的SNRPB或SMNDC1在HeLa细胞中短暂过度表达,SNRPB(A,左上图)或SMNDC1A(A,右上图)的内源性PTC转录物用5′非翻译区或上游外显子特异的正向引物和PTC介导的选择性外显子特异性的反向引物通过RT-PCR扩增。SNRPB(A,左下面板)或SMNDC1(A,右下面板)的过度表达对SF1、TRA2A和SR140的保守PTC转录物的RT-PCR扩增没有相同程度的影响。另一个平行标记的剪接体相关蛋白(DDX42)的过度表达对SNRPB和SMNDC1转录物的水平几乎没有影响。(B) Western blot分析显示每个标记蛋白的表达(左,标记分子大小的近似值,单位为千道尔顿;右,箭头表示预期的蛋白大小)。数据是三种独立转染的代表性数据,RT-PCR分析一式三份。
微阵列设计和杂交。
在cDNA和表达序列标签(EST)序列中鉴定出盒式AS事件,并按前面所述进行筛选(41,43). 如前所述,设计了代表3055例人类AS事件(其中2923例是唯一的)的探头(19,43)并打印在22K微阵列上(安捷伦科技)。Cy3-和Cy5-标记的cDNA由poly(A)制备+通过荧光反转法复制RNA,并与先前描述的安捷伦微阵列杂交(19,43). 对于UPF1敲除,参考文献中描述的相同样本和微阵列数据42重新分析。
微阵列数据分析。
如前所述,对微阵列进行扫描,并对信号强度进行去趋势化和标准化(58). 用“选择性剪接阵列平台的生成模型”(GenASAP)算法确定微阵列上监测的替代外显子的相对包含水平(跳过百分比)和置信等级(48). 对于本研究,分析仅限于六个样本中至少两个样本(三个对照siRNA和三个敲除siRNA)中数据上半部分具有置信度的事件,代表微阵列上2923个独特AS事件中的1704个(见补充材料中的表S1)。
PTC引入AS事件的注释。
微阵列上基因的开放阅读框(ORF)信息是从UniGene中相应cDNA序列的标题行获得的(ftp://ftp.ncbi.nih.gov/repository/UniGene/). AS事件随后被分为如下类别(计数是针对整个阵列给出的,然后是括号中“可检测”事件的计数):在2171(1360)个映射到具有已知ORF的cDNA的独特事件中,434(249)个被排除在进一步的PTC分析之外,因为替代外显子位于,起始密码子或因为终止密码子不位于最后一个外显子。在剩余的1737(1111)个事件中,终止密码子被映射到与剪接连接相关的ORF序列。应用“50-核苷酸规则”后(39)735(495)例AS事件有潜在PTC。其中,282(164)例为PTC合并症事件,453(331)例PTC合并跳过症事件(另见参考文献42). 基因标识符、别名和基因本体注释(参见表和; 见补充材料中的表S2)是手动或通过SOURCE获得的(http://source.stanford.edu) (13)或基因/克隆ID转换器(38).
表1。
与RNA加工相关的基因中选择性PTC诱导AS事件一
NMD特征和RNA处理功能 | 基因名称/别名 | AS事件编号。 | 鼠标中保留AS? | 与PC重叠的核苷酸数量b条(上游/下游) |
---|
纳入后的PTC | | | | |
拼接体组件 | SMNDC1/SMNrp/SPF30型 | 2372 | | 150/69 |
Sm芯 | SNRPB/SmB/B′ | 957 | 是的 | 80/83 |
U1-snRNP组件 | SNRP70/U1-70K型 | 951 | 是的 | 120/75 |
U2 snRNP组件 | SF3B1/SF3B155/SAP155 | 3218 | 是的 | 150/150 |
第二步催化 | PRPF18/hPrp18 | 557 | | 150/125 |
其他RNA代谢 | EIF4A2型 | 909 | 是的 | 142/115 |
其他RNA-binding | RBM18型 | 2315 | | 120/134 |
| IVNS1ABP/NS1BP公司 | 三 | 是的 | 150/96 |
SR相关家庭 | TRA2A公司 | 146 | 是的 | 150/150 |
SR域包含 | BCLAF1/BTF公司 | 1624 | | 150/150 |
| LUC7L公司 | 879 | 是的 | 131/150 |
跳过时的PTC | | | | |
分支点识别 | SF1/ZNF162型 | 188 | 是的 | 150/124 |
U2 snRNP组件 | DDX42/SF3B125型 | 2914 | 是的 | 115/138 |
表2。
剪接体相关蛋白转录物中发现的保守、PTC介导的AS事件一
功能组和名称/别名 | 描述 | 纳入后的PTC | 跳过时的PTC |
---|
U1+U2 snRNP | | | |
SF3B1钢 | 剪接因子3b亚基1,155 kDa | X | |
三氟化硫 | 剪接因子3b,亚基3,130 kDa | X | |
SNRP70型 | 小核核糖核蛋白70-kDa多肽(RNP抗原) | X | |
SR140型 | U2-相关SR140蛋白 | X | X |
U11+U12 snRNP,C16ORF33 | U11/U12 snRNP 25K蛋白 | X | |
Sm、SNRPB | 小核核糖核蛋白多肽B和B1 | X | |
U2AF公司 | | | |
U2AF2/U2AF65 | U2小核RNA辅助因子2 | X | |
U2AF1L3型 | U2小核RNA辅助因子1样4 | X | |
死亡 | | | |
DDX17/第72页 | DEAD(Asp-Glu-Ala-Asp)盒多肽17 | X | |
DDX26B型 | DEAD/H(Asp-Glu-Ala-Asp/His)盒多肽26B | X | |
DDX39/Urh49型 | DEAD(Asp-Glu-Ala-Asp)盒多肽39 | X | X |
DDX46/Prpf5系列 | DEAD(Asp-Glu-Ala-Asp)盒多肽46 | X | |
DHX35型 | DEAH(Asp-Glu-Ala-His)盒多肽35 | | X |
DHX8/Prp22 | DEAH(Asp-Glu-Ala-His)盒多肽8 | | X |
CELF/CUG-BP公司 | | | |
布鲁诺4 | Bruno-like 4,RNA结合蛋白(果蝇) | X | X |
CUGBP1美元 | CUG三重重复序列,RNA-结合蛋白1 | | X |
CUGBP2美元 | CUG三重重复序列,RNA-结合蛋白2 | | X |
NOVA、NOVA1 | 神经肿瘤腹面抗原1 | X | |
时钟 | | | |
CLK1(时钟1) | CDC样激酶1 | | X |
时钟3 | CDC样激酶3 | | X |
时钟4 | CDC样激酶4 | X | X |
SR公司 | | | |
SFRS2/SRp30b型 | 剪接因子,富含精氨酸/丝氨酸2 | X | |
SFRS3/SRp20 | 剪接因子,富含精氨酸/丝氨酸3 | X | |
SFRS4/SRp75 | 剪接因子,富含精氨酸/丝氨酸4 | X | |
SFRS6/SRp55 | 剪接因子,富含精氨酸/丝氨酸6 | X | |
SFRS7/9G8 | 剪接因子,富含精氨酸/丝氨酸7,35 kDa | X | |
SFRS10/Tra2b型 | 剪接因子,富含精氨酸/丝氨酸10(Tra2同源物,果蝇) | | X |
SFRS11/第54页 | 剪接因子,富含精氨酸/丝氨酸11 | X | |
SFRS12/SRrp86 | 剪接因子,富含精氨酸/丝氨酸12 | X | |
hnRNP公司 | | | |
CIRBP公司 | 冷诱导RNA结合蛋白 | | X |
HNRPD/AUF1 | 异质核核糖核蛋白D/AUF1 | X | |
HNRPDL公司 | 异质核核糖核蛋白D样 | X | |
HNRPH1型 | 异构核核糖核蛋白H1(H) | | X |
HNRPLL公司 | 异质核核糖核蛋白L样 | X | |
高转速转速 | 异质核核糖核蛋白M | | X |
HNRPR公司 | 异质核核糖核蛋白R | X | X |
HNRPU/SAFA公司 | 异质核核糖核蛋白U | | X |
MSI2系列 | 武藏同源物2(果蝇) | X | |
第二个多年电价 | 髓鞘表达因子2 | | X |
PCBP3公司 | 聚(rC)结合蛋白3 | | X |
PTBP1型 | 多嘧啶束结合蛋白1 | | X |
PTBP2/nPTB | 多嘧啶束结合蛋白2 | | X |
RBM3型 | RNA-结合基序(RNP1,RRM)蛋白3 | X | X |
活塞杆1 | ROD1微分调节器1(葡萄裂殖酵母) | | X |
其他 | | | |
ACIN1号机组 | 凋亡染色质凝聚诱导剂1 | X | X |
ARS2号机组 | 砷酸盐抗性蛋白2 | | X |
C21或66 | GC-丰富序列DNA-结合因子候选 | | X |
CDC40/PRP17 | 细胞分裂周期40同源(酿酒酵母) | X | |
作物/LUC7A | 顺铂抵抗相关过度表达蛋白 | X | X |
CTNNBL1/NAP公司 | 类β连环蛋白1 | X | |
DNAJC8/SPF31 | DnaJ(Hsp40)同系物,C亚家族,成员8 | | X |
ET/MFSD11 | 主要促进者超家族结构域包含11 | X | |
FUBP3型 | 远上游元件(FUSE)-结合蛋白3 | | X |
保险丝 | 融合[参与恶性脂肪肉瘤的t(12;16)] | | X |
ILF3/DRBF | 白细胞介素增强因子3,90 kDa | | X |
科威特航空1429 | 科威特航空1429 | | X |
PPIL2 | 肽基脯氨酸异构酶(亲环素)样2 | | X |
PRPF18型 | PRP18前mRNA处理因子18同源物(酿酒酵母) | X | |
RBM15型 | RNA结合基序蛋白15 | X | |
RBM5型 | RNA结合基序蛋白5 | X | X |
RDBP公司 | RD RNA结合蛋白 | X | X |
SF1气体 | 拼接系数1 | X | X |
SIAHBP1/PUF60 | 聚(U)-结合拼接因子,60 kDa | | X |
SSB/拉丁美洲 | 干燥综合征抗原B(自身抗原La) | | X |
塔夫15 | TATA盒结合蛋白(TBP)相关因子,68kDa | X | X |
TCERG1/CA150型 | 转录延伸调节因子1 | X | |
TIA1公司 | TIA1细胞毒性颗粒相关RNA结合蛋白 | X | X |
侧翼内含子序列和保守AS的保守性分析。
通过将外显子序列与人类基因组对齐(2006年3月加州大学圣克鲁斯分校hg18组装,基因组浏览器,网址:http://genome.ucsc.edu/)使用BLASTN。相位cons算法识别的保守元素(49)从加州大学圣克鲁斯分校的人类基因组浏览器“phastConsElements17way”表中检索到“17路最保守”轨道(25). 侧翼内含子序列与这些元素的重叠是通过Galaxy web应用程序确定的(16). 如前所述,确定小鼠EST中AS事件的保守性(43).
剪接体和控制基因组中AS事件的鉴定。
剪接体相关蛋白精选列表的单基因标识符(2)使用MatchMiner检索到(7)或手动。为每个剪接体相关因子生成“控制”基因集n个Unigene簇中的序列n个对序列进行分组。然后从该组中随机选择一个与剪接体因子相关的簇之外的簇作为对照组(如果没有发现其他此类簇,则从下一组中n个+1序列)。如前所述,对磁带AS事件进行了挖掘(41,43)和PTC的注释如上文和参考中所述42.
统计分析。
微阵列AS事件通过与相位子元素的重叠和UPF依赖性进行分类(见图。). Fisher精确检验用于确定这两组是否独立。该测试还用于比较AS事件集,这些事件集显示出对一个或另一个UPF因子的显著依赖性(参见补充材料中的图S1)。基因剪接体组和对照组的AS事件按保守性和PTC状态分类(见图。),并使用chi-square检验来测试这些分组是否独立。数字(n个)结果和/或适当的图形图例中给出了每种情况下考虑的AS事件。
显示UPF1或UPF2依赖性内含物水平变化(至少5%差异)的PTC-无内含物替代外显子通常由高度保守的内含子序列(*1,P(P)= 2·10−4; *2,P(P)= 3·10−2Fisher精确试验;将星号标记的比例与总组的比例进行比较(全部))。堆叠条形图显示了重叠(黑色)或不重叠(白色)进化保守序列的PTC-无融合AS事件的比例,如phastCons算法所确定的(49). 重叠要求交替外显子两侧上游和下游内含子序列的前50个核苷酸中至少有35个重叠相控子元件。“All”表示所有可检测到的PTC无包含事件(n个=164),“KD”表示PTC-无包含事件,在指示方向上至少有5%的差异(更多包含或更多跳过)和击倒(UPF1KD更多包含,n个= 46; UPF2KD更具包容性,n个= 16).
剪接体蛋白基因中的保守AS事件比来自对照组的基因中的事件更容易引入PTC(比较用星号标记的比例;P(P)= 3·10−3,方格试验)。保守的AS事件要么具有侧翼内含子重叠(≥35个核苷酸)的相控子保守元件,要么根据cDNAs/EST分析在小鼠中保守。PTC介导的AS事件在剪接体蛋白集中也往往比非剪接体更保守(比较以闭合圆圈标记的比例)。具有一个以上相同类型的AS事件(PTC引入或非PTC引入)的基因只计数一次。
结果
NMD因子UPF1、UPF2和UPF3X的单独敲除对PTC诱导的AS事件产生重叠但不同的影响。
为了评估AS-coupled NMD中三个核心UPF蛋白UPF1、UPF2和UPF3X的相对需求,我们用转染siRNA分别敲除HeLa细胞中的这些因子,这些siRNA已被鉴定和报道为特异有效靶向这些因子(24). 用UPF1、UPF2或UPF3X特异性抗体检测转染UPF因子特异性siRNA或对照siRNA的HeLa细胞裂解物的Western blot分析(图。; 另请参见图。参考42). 根据敲除(右面板)和对照siRNA-处理细胞(左面板)系列稀释液中UPF蛋白水平的比较,UPF1、UPF2和UPF3X的敲除水平估计为相应对照裂解液中检测到的蛋白水平的~5%到30%。
UPF蛋白敲除对PTC诱导AS事件的重叠但不同的影响。(A) siRNA-介导的UPF因子敲除后HeLa细胞裂解物的Western blot分析。用UPF2-或UPF3特异性抗体(上图)和用calnexin-或β-肌动蛋白特异性抗体作为负载对照(下图)探测蛋白质印迹。左面板显示了对照裂解物的连续三倍稀释。相对于对照siRNA处理,靶向siRNA处理后的敲除效率的估计显示在凝胶下方(右图)。关于显示UPF1敲除的Western blot分析,参见参考文献42(B)对于AS事件,显示了选择性外显子包含水平的变化(跳过百分比),这些事件在包含时(左侧面板)或跳过时(右侧面板)引入PTC。跳跃百分比的变化由所示的青-黑-黄色标表示,并针对每个AS事件计算为UPF1、UPF2或UPF3X敲除中的跳跃百分比减去相应控制siRNA处理中相同AS事件的跳跃百分比。显示了在UPF1击倒时我们检测到跳过百分比至少有5%变化的事件,并根据三次击倒中跳过百分比变化的中位数对行进行排序。
然后我们使用定量AS微阵列分析(42,43,48)与转染对照siRNA的细胞相比,检测转染UPF因子特异性siRNAs的细胞中AS模式的变化。将荧光标记的cDNA与含有外显子体和剪接连接探针组的定制微阵列杂交,以监测从EST和cDNA序列比对中挖掘的大约3000个人类盒式替代外显子的内含水平。这些AS事件被映射到ORF,以确定它们是否有可能因其包含(在包含时称为PTC)或跳过(在跳过时称为PT)而在转录本中引入PTC。当排除的外显子导致移码和下游PTC的引入时,就会发生PTC-隐式事件,而当终止密码子位于插入外显子内或由于移码而引入下游PTC时,就会出现PTC-显式事件。PTC-upon-inclusion和PTC-upn-skipping组分别占描述的AS事件的15%和30%,对于这些事件,有足够的ORF信息可用于绘制PTC图,并且也符合我们的检测标准(事件总数=1111[见材料和方法])。
我们之前报道过,PTC诱导的替代外显子在替代外显体中过度表达,显示UPF1敲除后内含物水平发生变化(42). 外显子内含物水平的这些变化导致大约90%的此类病例中含有PTC的剪接变异体的丰度增加,与NMD活性的丧失一致。在本研究中,我们首先检测了敲除UPF2或UPF3X对PTC诱导的替代外显子的内含物水平的影响,在UPF1敲除后,这些外显子在内含物水平上显示出至少5%的变化(图。). 对于所示的每个事件,每个UPF因子敲除中的外显子跳跃水平百分比与相应对照样品中的水平之间的差异用色标表示,其中,亮黄色表示包含外显子的剪接变体的相对丰度增加,亮青色表示跳过剪接变体相对丰度的增加。
在比较UPF1、UPF2和UPF3X基因敲除的效果时(图。),我们发现,受任何一次击倒事件影响的AS事件发生的可能性大大高于偶然发生的预期(P(P)< 2·10−12Fisher精确试验;参见补充材料中的图S1),受到其他两个因素中任意一个因素的类似影响(更多跳过或更多包含)。仅考虑PTC引发的AS事件时,获得了类似的结果(参见补充材料中的图S2)。在比较任何一对击倒事件时,受类似影响的AS事件子集中,平均约有一半(最低26%,最高86%)也受到第三次击倒事件的类似影响(参见补充材料中的图S1;数据未显示)。然而,尽管我们观察到受成对敲除影响的AS事件之间有显著的重叠,在所有三个敲除中都有不同比例的敲除受到影响,但一些事件似乎只受到两个敲除的显著影响(例如,UPF1和UPF3X敲除或UPF1和UPF2敲除),其他事件仅在UPF1被击倒时才显示出明显的影响(参见补充材料中的图S1和S2)。
通过RT-PCR分析验证了对UPF蛋白敲除的不同和重叠效应的微阵列预测,该分析使用了PTC导入外显子两侧构成外显子序列的特异性引物。图中显示了在三个UPF敲除和相应控制中分析的12个AS事件(共128个)的代表性RT-PCR数据。RT-PCR分析测得的外显子跳跃百分比与微阵列数据非常吻合(R(右)2=0.8至0.9;参见补充材料中的图S3)。对于基因芯片数据预测的敲除依赖性AS水平变化在外显子包含水平上至少有5%的差异,RT-PCR分析显示83%的受试病例发生了相同方向的变化(参见补充材料中的图S3)。对于与图中的微阵列数据相对应的较大RT-PCR分析子集的量化。,参见补充材料中的图S4和表S2。尽管在UPF1被敲除时比在UPF2或UPF3X被敲除时更经常观察到跳跃百分比的显著变化,对于PTC在被包含或PTC在跳过事件时,重要的是要注意,对于三个敲除,非PTC引入AS事件的变化频率相似(见图。补充材料中的S5),对于AS事件的子集,观察到UPF2或UPF3X的变化比UPF1击倒时更为明显(参见补充材料中图S1和S2)。此外,在UPF1和UPF3X敲除中,所有微阵列分析事件中显著AS水平变化的总体频率相似,而在UPF2敲除中仅略低(见图补充材料中的S1和S5)。这些结果提供了证据,证明AS-coupled NMD对核心UPF蛋白具有不同依赖性,并且由于这三个因子的siRNA敲除效率可能存在差异,因此不太可能存在这些差异依赖性。
受UPF敲除影响的PTC介导的AS事件通常由高度保守的序列旁侧。
物种间序列元件的保守性通常与保护功能的选择压力有关,而受调控的选择性外显子通常与保守的侧翼内含子序列有关(50,51,57). 因此,为了确定最可能与保守基因调控功能相关的PTC介导的AS事件,我们测量了PTC外显子侧翼内含子之间的关联,这些内含子显示了UPF因子依赖性内含物水平和保守序列元件的变化。我们的阵列上代表的替代外显子与人类基因组序列对齐,并确定了上游和下游侧翼内含子序列(50或150个核苷酸)的坐标。然后,我们计算了与phastCons算法检测到的保守元素重叠的核苷酸比例(49). 在这项分析中,我们评分与phastCons算法确定的最保守的序列元素重叠,该算法是从17个物种的基因组序列比对中得出的。我们观察到,PTC-无内含子替代外显子两侧的内含子中与这些相控子元件重叠的数量在统计学上显著增加,这些内含子显示UPF1敲除依赖性的相对丰度增加(35%与相控子重叠,n个=46),与所有PTC无内含子外显子相比(16%的相控子重叠,n个= 164;P(P)= 2·10−4,Fisher精确测试[图。]). 同样,PTC-内含子外显子UPF2依赖组侧翼内含子中与相控子元件重叠的显著富集(38%与相控核重叠,n个=16)已观察到(P(P)=0.03[图。]). 然而,在UPF3X依赖性事件中没有观察到这种富集。经验累积分布函数图中也显示了PTC-包含备选外显子侧翼内含子序列的保守性水平差异,这些外显子在跳跃百分比方面表现出UPF蛋白敲除依赖性变化(参见补充材料中的图S6)。
一些在AS水平上显示UPF敲除依赖性变化的PTC-桥接替代外显子也与相位保守元件重叠(表; 见补充材料中的表S2和图S4);然而,没有观察到统计学上显著的富集(数据未显示)。在AS事件中也观察到相控核元素的一些富集,这些事件在UPF2或UPF3X被击倒后跳跃增加,但没有引入PTC(参见补充材料中的图S7)。需要进一步实验来确定这些影响是否与NMD有关。总之,上述分析表明,由一个或多个UPF蛋白调节的大量PTC介导的AS事件,尤其是PTC-包合类蛋白,具有侧翼内含子,这些内含子与高度保守的序列重叠。这一观察表明,这些AS事件及其相关的侧翼内含子序列可能具有重要的调控作用。
AS耦合NMD的新监管目标。
我们检查了PTC诱导AS事件的基因所代表的功能列表,这些事件显示UPF因子敲除依赖于跳跃百分比的变化(图。). 在由保守序列侧翼的子集中(图。; 参见补充材料中的图S4)是位于RNA加工相关功能基因转录本中的13个AS事件(表). 其他如AS事件位于代表一系列其他细胞功能的基因中,包括核苷酸代谢(如NT5C3基因)、信号传递(如RAB5A基因)和sumoylation(如SENP1基因)(有关其他示例,请参阅补充材料中的表S3)。令人惊讶的是,除了最近与保守PTC引入事件相关的AS调节因子,如SR和hnRNP蛋白(28,40)在核心剪接体成分中发现调控PTC诱导AS事件。该列表中有编码U1 snRNP特异性70kDa蛋白(U170K)和常见snRNP Sm蛋白SmB/B′(SNRPB)的基因,以及其他参与剪接体形成的基因(SF1、PRPF18和SMNDC1基因)[表]). 与PTC诱导AS事件在这些基因中的保守调节作用相一致,PTC诱导的AS事件通过检测与相连接元件的重叠而暗示,大多数AS事件也在小鼠EST的比对中检测到(表). 此外,至少在一个UPF因子敲除中通过RT-PCR分析验证了这些外显子相对内含物水平的微阵列预测变化(图。; 参见补充材料中的图S4和表S2)。
通过在核心剪接体组分的基因中识别保守的、UPF调节的、PTC介导的AS事件,我们研究了此类事件是否是编码剪接体因子的基因的更普遍特征,包括在AS微阵列上没有表示的剪接体因素基因。为此,我们从EST/cDNA数据中计算挖掘了PTC导入和非PTC导入盒式AS事件,这些事件代表了(2)253个编码剪接体相关蛋白和其他剪接因子的基因列表。为了进行比较,还并行分析了一组EST覆盖率相似的非重叠体相关Unigene簇。我们在剪接体相关数据集中的149个Unigene簇中确定了443个AS事件(见补充材料中的表S4),在对照数据集中的161个Unigene簇中确认了547个AS事件。两组患者每个基因的AS事件分布相似(数据未显示),每个基因的平均AS事件数为两次。这些转录物的可用序列信息可以解释剪接体和对照基因组中73%和74%的AS事件是PTC引入还是非PTC引入。
我们的微阵列结果表明,在HeLa细胞中受UPF因子敲除影响的PTC包含的AS转录物通常由保守序列侧翼(图。)许多研究表明基于EST的小鼠具有保守性(表). 针对从剪接体和对照Unigene簇中挖掘的AS事件,评估了这些特征。如上所述,对于微阵列事件,我们计算了与相控子元素重叠的人类选择性剪接外显子侧翼的150个内含子序列核苷酸的比例。同时,我们挖掘小鼠EST来评估小鼠中哪些人类AS事件是“保守的”。根据EST/cDNA序列的分析,我们发现在AS事件中显示侧翼内含子序列和/或保守(n个=84和n个剪接体组和对照组分别为54),两组间PTC导入和非PTC导入AS事件的分布存在显著差异,剪接体中PTC导入事件的比例高于对照组(分别为71%和46%,P(P)= 3·10−3,方形试验[图。]). 有关剪接体组和对照组中替代外显子两侧内含子中保守序列元素分布的差异,另请参见补充材料中的图S8。此外,在剪接体组中,保守组PTC介导的AS事件的比例高于非保守组(分别为71%和61%[图。]). 尽管基因子集包含不止一种AS事件类型(PTC类别),但从分析中删除这些基因时,也获得了类似的结果(数据未显示)。AS因子包括SR和hnRNP蛋白,它们以前与保守的PTC介导的AS事件相关(28,40)我们的分析也确定了) . 然而,这些并不能解释剪接体基因中保守的PTC诱导事件的全部富集,当删除这些基因时也获得了类似的结果(数据未显示)。因此,在编码剪接体蛋白和其他剪接因子的基因中,有一些以前不知道与AS偶联NMD相关的例子(表). 此外,保守的PTC引入AS事件与编码这些剪接体因子的基因的关联表明,这些AS事件发挥着重要的调节作用。
通过AS耦合NMD自动调节纤芯拼接因子。
先前的研究表明,几种AS调节因子,如SR和hnRNP蛋白,可以通过AS偶联的NMD自动调节其表达水平(见引言)。然而,核心剪接体蛋白的这种功能以前还没有建立。核心剪接体因子中保守的、PTC介导的替代外显子的鉴定表明,这些蛋白质的水平可能受到自身调节。因此,我们测试了SNRPB或SMNDC1表达增加对PTC诱导外显子在其各自转录物中的内含水平的影响。编码这些蛋白质的Flag表位标记版本的载体,以及作为对照的亲本载体或编码Flag抗原表位标记的U2 snRNP-相关蛋白DDX42的载体(54)瞬时转染HeLa细胞。RT-PCR分析使用专为扩增内源性含PTC剪接变体而设计的引物对进行(图。). 获得了三种Flag表位标记蛋白的可比表达水平(图。). SNRPB和SMNDC1的表达增加导致可复制的(在三个独立实验中观察到)PTC相关剪接变异体转录本的水平大约增加了两倍,该转录本由选择性外显子包含引起,特别是在SNRPB与SMNDC1转录本中(图。). 相反,DDX42的平行过表达对包含外显子的转录水平影响相对较小。SNRPB或SMNDC1的过度表达对来自其他脾相关基因(SF1、TRA2A和SR140基因)的PTC转录物水平的影响也较小(图。). 因此,人为增加SNRPB或SMNDC1蛋白的量会导致内源性PTC含量增加,包括SNRPB和SMNDC1转录物在内的其他外显子也会增加。因此,这些结果与通过AS-coupled NMD自动调节这些因子的表达水平一致。然而,还需要进一步的实验来确定这种自动调节是通过直接还是间接机制发生的。
讨论
通过定量AS微阵列分析,我们比较了单独敲除三个核心NMD因子UPF1、UPF2和UPF3X对引入或不引入PTC的替代外显子的内含水平的影响。在对这些因素的敲除效果进行两两比较时,发现PTC诱导的AS事件之间存在显著重叠,这些事件显示了内含物水平的变化。此外,受任何两次击倒事件影响的AS事件中有很大一部分(平均约50%)也受到第三次击倒的影响。这种对具有重叠UPF蛋白需求的AS事件的富集在许多情况下与这些因素在共同途径中的操作一致。然而,至少三分之一的PTC诱导的AS事件在不同的敲除中显示出不同的效果,许多UPF1依赖性事件显示出对UPF2和/或UPF3X几乎没有可检测的依赖性。通过半定量RT-PCR分析,以较高的速率验证了PTC诱导的AS事件,这些事件显示了UPF蛋白需求的共同性和差异性。因此,我们的结果表明,AS-coupled NMD可能对UPF蛋白有不同的需求,并且可能通过NMD途径的一个以上UPF1依赖分支发生。此外,我们所描述的大多数含有PTC引入外显子的基因,显示UPF蛋白依赖性内含物水平的变化,以前并不知道它们会受到AS偶联的NMD的调节。特别令人感兴趣的是,一些核心snRNP和其他一般剪接体蛋白都在这个列表中,并且在过度表达时,至少测试的那些因子可以影响其自身转录物的AS。这一观察结果支持了先前的发现(10,44,45)(见下文)剪接体的核心成分除了在组成剪接中的既定作用外,还可以参与AS的调控。总之,我们的结果提供了关于AS-coupled NMD因子需求的新信息,以及许多有趣的AS-coubled NMD示例,还揭示了核心剪接体蛋白可以自动调节其表达水平。
哺乳动物NMD途径的替代分支。
越来越多的证据表明,NMD途径有多个分支,对EJC和UPF蛋白有不同的要求(8,15). 将不同EJC蛋白连接到报告转录物的实验,结合UPF1或UPF2的siRNA敲除,最初表明NMD途径存在UPF2依赖性分支(15). 传统微阵列分析研究的结果表明,一些内源性转录物在敲除UPF1后显示出改变的稳态水平(36)不受UPF2影响(55)或UPF3X(8). 然而,在大多数情况下,敲除不同UPF蛋白的差异效应与受影响转录物的PTC状态之间的关系尚不清楚。我们的结果通过将不同NMD蛋白的敲除效应与AS产生的含有PTC的特异性转录物联系起来,扩展了这些先前的研究,并揭示了核心UPF蛋白对含有PTC的剪接变异体的降解具有重叠但不同的影响。
UPF1和UPF2都由独特的基因编码,而UPF3X(也叫UPF3B)和UPF3(也叫UPF3A)是同源基因。这就提出了一个问题,即UPF3X独立的NMD是否可能是由于UPF3可能存在冗余功能。虽然我们尚未具体测试这种可能性,但根据之前的研究,我们认为这些蛋白质之间的功能冗余在解释我们观察到的影响方面最多只能发挥有限的作用。尽管氨基酸序列的同源性和相似性分别为42%和60%(47)两者都与剪接mRNA相关(23),UPF3X和UPF3具有不同的C末端区域,通过系链UPF3X激活NMD比通过系链UPF3更有效,并且需要不同的因素(26). 此外,在上述微阵列分析研究中验证的大多数UPF3X非依赖性靶点不受UPF3单独或与UPF3X联合敲除的影响(8). 然而,在AS耦合NMD中,这些因素之间可能存在一定程度的冗余效应。此外,由于发现与X连锁精神发育迟滞相关的截断突变可以通过NMD消除UPF3X的表达,因此UPF3X可能在NMD中具有部分冗余功能(53).
AS偶联NMD和核心剪接体蛋白的调控。
关于基因调控的一个重要问题是,在不同的细胞类型和不同的生长条件下,剪接体的成分是如何在适当的水平上进行调控的。出乎意料的是,我们从微阵列分析得到的初步结果显示,AS-coupled NMD可能参与核心剪接体成分或组装因子的调控。我们最初从剪接体组分或组装因子基因子集的转录物中鉴定出PTC诱导的替代外显子(表)其中一些在小鼠中保守,所有这些都对UPF1的敲除以及在某些情况下UPF2和/或UPF3X的敲除作出反应。此外,这些UPF蛋白反应剪接变异体的外显子两侧存在高度保守的内含子序列,也表明其具有重要的调控作用。在我们分析的示例中(图。),每个剪接体蛋白的过度表达影响了由其相应基因产生的含PTC的剪接变体的水平,表明这些核心剪接体蛋白质具有自我调节功能。
由于我们的微阵列不能代表剪接因子基因中的一组完整的AS事件,因此我们对剪接体因子基因列表中的AS事件进行了计算搜索,该列表基于支持剪接体复合体功能或物理关联的实验证据(2). 值得注意的是,我们发现这些基因中显著富集了保守的PTC诱导AS事件,即使排除了以前确定的调控剪接因子基因与PTC诱导的AS事件的例子。因此,这些结果显著扩展了最近在编码SR和hnRNP家族定义AS因子的基因的高度保守区域中UPF1依赖性PTC诱导AS事件的鉴定(28,40). 除了提供可能也受AS-coupled NMD调控的剪接体蛋白的广泛列表外,本研究中的实验还提供了证据,证明其中一些蛋白的表达增加可以激活自身调节机制。
我们的结果表明,参与核心剪接体形成的蛋白质受到AS偶联NMD的调控,这些蛋白质在自动调节环中的关联结果扩展了先前的发现,即“基本”剪接机制的成分可以在AS的调控中发挥作用。例如,先前的微阵列分析研究表明,含有各种核心剪接成分突变或缺失的酵母菌株在内含子保留方面表现出转录特异性效应(10,45). AS调节因子的RNA干扰筛选显示果蝇细胞导致转录特异性AS效应(44). 在这些因子中,SPF30是人类SMNDC1的直系同源基因,我们已经证明它包含一个受UPF1调节的保守的PTC导入替代外显子,当过度表达影响其PTC包含转录物的水平时(表和图。). 在这方面,虽然我们的结果指出了核心剪接体蛋白通过NMD发挥的自我调节功能,但考虑到这些蛋白质和其他蛋白质可以调节额外的剪接事件,包括例如与其他剪接因子相关的AS偶联NMD事件,也很有意思。这种自动和交叉调节可以提供一种重要机制,确保构成核心剪接机制的蛋白质的适当绝对和相对水平。