跳到主要内容
访问密钥 NCBI主页 MyNCBI主页 主要内容 主导航
基因组研究。2007年2月;17(2): 156–165.
数字对象标识:10.1101/gr.5532707
预防性维修识别码:项目经理1781347
PMID:17210931

内含子中广泛发生的mRNA多聚腺苷酸化事件表明多聚腺苷酸化和剪接之间的动态相互作用

摘要

mRNA多聚腺苷化和前mRNA剪接是大多数人类mRNA成熟的两个基本步骤。研究表明,一些基因产生涉及选择性多聚腺苷化和选择性剪接的mRNA变体。内含子中的多聚腺苷化可导致内部外显子转换为3′末端外显子,称为复合末端外显器,或使用3′末端的外显子而被跳过,称为跳过末端外显。利用cDNA/EST和基因组序列,我们确定了所有已知人类基因内含子中的多聚腺苷酸化位点。我们发现,~20%的人类基因至少有一个内含子多聚腺苷化事件,可能导致mRNA变异,其中大多数编码不同的蛋白质产物。小鼠和大鼠基因组中人类内含子poly(A)位点的保守性低于3′-大多数外显子中poly(A)位点的保守性。对内含子聚(a)位点产生的许多信使核糖核酸变体的定量分析表明,对于大多数基因来说,内含子聚腺苷酸化活性在不同的细胞条件下可能会有所不同。此外,我们发现弱的5′剪接位点和大的内含子大小是控制复合末端外显子poly(A)位点使用的决定因素,而跳过的末端外显基因poly(A)位点往往与强聚腺苷化信号有关。因此,我们的数据表明,多聚腺苷酸化和剪接之间的动态相互作用导致内含子中广泛的多聚腺苷酸化,并导致细胞中转录组的复杂性。

mRNA的成熟涉及多个加工步骤,包括加盖、剪接和多聚腺苷化(Proudfoot等人,2002年). 拼接和聚腺苷酸化分别负责去除内含子和添加聚(A)尾。从前mRNA中剪接内含子的基本信号包括顺式5′剪接位点(5′ss)、3′剪接部位(3′ss)和内含子支点部位的元件(Burge等人,1999年). 剪接包括两个步骤:首先,5′ss在分支点被腺苷的2′OH攻击,产生一个带有游离3′OH的5′外显子和一个由内含子和3′外显体组成的lariat;其次,5′外显子的3′OH通过酯交换反应与3′外显子的3′ss连接,从而释放出落叶松。剪接反应涉及一系列蛋白质和RNA,包括几个小核RNA(snRNAs)及其相关蛋白,它们形成小核核糖核蛋白(snRNPs)。剪接调控因子包括各种SR(富含丝氨酸和精氨酸)蛋白质和hnRNP(异质核核糖核蛋白)蛋白质(Jurica和Moore 2003年). 此外,一些顺式位于外显子和内含子的元件在剪接中起增强或抑制作用(拉德和库珀2002). 选择性剪接发生在约40%–60%的人类基因中,导致人类基因组的功能复杂性(Modrek和Lee 2002).

mRNA聚腺苷化是一个两步反应(Colgan和Manley 1997年;埃德蒙兹2002)涉及多聚腺苷化位点(poly(a)位点)的特异性内切核裂解和随后腺苷尾部的聚合。哺乳动物中参与多聚腺苷酸化反应的蛋白质包括裂解和多聚腺苷酸化特异性因子(CPSF)、裂解刺激因子(CstF)、裂解因子CF I和CF II以及聚(A)聚合酶(PAP)。围绕poly(A)位点的序列,在本文中称为poly(A)区域,包含各种c多聚腺苷化的元件,包括上游多聚腺苷酸化信号(PAS),如AAUAAA、AUUAAA和其他六聚体变体(Beaudo等人,2000年;Tian等人,2005年)和下游富铀元素和富GU元素(Zhao等人,1999年). 此外,许多辅助元素被建议或证明在调节聚腺苷酸化中发挥作用(Hu等人,2005年以及其中的参考)。最近,在真核细胞中发现了另一种类型的RNA多聚腺苷酸化过程,它涉及一组不同的蛋白质,并与细胞核中的RNA降解有关(LaCava等人,2005年;West等人,2006年). 超过一半的人类基因具有多个poly(A)位点,可能导致转录物编码不同的蛋白质产物和/或具有可变的3′非翻译区(3′UTR)(Tian等人,2005年;Yan和Marr 2005年).

越来越多的证据表明剪接和聚腺苷酸化是协同转录发生的耦合事件(Proudfoot等人,2002年). 首先,许多人类基因具有mRNA变体,其产生涉及选择性剪接和选择性聚腺苷酸化。例如,免疫球蛋白M(免疫球蛋白)重链基因在内含子中有一个poly(a)位点,导致在B细胞发育的不同阶段有差异表达的mRNA变体。多聚腺苷酸化和剪接活性都被发现负责调节免疫球蛋白重链基因(Edwards-Gilbert和Milcarek 1995年;Takagaki等人,1996年;Bruce等人,2003年). 另一个被广泛研究的病例是降钙素/降钙素基因相关肽基因(CALCA公司),其中内含子poly(A)位点的使用由剪接因子SRp20以组织特异的方式调节,以产生mRNA变体(Lou等人,1998年). 此外,许多研究表明,剪接的扰动可以影响聚腺苷化,反之亦然(Niwa and Berget 1991年;Nesic和Maquat 1994;库克等人,1999年). 其次,一些剪接因子被证明可以调节多聚腺苷化,例如U1A、U1 70、PTB、SRp20和p54nrb(Gunderson等人,1994年;Lutz等人,1996年;Lou等人,1998年;Moreira等人,1998年;Liang和Lutz 2006)以及多聚腺苷化和剪接因子之间的一些蛋白质-蛋白质相互作用已被报道,例如U1-snRNP与CF-Im(阿瓦西和阿尔文2003),带U2 snRNP的CPSF(Kyburz等人,2006年)和带CF Im的U2AF 65(Millevoi等人,2006年)这表明这两个过程之间存在机械相互作用。第三,剪接和多聚腺苷化因子与RNA聚合酶II的C末端结构域(CTD)广泛相互作用(Hirose和Manley 2000;Proudfoot等人,2002年;Kaneko和Manley 2005),在转录的各个阶段,即起始、延伸和终止中起关键作用,表明剪接和聚腺苷化之间存在时间和空间协调。

在目前的工作中,我们系统地研究了内含子中的多聚腺苷化事件,类似于免疫球蛋白重型链条和CALCA公司基因。我们将内含子poly(A)位点定义为位于基因最外显子3′的上游,并在该基因的一些转录物中剪接出来的位点。内含子聚(A)位点可分为两种类型(图1A):其用法导致内部外显子转换为3′末端外显子的人,例如免疫球蛋白重链基因,以及另一个使用导致包含其他跳过的外显子的基因,例如CALCA公司与这些类型相关的外显子分别称为复合末端外显子和跳过末端外显基因,如Edwards-Gilbert等人(1997)Zhao等人(1999)为了简单起见,我们将与这两种外显子相关的poly(A)位点分别称为复合外显子poly(A)位点和跳过外显子poly(A)部位。使用cDNA/EST和基因组序列,我们发现约20%的人类基因至少有一个内含子包含poly(A)位点。发现复合外显子poly(A)位点多于跳过外显子聚(A)部位。内含子聚腺苷化可导致不同的mRNA和蛋白质产物。通过人类与小鼠和人类与大鼠的全基因组比对,我们发现10%的人类内含子poly(A)位点在啮齿动物基因组中是保守的,而51%的3′-大多数poly。保守的内含子poly(A)位点与强于非保守位点的多聚腺苷化信号相关。对内含子多聚腺苷酸化产生的mRNA变体表达的定量分析表明,对于大多数基因,内含子多聚腺苷酸化活性在细胞类型之间存在差异。此外,我们发现弱的5′剪接位点和大的内含子大小是复合外显子poly(A)位点使用的决定因素,而跳过外显子聚(A)位置与强的聚腺苷酸化信号有关。总之,我们的数据表明剪接和多聚腺苷化之间的动态相互作用导致人类基因组中广泛的内含子多聚腺苷酸化事件,并导致细胞中转录组的复杂性。

保存图片、插图等的外部文件。对象名为156fig1.jpg

人类基因中的内含子聚(A)位点。()位于不同类型外显子中的poly(A)位点示意图,即复合末端外显子、跳过末端外显器和3′-最外显子。5′ss表示5′拼接位点;pA,poly(A)位点。外显子显示为方框。拼接用斜线表示。(B类)5′ss与复合外显子poly(A)位点之间的距离。保守集合1、保守集合2和非保守集合中poly(A)位点的中值分别为295nt、355nt和238nt。(C类)5′ss和跳过外显子poly(A)位点之间的距离。保守集1、保守集2和非保守集中poly(A)位点的中值分别为3445 nt、2997 nt和2320 nt。如前所述,实心黑线表示保守集1中的poly(A)位点,黑色虚线表示保守集中的poly-A位点,实心灰线表示非保守集中的poly-A位点。

结果

我们之前发现,超过一半的人类基因具有替代性多聚腺苷化产物(Tian等人,2005年). 有趣的是,大量poly(a)位点位于3′-最外显子的上游,包括内含子和内部外显子。在3′-最外显子中的替代poly(A)位点可导致可变的3′UTR,其包含不同的顺式mRNA代谢的元素,如富含AU的元素和miRNA靶序列(Farh等人,2005年;Khabar等人,2005年). 然而,在全球范围内,人们对内含子中的多聚腺苷酸化知之甚少。在目前的研究中,我们着手解决人类基因中包含内含子多聚(A)位点的百分比;它们中有多少在其他哺乳动物基因组中保守,例如小鼠和大鼠基因组;内含子多腺苷化在调节基因功能中的作用是什么;以及内含子多(A)位点和容纳它们的内含子的特征是什么。

人类内含子中广泛存在的mRNA多聚腺苷化

为了鉴定内含子poly(A)位点,我们首先将人类cDNA/EST与人类基因组序列对齐,并绘制人类基因组上的所有poly(A)位点(有关详细信息,请参阅方法)。然后我们使用了NCBI RefSeq(普鲁特和马格洛特2001)和UCSC KnownGene序列(Hsu等人,2006年)作为mRNA模板,并使用cDNA/EST鉴定其内含子中的poly(A)位点。为了消除完全位于内含子中的虚假转录物和基因或转录单位,我们要求终止于模板序列内含子中poly(a)位点的cDNA/EST必须与模板序列重叠至少32 nt。每个独特的内含子poly(a)位点对都是一个内含子聚腺苷化事件,由给定染色体上的5′ss、3′ss和poly(A)位点定义。每个事件的poly(A)位点根据其支持cDNA/EST的序列分为复合外显子poly(A)位点或跳跃外显子poly(A)部位。当支持这两种形式的cDNA/EST数量相等时,事件被归类为“两者”表1在我们调查的16610个人类基因中,我们在3344个基因中鉴定了4625个内含子poly(A)位点和5088个内含子聚腺苷化事件。因此,20%的人类基因至少有一个内含子聚腺苷化事件。一些内含子包含多个poly(A)位点,一些poly(A)位点位于不同的内含子(不同的5′ss和3′ss)中。与跳过的末端外显子相比,多聚腺苷酸化事件导致复合末端外显基因。大多数含有poly(A)位点的内含子两侧是含有编码序列(CDS)的外显子(表1).

表1。

人类基因中的内含子poly(A)位点

保存图片、插图等的外部文件。对象名为156tbl1.jpg

保守集1包含人类内含子多(A)位点,其在小鼠或大鼠基因组中的同源位点也被发现位于内含子中。保守集2包含在小鼠或大鼠基因组中具有同源位点的人类poly(A)位点,但由于缺乏支持证据,这些同源位点未被归类为内含子poly(A)位点(有关详细信息,请参阅方法)。非受试组包含在小鼠或大鼠基因组中没有确定的同源位点的人类内含子多(A)位点。

内含子多聚腺苷酸化事件定义为RefSeq或KnownGene mRNA的特定内含子(5′ss+3′ss)中的poly(a)位点。

b条末端外显子类型是由内含子多腺苷酸化事件产生的末端外显子。“Both”表示存在相同数量的cDNA/EST证据支持复合和跳过的末端外显子。

为了解决其他物种中有多少人类内含子poly(A)位点是保守的,我们绘制了小鼠和大鼠基因组中的所有poly(A)位点,并通过上述相同的方法鉴定了这两个物种中的内含子polyA位点。然后,我们使用了人与小鼠和人与大鼠的全基因组比对,并确定了人与鼠和人与鼠的同源多(A)位点对(有关详细信息,请参阅方法)。对于每个同源的poly(A)位点对,我们要求(1)人类和小鼠/大鼠位点在人类和鼠/大鼠基因组比对中位于24 nt内,并且(2)它们以互惠的方式彼此最接近,即小鼠/大白鼠poly(A)位点是最接近人类poly(B)的位点小鼠/大鼠基因组上的位点和人类位点是人类基因组上距离小鼠/大鼠类位点最近的位点。总之,我们鉴定了449个人类内含子poly(A)位点,它们在小鼠或大鼠基因组中具有同源位点,其中135个内含子polyA位点在小鼠或鼠基因组中也被归类为内含子polly(A)位置,314个polyA位点在鼠鼠基因组中有同源位点,但这两个物种中的位点不属于内含子聚(A)位点。前一组称为保守集1;后者是保守集2。poly(A)位点位于保守集2中的主要原因是用于绘制小鼠和大鼠内含子poly(A)位点的cDNA/EST和模板序列少得多。例如,在CALCA公司在保守集2中。另一方面,属于保守集1的poly(A)位点可以是经常使用的poly。因此,90%的人类内含子poly(A)位点(4176)在小鼠或大鼠基因组中没有同源位点,这构成了一个非连续集。为了评估保守性,我们对位于RefSeq和KnownGene mRNA序列最外显子3′的31512个poly(A)位点应用了相同的定位方法。我们还将这些位点分为3′端多聚(A)位点(共16107个)和3′端外显子中的其他位点(共15405个)。使用相同的方法鉴定同源poly(A)位点,我们发现小鼠或大鼠基因组中51%(8141)的3′-大多数poly(B)位点和29%(4474)的其他poly(C)位点在3′-多数外显子中具有同源位点。因此,内含子多(A)位点的保守性远低于位于3′-大多数外显子的位点。我们在讨论中讨论了这种低保守性。补充表1至3中显示了所有内含子聚腺苷化事件。

如所示图1B大多数复合外显子poly(A)位点位于内含子5′ss的63-958nt(第10~90百分位)。然而,保守集中的poly(A)位点似乎具有双峰分布。正如预期的那样,跳过的外显子poly(A)位点比复合外显子聚(A)位置距离5′ss更远,大多在554–16286 nt(第10–90百分位)之间。poly(A)位点与3′ss之间的距离在不同组之间没有显著差异(补充图1)。对于复合和跳跃外显子poly(A)位点,保守集poly(A)位点生成的3′末端外显子大于非保守集位点生成的外显子,但小于3′-大多数外显子(补充图2)。

不同细胞系的内含子聚腺苷酸化活性不同

在保守集1中的内含子poly(A)位点中,有些已经为人所知,例如在保时捷亚太地区(Zhao和Manley 1996),一个站点位于CSTF3型(Pan等人,2006年)和中列出的几个站点(Edwards-Gilbert等人,1997年),包括α原肌球蛋白、(2′-5′)寡腺苷酸合成酶等。其他位点以前没有报道过,似乎具有显著调节基因产物功能的潜力。例如,cyclin C基因有一个跳过的外显子poly(a)位点,导致一种蛋白质亚型在其C末端含有一个不良的PEST基序(脯氨酸[P]、谷氨酸[E]、丝氨酸[S]、苏氨酸[T]域),而通过在3′-最外显子中使用poly(a)位点而衍生的亚型具有一个强烈的PEST模序(补充图3)。由于PEST基序负责蛋白质的稳定性,因此这两种蛋白质亚型的半衰期可能不同。细胞周期蛋白C与CDK8相互作用,CDK8通过Pol II的CTD磷酸化调节转录(Hengartner等人,1998年)和其他几种转录因子(Akoulitchev等人,2000年;Liu等人,2004年). 它还通过与CDK3的相互作用,在细胞从G0期进入细胞周期中发挥作用(Ren和Rollins 2004). 有趣的是,细胞周期蛋白C/CDK8复合物本身已被证明通过其PEST结构域的磷酸化来调节Notch受体胞内结构域(ICD)的蛋白质周转(Fryer等人,2004年). 细胞周期蛋白C能否调节自身的周转率,以及选择性聚腺苷酸化能否在调节其活性方面发挥作用,有待进一步探索。我们还发现,在细胞内有两个复合外显子poly(A)位点C20或f67基因(以前称为PCIF1公司; 见补充表1),其产物已被证明与Pol II的磷酸化CTD相互作用(Fan等人,2003年). poly(A)位点位于包含起始密码子的外显子的上游(补充图4),这是内含子多聚腺苷酸化导致产生非编码RNA的少数几种情况之一,从而可能关闭蛋白质表达。

我们着手验证一些内含子多聚腺苷化事件,并研究在不同细胞条件下内含子多聚腺苷化活性是否不同。为此,我们使用了两个人类髓系白血病细胞系K562和HL60,这两个细胞系代表了髓系发育的两个阶段,K562是未分化的原始细胞,HL60是成熟的早幼粒细胞阶段(科弗勒和戈尔德1980). 我们选择了9个在啮齿类动物中具有保守内含子多聚腺苷化事件的基因,包括CSTF3(CSTF3),C20或67,GABPB2公司(GA结合蛋白转录因子,β亚基2),NAP1L1型(核小体组装蛋白1样1),ZNF261型(锌指蛋白261,目前称为ZMYM3型),CDC42型(细胞分裂周期42),TAF9型(TATA盒结合蛋白相关因子,32kDa)、细胞周期蛋白C和EPC1(polycomb同源物1的增强子)。据我们所知,到目前为止,大多数内含子聚腺苷化事件还没有报道,除了CSTF3(CSTF3)(Pan等人,2006年)和GABPB2公司(Gugneja等人,1995年). 使用来自K562和HL60细胞的信使核糖核酸,以及区分由内含子多腺苷酸化产生的信使核糖核酸变体(或内含子多腺苷酸化变体)和由3′-大多数外显子中的多腺苷酸化产生的信使核糖核酸变体(或3′-大多数外显子变体,参见引物设计和序列的补充图4)的引物组,我们确认了所有9个基因的内含子poly(A)位点的使用(图2). 此外,使用定量PCR(QPCR),我们比较了内含子多聚腺苷酸化变体与3′-大多数外显子变体在两种细胞系中mRNA表达的变化。如所示图2A对于大多数基因,不同的变体在K562细胞和HL60细胞中的表达不同。几个基因,包括CSTF3(CSTF3),C20或67、细胞周期蛋白C和EPC1,在K562中对这两种变体均上调表达,但内含子多聚腺苷化变体的上调程度似乎大于3′-大多数外显子变体(P(P)-值<0.05,t吨-测试)。另一方面,锌f261TAF9型这两种变体之间有相反的关系。虽然mRNA稳定性可能是影响某些变体稳态水平的一个因素,但这些数据的总体趋势表明,在大多数基因的不同条件下,与3′-大多数外显子中的多聚腺苷酸化相反,内含子多聚腺苷酸化事件的相对频率可能不同。这与我们之前的生物信息学发现一致,即替代聚(A)位点在不同组织中的利用不同(Zhang等人,2005年). 然而,需要一种更系统的验证方法来确认更多基因的这一概念。

保存图片、插图等的外部文件。对象名为156fig2.jpg

不同细胞系的内含子聚腺苷化活性不同。()含有内含子poly(A)位点的九个基因的QPCR结果。对于每个基因,使用两组引物检测由内含子多聚腺苷酸化产生的mRNA变体和由最外显子3′多聚腺苷酸酸化产生的mRNA变体。对于每种变异类型,比较K562细胞和HL60细胞的mRNA表达水平(QPCR值)。对于每个基因,比较了内含子多聚腺苷化变体和3′-大多数外显子变体的折叠变化,这些差异显著(P(P)-值<0.05,t吨-测试)用星号表示。结果基于两个实验,每个实验都有两份样本。错误栏为SD(B类)使用人类K562细胞mRNA的PCR产物。M表示分子标记;F/R1,引物F和R1的产物;和F/R2,引物F和R2的产物(关于引物序列及其靶区,请参见补充图4)。显示了基于每个PCR产物的支持cDNA/EST的预期分子量在上面每条车道。

复合外显子poly(A)位点与弱5′ss和大内含子大小相关

然后,我们想研究具有poly(A)位点的内含子和没有poly(A)位点的插入子之间,内含子的某些特征是否不同。我们首先分析了含有复合外显子poly(A)位点的内含子的5′ss、3′ss和内含子大小。对于5′ss和3′ss,我们使用RefSeq和KnownGene序列的所有GT-AG型内含子(总共181669个内含子)生成共识序列来构建位置特异性评分矩阵(PSSM)。然后使用5′ss和3′ss的PSSM分别对5′ss与3′ss进行评分。高分表示与共识有很好的相似性,并且可能是促进剪接的更强信号。我们重点研究了5′ss的–3到+6nt区域和3′ss的-22到+2nt区域。图3、A和B显示了不同内含子组的5′ss和3′ss得分的分布,包括在保守集1、保守集2和非保守集中没有poly(A)位点的内含子和包含复合外显子poly(A)位点的插入子。我们发现在所有三组中含有poly(A)位点的内含子的5′ss得分都低于没有poly(A)位点的插入子(P(P)-值<1×10−5Wilcoxon试验),但所有组的3′ss评分相似。这一观察结果也通过改进的Kolmogorov-Smirnov检验(或mKS检验)得到了证实(Mootha等人,2003年),它使用随机化方案来获得两组内含子之间的差异是由于随机机会造成的概率(称为E值)(有关详细信息,请参阅方法)。如所示图3含有复合外显子poly(A)位点的A和B内含子的5′ss分数(E值=0)显著低于不含poly(A)位点的内含子,但它们的3′ss分数相似(E值=0.084)。此外,我们检测了不同内含子组的5′ss序列和U1 snRNA序列之间的潜在碱基对。事实上,ΔG和潜在碱基对的数量都表明,含有复合外显子poly(A)位点的内含子比没有poly(A)位点的内含子具有较弱的5′ss(补充图第5A段)。

保存图片、插图等的外部文件。对象名为156fig3.jpg

包含复合外显子poly(A)位点的内含子的特征。()四组内含子的5′ss分数箱线图(左边)和mKS测试结果(正确的)比较无poly(A)位点的内含子和具有复合外显子poly(A)位点的插入子的5′ss得分。(B类)如中所示除绘制和比较3′ss得分外。(C类)如中所示除了内含子大小被绘制和比较。对于箱线图、中值和P(P)-显示了各组与第1组比较的Wilcoxon检验值。对于mKS测试,E值是方法中所述的预期值。的E值B类表示第2+3+4组的随机概率值小于第1组的概率值,以及C类表示第2+3+4组的随机概率值高于第1组的概率值。在每个图中,黑线是实际数据的运行总和,灰色线是从1000个随机数据中随机选择的25个运行总和。(D类)含有复合外显子poly(A)位点的内含子分布图。x个-轴是内含子大小()从小到大,以及Y(Y)-轴为5分(j个)从低到高,如图所示。观察值与预期值之比(ij公司/E类ij公司)显示在热图中,其中颜色用于根据图形下的色标表示值。行总和∑20=1Oij公司和列总和∑20j个=1Oij公司也显示在显示的灰度条中旁边在上面图中,黑色代表最高值,白色代表最低值。

然后我们比较了不同内含子组之间的内含子大小(图3C). 通过Wilcoxon测试,我们发现带有poly(A)位点的内含子比没有poly(A)位点的插入子大得多(P(P)-值<1×10−8)mKS测试(E值=0,图3C). 由于没有poly(A)位点的内含子组包含一组小内含子(<512 nt)(补充图6A),我们仅使用大于512 nt的内含子进行了mKS测试。如补充图6B所示,具有复合外显子poly(A)位点的插入子仍显著大于没有poly。

为了研究具有复合poly(A)位点的内含子是否同时与弱5′ss和大内含子大小相关,我们绘制了一张内含子分布图,该图显示了一组内含子如何相对于所有内含子在5′ss分数和内含子大小方面分布。首先,构建一个20×20的网格,每个细胞的值范围由所有RefSeq和KnownGene内含子定义。然后,我们根据内含子的5′ss分数和内含子大小,将含有复合poly(A)位点的内含子放入网格中。将每个细胞中具有复合聚(A)位点的内含子的数量(称为观察值)与预期值进行比较,预期值是根据所有内含子的分布计算的。如果一个内含子组的分布与所有内含子的分布相似,那么所有细胞的观察值与期望值的比率应接近一。如果一个内含子组的分布与所有内含子组不同,则该组内含子在比率大于1的细胞中过度表达,而在比率小于1的细胞内表现不足。如所示图3D,高比率大多位于网格的右下角,表明具有复合poly(A)位点的内含子与弱5′ss和大内含子尺寸相关。综上所述,这些数据表明复合外显子中的poly(A)位点与较弱的5′ss和较大的内含子有关,而与其他内含子相比,3′ss相似。由于弱的5′ss和大的内含子尺寸会增加剪接出内含子的时间,这一结果表明,当内含子中遇到复合外显子poly(a)位点时,剪接和多聚腺苷化之间存在动态竞争。

含有跳过外显子poly(A)位点内含子的特征

为了描述包含跳过外显子poly(A)位点的内含子的特征,我们首先检查了它们的5′ss评分。与含有复合外显子poly(A)位点的内含子相比,含有跳过外显子聚(A)部位的内含子的5′ss得分高于不含poly(A)位点的插入子(图4A). 然后我们检测了跳过外显子上游的内含子3′ss(称为上游内含子)和包含跳过末端外显子的内含子(称为完整内含子),如图4B:。我们发现上游内含子的3′ss分数总体上低于没有poly(A)位点的内含子,但完整内含子3′ss得分与没有poly(图4C; 补充图7所示的mKS试验)。然而,比较对应于相同5′ss的上游和下游3′ss得分并没有发现系统性差异(图4D),表明其他因素可能在跳过外显子poly(A)位点的使用中发挥调节作用。此外,上游内含子似乎比没有poly(A)位点的内含子略大,正如预期的那样,完整的内含子比没有poli(A)位置的内含子大得多(图4E). 因此,与复合外显子poly(A)位点(通常位于5′ss较弱的大内含子中)不同,没有明显的内含子特征可以解释跳过外显子聚(A)位置的用法。

保存图片、插图等的外部文件。对象名为156fig4.jpg

包含跳过外显子poly(A)位点的内含子的特征。()4组内含子的5′ss分数箱线图(左边)以及mKS测试结果(正确的)比较无poly(A)位点的内含子和跳过外显子poly(A)位点的插入子的5′ss得分。E值表示随机机会使第2+3+4组的值高于第1组的值的概率。(B类)内含子中跳过的末端外显子示意图。(C类)四组内含子的3′ss得分箱线图。上游3′ss和下游3′ss(如所示B类)如图所示。(D类)上游3′ss分数散点图(x个-轴)和下游3′ss评分(-轴)。每个点代表一个跳过的末端外显子,对于相同的5′ss,上游3′ss,下游3′ss。实心正方形表示保守集1中的poly(A)位点;实心三角形,用于保守集2中的poly(A)位点;和灰色圆圈,用于非连续集合中的poly(A)位点。(E类)四组内含子的内含子大小方框图。显示了上游内含子和完整内含子。对于箱线图、中值和P(P)-显示了各组与第1组比较的Wilcoxon检验值。

不同组内含子聚(A)位点的不同聚腺苷化信号

然后我们检查了PAS六聚体在不同内含子多(A)位点组中的使用频率。PAS六聚体可分为四种类型:AAUAAA、AUUAAA、其他PAS(如方法中所述的11种变体)和无PAS。如许多生化分析所示,PAS六聚体促进聚腺苷酸化的强度顺序为AAUAAA>AUUAAA>其他PAS>无PAS。我们检测了四种类型的poly(A)位点:3′-最外显子poly(A)位点、3′-最多外显子中的其他poly(B)位点、复合外显子聚A位点和跳过外显子聚A位点。对于每种类型,我们分别分析了保守和非保守位点。如所示图5我们发现,对于每种类型,保守的poly(A)位点都与比非保守位点更强的信号相关。如前所述,与3′-最外显子中的其他poly(A)位点相比,3′-大多数poly(A)位点与更强的信号相关(Tian等人,2005年).

保存图片、插图等的外部文件。对象名为156fig5.jpg

不同类型聚(A)位点的PAS六聚体频率和保守性。()10组聚(A)位点中四种PAS六聚体的频率。Poly(A)位点类型如底部图形的。−40至−1 nt区域用于识别PAS六聚体。其他PAS对应于AAUAAA的11个变体中的任何一个(有关详细信息,请参阅方法),没有PAS表明在-40到-1 nt区域中找不到PAS六聚体。(B类)人和小鼠同源多(A)位点对之间PAS类型的保存。对复合外显子poly(A)位点和跳过外显子poly(A)部位合并保守集。每个条形代表人类多聚(A)位点群中具有给定PAS类型(在条形下方指示)的保守多聚(A)位点的百分比(在底部)。因此,poly(a)位点组的四条棒材之和为一。每个栏包含四个区域,代表相应鼠标位置的四种PAS类型的频率。

大多数保守的内含子poly(A)位点群与3′-大多数poly(A)位点相似,在3′-大多数外显子中比其他poly(A)位点具有更强的信号。有趣的是,保守组1、保守组2和非保守组中的跳过外显子poly(A)位点都与比各自组中的复合外显子聚(A)位置更强的信号相关,这表明跳过外显基因poly(A)位点通常非常强。事实上,在所有组中,保守组1中跳过的外显子poly(A)位点最大程度地利用了AAUAAA。为了更详细地研究内含子聚(A)位点周围的序列,我们对聚(B)位点的上游区域(-40到-3nt)和下游区域(+3到+40nt)进行了评分。通过比较多聚(A)区域序列(即−40至−3 nt或+3至+40 nt)与区域一致序列(表示为PSSM)来计算分数。如补充图8所示,上游得分和下游得分在保守组和非保守组之间的差异方面表现出类似的趋势,并且与PAS六聚体的结果一致。在保守位点组之间的比较以及非保守位点组间的比较中,与其他poly(A)位点类型相比,跳过外显子poly(A)位点与上游区域更强的信号相关。因此,聚腺苷酸化信号的强度在不同类型的内含子聚(A)位点之间不同,这表明它们的使用有不同的机制。

为了了解不同类型的poly(A)位点是如何在进化过程中受到选择性压力的,我们分析了人和小鼠之间以及人和大鼠之间的PAS类型保守性。如所示图5B和补充图9,PAS类型对于所有类型的poly(A)位点都很保守。对于人类和小鼠的同源poly(A)位点对,91%的3′-大多数poly(A)位点、86%的其他3′-多数外显子位点、88%的复合外显子poly(B)位点和93%的跳过外显子聚(A)部位具有相同的PAS类型,即AAUAAA与AAUAAA、AUUAAA与AUUAAA、其他PAS与其他PAS、无PAS与无PAS。人类和大鼠的同源聚(A)位点数量相似。不同poly(A)位点类型之间的差异归因于AAUAAA的百分比,AAUAAA是最保守的PAS类型。然而,AUUAAA、其他PAS和无PAS也似乎在进化过程中被保存,因为它们的保存模式与随机保存模式显著不同。因此,位于基因不同部分的保守poly(A)位点对多聚腺苷酸化信号具有相似的选择压力,这表明它们对基因调控具有同等重要性。

讨论

我们发现,约20%的人类基因在内含子中有mRNA多聚腺苷化事件,导致复合末端外显子的产生或跳过末端外显基因的使用。大多数内含子多聚腺苷酸化事件可能导致编码不同蛋白质的mRNA变体,这表明选择性多聚腺苷酸化可显著增加细胞中蛋白质组的复杂性。小鼠或大鼠基因组中内含子多聚腺苷酸化的保守性低于3′-大多数外显子中的poly(A)位点。虽然基因组序列和基因组比对的问题可能导致直向同源位点定位的假阴性,但低保守性主要归因于两个原因:首先,在小鼠和大鼠基因组中可用于poly(A)位点定位的cDNA/EST较少(Tian等人,2005年;Lee等人,2007年)小鼠和大鼠的基因通常没有人类的基因注释好,导致RefSeq和KnownGene序列更少,可以用作寻找内含子多腺苷化事件的模板。事实上,我们结合小鼠和大鼠数据来寻找人类同源poly(A)位点的主要原因是,在小鼠和大白鼠基因组中发现的poly(A)位点和内含子聚腺苷化事件较少。考虑到选择性聚腺苷酸化的组织/细胞特异性调节,小鼠和大鼠cDNA/EST来源于比人类组织/细胞类型范围小得多的组织/电池类型,这一事实进一步加剧了这个问题(Zhang等人,2005年). 一些人类poly(A)位点在小鼠和/或大鼠基因组中具有同源位点,但这两个物种中的位点未被归类为内含子poly(A)位点(那些位于保守集2中的位点),这一事实与这一概念一致。因此,随着更多的cDNA/EST、RefSeq和KnownGenes的出现,人类内含子poly(A)位点的总数可能会比我们在这里报道的更多。

第二,基因组序列的变异可能导致一些非共有的内含子poly(A)位点出现物种特异性聚腺苷酸化信号。一般来说,多聚腺苷酸化信号被发现与基因的感觉链相对应(Glusman等人,2006年)由于它们可以终止转录,因此可能出现在最近的进化史中。与这一概念一致,就PAS六聚体和上游和下游序列而言,非保守内含子多(A)位点与弱信号相关。类似地,人类和小鼠基因组之间的保守和非保守选择性剪接事件也有报道(Thanaraj等人,2003年;Yeo等人,2005年). 因此,不同物种可能具有不同的mRNA处理模式,可能有助于生物体的物种形成。在潮湿的实验室环境中,有待进一步探索选择性聚腺苷化如何促进不同的基因产物,从而在不同物种中发挥作用。

我们发现含有复合外显子poly(A)位点的内含子往往具有较弱的5′ss和较大的大小,这表明这组poly(A)位点的使用可能主要受剪接和聚腺苷化的时间控制。据推测,弱的5′ss和大的内含子大小需要更长的时间来剪接出内含子,从而为内含子中的多聚腺苷酸化创造了一个时间窗口。有趣的是,3′ss似乎不显著,这表明内含子中的多聚腺苷酸化可能发生在内含子转录完成之前。相反,这些数据表明,增强剪接的蛋白质因子,特别是那些在5′ss时起作用的蛋白质因子可以抑制内含子多聚腺苷化。这一观点符合这样一个事实,即在剪接过程中直接参与与5′ss结合的U1 snRNP中的几个因子对多聚腺苷酸化具有抑制作用,包括U1A和U1 70K(Gunderson等人,1994年;Gunderson等人,1998年). 类似地,我们之前发现U1A在人类脑组织中高表达,其中也观察到多聚(a)位点上游至3′-大多数外显子的使用减少(Zhang等人,2005年). 此外,我们的结果表明,细胞中的次优剪接活性可能导致复合外显子poly(A)位点的使用增加。由于上述原因,这些事件不太保守。支持这一观点的是,复合外显子poly(A)位点占非保守组中70%的位点,但占保守组中50%–60%的位点(表1).

与涉及复合末端外显子的内含子多聚腺苷酸化事件相比,当使用跳过的末端外显基因时,剪接和多聚腺苷酸化之间的相互作用可能是不同的。内含子的任何特征都不能解释跳过外显子poly(A)位点的用法,这表明其他因素,如外显子和内含子增强子/沉默子,可能支配它们的用法(Goren等人,2006年;Wang等人,2006年)它们的调控可能类似于外显子跳跃事件。然而,跳过的外显子poly(A)位点往往与强poly(A)信号有关。可以想象,在转录和mRNA处理过程中,跳过的末端外显子利用强大的多聚腺苷化信号来克服剪接。从这个意义上说,是否可以构建机器学习模型来准确预测内含子多腺苷酸化事件还有待探索(Cheng等人,2006年),并使用内含子和poly(A)位点参数区分复合外显子poly(A)位点和跳过外显子poly(A)位置。

方法

Poly(A)站点映射

人类、小鼠和大鼠poly(A)位点的鉴定如Tian等人(2005)简单地说,人类、小鼠和大鼠cDNA/EST(NCBI,2005年8月版本)序列通过BLAT与它们的基因组(UCSC;hg17代表人类,mm5代表小鼠,rn3代表大鼠)对齐(肯特2002). 使用排列的cDNA/EST的悬垂聚(A)尾部(>8 nt)来寻找聚(A)位点。位于富含A的区域的位点,即位于该位点周围–10至+10 nt区域的10 nt窗口中的6个或更多连续As或7个或更多As,被视为内部启动候选位点,本研究未使用。如果cDNA/ESTs的3′端位于由聚(A/T)尾cDNA/ESTs支持的位点的24 nt以内,则也使用无聚(A)尾cDNA/ESTs。如前所述,cDNA/EST在基因组上的取向由其剪接位点推断(Tian等人,2005年). 确定了位于NCBI RefSeq(2005年8月版本)或UCSC KnownGene(2006年3月版本)序列内含子中的Poly(A)位点。我们要求支持内含子poly(A)位点的cDNA/EST与RefSeq和KnownGene序列之间至少有32 nt重叠。可以在PolyA_DB 2数据库中查询所有poly(A)站点(Lee等人,2007年).

同源聚(A)位点的鉴定

通过使用UCSC人类与小鼠(hg17 vs.mm5)、小鼠与人类(mm5 vs.hg17)、人类与大鼠(hg17vs.rn3)和大鼠与人类(rn3 vs.hg 17)全基因组比对(axtNet文件)来确定同源多聚(A)位点(Schwartz等人,2003年). 当(1)人和小鼠/大鼠的poly(A)位点位于人和小鼠/大鼠基因组比对中的24nt以内时,一对人和小鼠/大鼠的poly(A)位点被认为是直向同源的;和(2)它们以互惠的方式彼此最接近,即小鼠/大鼠poly(a)位点是使用hg17与mm5或hg17对rn3最接近人类poly(B)位点的位点,而人类poly是使用mm5与hg17或rn3对hg17最接近鼠/大鼠的位点。

拼接部位得分

我们使用人类RefSeq和KnownGene序列181669个GT-AG型内含子的5′ss和3′ss构建PSSM。对于5′ss,我们在5′ss周围使用了-3到+6个nt,外显子使用3个nt,内含子使用6个nt;对于3′ss,我们在3′ss周围使用-22到+2nt,内含子中使用22nt,外显子中使用2nt。PSSM中的每个条目的计算方法为M(M)ij公司=对数2((f)ij公司/),其中(f)ij公司是核苷酸的频率在位置j个、和是核苷酸的频率在整个地区。每个序列的得分计算如下S公司= ∑j个 ,j个,其中i、 j个是核苷酸得分在位置j个在PSSM中。我们使用U1 snRNA的序列5′-ACTACTG,利用ViennaRNA的RNA双链功能,与5′ss序列形成双链结构(霍法克2003).

PAS六聚体和聚(A)区域得分

使用−40至−1 nt区域(poly(A)位点设置在位置0)鉴定PAS六聚体,包括AAUAAA、AUUAAA和11个单核苷酸变体,包括UAUAAA、AGUAAA、AAGAAA、AAUAUA、AAUACA、CAUAAA、GAUAAA、AA、UUAAA、ACUAAA和AAUAGA(Beaudo等人,2000年;Tian等人,2005年). 我们使用了PolyA_DB 2数据库中的所有人类poly(A)区域(Lee等人,2007年)为–40至−3 nt和+3至+40 nt区域生成PSSM。未使用–2到+2 nt区域,因为校准工具无法明确解析该区域(未显示数据)。如上所述计算每个聚(A)区域的得分。

统计分析

Wilcoxon秩和检验和mKS检验在程序R中进行(http://www.r-project.org).t吨-测试在Microsoft Excel中进行。我们遵循了Mootha等人(2003年)用于mKS测试。简单地说,给定一组值N个包含n个条目和另一组M(M)包含条目,使用以下方法评估M(M)显著高于或低于N个.N个M(M)第一次合并,合并集(M(M)+N个)然后从高值到低值排序,并从最高值开始计算所有条目的运行总和。值为第1版如果条目来自N个,以及其他第2版添加了,其中v(v)1 = √(/n个)、和v(v)2 = −√(n个/)因此,总金额为零。最大值和最小值,最大值最小值分别将的运行总和用作经验统计,并可作为观察值。为了获得它们的重要性,我们随机选择条目来自(M(M)+N个),并计算最大值和最小值,E类最大值E类最小值分别被视为预期值。这个过程重复了1000次。拒绝零假设的概率M(M)包含的值大于N个是1000的分数E类最大值高于最大值.拒绝零假设的概率M(M)包含的值小于N个是1000的分数E类最小值小于最小值这些概率在本研究中被称为E值。

内含子分布图

内含子分布图用于分析内含子子集的分布(M(M))在全介绍集中(N个)关于5′ss评分和内含子大小。首先通过创建一个20×20的网格构建地图,内含子大小为x个-轴和5′ss得分为-轴。对于每个轴,我们使用所有内含子的20个分位数来定义每个细胞的范围。中的简介M(M)N个根据其5′ss评分和内含子大小值放入细胞。来自的内含子数量M(M)在每个细胞中被视为观察值ij公司。每个单元格的预期值由以下公式计算得出E类ij公司=*c(c)ij公司/n个,其中是中的内含子数M(M),n个是中的内含子数N个、和c(c)ij公司是来自N个单元格内C类ij公司观察值与预期值之比(ij公司/E类ij公司)被绘制成热图。以下各项的总和ij公司在两行中(∑20=1Oij公司)和列(∑20j个=1Oij公司)还计算并以热图表示。

细胞系和QPCR

人K562细胞保存在补充有10%胎牛血清(FBS)的Dulbeco改良老鹰培养基(DMEM)中。人HL60细胞保存在含有10%FBS的RPMI-1640中。所有培养基中还添加了50 U/mL青霉素和50μg/mL链霉素。根据制造商的方案,通过RNeasy试剂盒(Qiagen)提取总细胞mRNA。使用寡核苷酸-dT通过M-MLV逆转录酶逆转录mRNA15使用7500 Real-time PCR系统(Applied Biosystems),以Syber-Green I为染料进行实时QPCR。补充图4提供了不同基因的引物。所有引物均来自UMDNJ的分子资源设施。所有转录物的QPCR值均归一化为亲环素A的值(CYPH公司)来自同一细胞的转录本。底漆CYPH公司分别为5′-ATGGTCAACCC CACCGTGT和5′-AATCCTTCTCCAGTCAG。在40个扩增周期后,产物在2%琼脂糖凝胶上运行,并用溴化乙锭染色。所有样品一式两份,所有实验进行两次。

致谢

我们感谢詹姆斯·曼利的有益讨论;Carolyn Suzuki、Michael Tsai、Tsafi Pe'ery、Carol S.Lutz和Jun Hu对手稿进行了批判性阅读;和Anita Antes协助细胞培养。B.T.得到了新泽西医学和牙科大学基金会的支持。

脚注

[补充材料可在线获取,网址为网址:www.genome.org.]

文章在印刷前在线发布。文章和发布日期为http://www.genome.org/cgi/doi/10.1101/gr.5532707

工具书类

  • Akoulitchev S.、Chuikov S.,Reinberg D.、Chuikov S.、Reinberg D.、Reinberg D.TFIIH受含cdk8的介质复合物负调控。自然。2000;407:102–106.[公共医学][谷歌学者]
  • Awasthi S.、Alwine J.C.、AlwineJ.C.聚腺苷酰化裂解因子I与U1 snRNP的关联。RNA。2003;9:1400–1409. [PMC免费文章][公共医学][谷歌学者]
  • Beaudoi E.、Freier S.、Wyatt J.R.、Claverie J.M.、Gautheret D.、Freier-S.、Wayatt J.R、Claverie-J.M.,Gautheret-D.、Wyatt-J.R.,Claverie J-M.、Goutheret D、Claveree J.M.和GautheretD.人类基因中变异多聚腺苷化信号的使用模式。基因组研究。2000;10:1001–1010. [PMC免费文章][公共医学][谷歌学者]
  • Bruce S.R.、Dingle R.W.、Peterson M.L.、Dingel R.W.和Peterson L.,B细胞和浆细胞剪接差异:在调节免疫球蛋白RNA加工中的潜在作用。RNA。2003;9:1264–1273. [PMC免费文章][公共医学][谷歌学者]
  • Burge C.B.、Tuschl T.、Sharp P.A.、Tuschll T.、夏普P.A.。通过剪接体将前体剪接成mRNA。收录人:Gesteland R.F.等人,编辑。RNA世界。冷泉港实验出版社;纽约州冷泉港:1999年。第525-560页。[谷歌学者]
  • Cheng Y.,Miura R.M.,Tian B.,Miura.R.M.、Tian B.和Tian B.用支持向量机预测mRNA多聚腺苷化位点。生物信息学。2006;22:2320–2325.[公共医学][谷歌学者]
  • Colgan D.F.,Manley J.L.,Manley J.L.信使核糖核酸多腺苷酸化的机制和调节。基因与发育。1997;11:2755–2766.[公共医学][谷歌学者]
  • Cooke C.、Hans H.、Alwine J.C.、Hans.H.、Alwine J.C、AlwineJ.C.在聚腺苷酸化和last-intron去除的耦合中剪接元件和聚腺苷酸化信号元件的使用。分子细胞。生物。1999;19:4971–4979. [PMC免费文章][公共医学][谷歌学者]
  • Edmonds M.聚A序列的历史:从形成到因子再到功能。掠夺。核酸研究分子生物学。2002;71:285–389.[公共医学][谷歌学者]
  • Edwards-Gilbert G.、Milcarek C.、Milcarik C.在小鼠B细胞发育期间对多聚(A)位点使用的调节涉及到一般聚腺苷酸化因子在B细胞阶段特异性方式中结合的变化。分子细胞。生物。1995;15:6420–6429. [PMC免费文章][公共医学][谷歌学者]
  • Edwards-Gilbert G.,Veraldi K.L.,Milcarek C.,Veraldis K.L,Milcarik C.,Milcareck C.复杂转录单位中的替代多(A)位点选择:结束的手段?核酸研究。1997;25:2547–2561. [PMC免费文章][公共医学][谷歌学者]
  • Fan H.、Sakuraba K.、Komuro A.、Kato S.、Harada F.、Hirose Y.、Sakurama K.、Gomuro A.,Kato S..、Harada.、Hirosa F.、Horose Y..、Hiro Y.、Kato F.、Harata F.,Hirose F.、Hirose Y.S.、Hirore Y.、Hirome Y.PCIF1,一种新型人类WW域蛋白,与磷酸化RNA聚合酶II相互作用。生物化学。生物物理学。Res.Commun公司。2003;301:378–385.[公共医学][谷歌学者]
  • Farh K.K.、Grimson A.、Jan C.、Lewis B.P.、Johnston W.K.、Lim L.P.、Burge C.B.、Bartel D.P.、Grimson A.、Jan C.、Lewis B.P.、Johnston W.K.、Lim L.P.、Burge C.B.、Bartel D.P.、Jan C.、Lewis B.P.、Johnston W.K.、Lim L.P.、Burge C.B.、Bartel D.P.、Lewis B.P.、Johnston W.K.、Lim L.P.、Burge C.B.、Bartel D.P.、Johnston W.K.、Lim L.P.、Burge C.B。,Bartel D.P.、Lim L.P.、Burge C.B.、Bartel D.P.、伯格C.B.、巴特尔D.P.和巴特尔D.P。哺乳动物微RNA对mRNA抑制和进化的广泛影响。科学。2005;310:1817–1821.[公共医学][谷歌学者]
  • 傅兰雅·C.J.、怀特·J.B.、琼斯·K.A.、怀特·J.B.、Jones K.A.和琼斯·K.A.大师招募CycC:CDK8来磷酸化Notch ICD并协调激活与营业额。分子细胞。2004;16:509–520.[公共医学][谷歌学者]
  • Glusman G.、Qin S.、El-Gewely M.R.、Siegel A.F.、Roach J.C.、Hood L.、Smit A.F.,Qin S、El-Geeley M.R.,Siegel A.F.、Raach J.C、Hood L、Smit A.F.,El-Gewelly M.R..、Siegle A.F。第三种基因预测方法表明,还有数千个人类转录区。公共科学图书馆计算。生物。2006;2:e18。 [PMC免费文章][公共医学][谷歌学者]
  • Goren A.、Ram O.、Amit M.、Keren H.、Lev-Maor G.、Vig I.、Pupko T.、Ast G.、Ram O、Amit M、Keren H、Lev-Moar G.和Vig I..、PupkoT.、Ast G.、Amit M.、Keren-H.、Lev-Maur G.,Vig I..PupkoT、Ast G、Keren G.、Lev-Maor G..、Vig I、Pupko-T.、阿斯特G.、左旋-Maor G、维格I.、普科T.、维格G.pko T.、Ast G.、Ast G。比较分析确定外显子剪接调控序列。增强子和消音器的复杂定义。分子细胞。2006;22:769–781.[公共医学][谷歌学者]
  • Gugneja S.、Virbasius J.V.、Scarpulla R.C.、Virbassius J.V、Scarpalla R.C.4个结构不同的人类核呼吸因子2非DNA-结合亚单位共享一个保守的转录激活域。分子细胞。生物。1995;15:102–111. [PMC免费文章][公共医学][谷歌学者]
  • Gunderson S.I.、Beyer K.、Martin G.、Keller W.、Boelens W.C.、Mattaj L.W.、Beyer K.、马丁G.、凯勒W.、博伦W.C、马塔吉L.W.,Martin G、凯勒W、博伦WC、马塔吉L.W..、凯勒W-、博伦W-C.、马塔杰L.W。人类U1A snRNP蛋白通过与poly(a)聚合酶的直接相互作用调节多聚腺苷化。单元格。1994;76:531–541.[公共医学][谷歌学者]
  • Gunderson S.I.、Polycarpou-Schwarz M.、Mattaj I.W.、Polyccarpou-Schiwarz M..、Mattaj-I.W.、Mattalj I.W.U1 snRNP通过U1 70K和poly(a)聚合酶之间的直接相互作用抑制前mRNA多聚腺苷化。分子细胞。1998;1:255–264.[公共医学][谷歌学者]
  • Hengartner C.J.、Myer V.E.、Liao S.M.、Wilson S.J.、Koh S.S.、Young R.A.、Myer 5.E.、Liou S.M、Wilson C.J.和Koh S.S、Young S.S.和Young R.A.Srb10和Kin28 cyclin-dependent激酶对RNA聚合酶II的时间调控。分子细胞。1998;2:43–53.[公共医学][谷歌学者]
  • Hirose Y.,Manley J.L.,Manley JL.RNA聚合酶II和核事件的整合。基因与发育。2000;14:1415–1429.[公共医学][谷歌学者]
  • Hochsmann M.、Toller T.、Giegerich R.、Kurtz S.、Toler T.、Geegerich R、Kurtz-S.、Giegerrich R.、Kortz-S、Kurtz-S.RNA二级结构的局部相似性。程序。IEEE计算。Soc.生物信息。配置。2003;2003:159–168.[公共医学][谷歌学者]
  • Hofacker I.L.维也纳RNA二级结构服务器。核酸研究。2003;31:3429–3431. [PMC免费文章][公共医学][谷歌学者]
  • Hsu F.、Kent W.J.、Clawson H.、Kuhn R.M.、Diekhans M.、Haussler D.、Kent W.J.,Clawson H、Kuhn-RM.、Diekhans M、Hausler D.、Clawsson H.、Kuhn R.M、Diekans M.、豪斯勒D.、库恩R.M.,Diekhan、豪斯勒M.、迪肯M.、狄肯M.,豪斯勒D.、豪斯乐D.UCSC已知基因。生物信息学。2006;22:1036–1046.[公共医学][谷歌学者]
  • Hu J.,Lutz C.S.,Wilusz J.,Tian B.,Lutz-C.S.,Wilusz-J.,Tain B.,Tian B..候选生物信息学鉴定顺式-与人类mRNA多聚腺苷化有关的调节元件。RNA。2005;11:1485–1493. [PMC免费文章][公共医学][谷歌学者]
  • Jurica M.S.、Moore M.J.和Moore M.J.前mRNA剪接:在蛋白质的海洋中沉沦。分子细胞。2003;12:5–14.[公共医学][谷歌学者]
  • Kaneko S.、Manley J.L.和Manley J.L。哺乳动物RNA聚合酶II C末端结构域与RNA相互作用,抑制转录偶联3′末端形成。分子细胞。2005;20:91–103.[公共医学][谷歌学者]
  • Kent W.J.BLAT—类似BLAST的对准工具。基因组研究。2002;12:656–664. [PMC免费文章][公共医学][谷歌学者]
  • Khabar K.S.、Bakheet T.、Williams B.R.、Bakhee T.、威廉姆斯B.R.和威廉姆斯B.R,人类基因组中富含AU的瞬时反应转录物:表达序列标签聚类和基因发现方法。基因组学。2005;85:165–175.[公共医学][谷歌学者]
  • Koefler H.P.、Golde D.W.和Golde D.W.人类髓系白血病细胞系:综述。鲜血。1980;56:344–350.[公共医学][谷歌学者]
  • Kyburz A.、Friedlein A.、Langen H.、Keller W.、Friedelein A.、Lanngen H.、凯勒W.、凯勒W。CPSF亚基和U2 snRNP亚基之间的直接相互作用有助于前mRNA 3′末端加工和剪接的耦合。分子细胞。2006;23:195–205.[公共医学][谷歌学者]
  • LaCava J.、Houseley J.、Saveanu C.、Petfalski E.、Thompson E.、Jacquier A.、Tollervey D.、Housley J.、Saveanu C、Petfarski E.、Tompson E.、Jacqueer A.、Tullervey D、Saveanski C.、Petfalski E.,Thompsson E.、Jacquier A.,Tollervey D.、Petfalski E.、汤普森E.、Jacquier A.、Tallervey D.ThompsonE.、Jacquaier A.、Tollorvey D.和Jacquier A。,Tollervey D.,Tollervey D.外体对RNA的降解由核多聚腺苷化复合物促进。单元格。2005;121:713–724.[公共医学][谷歌学者]
  • Ladd A.N.、Cooper T.A.、Cooper T.A。基因组生物学。第3卷。2002.寻找调节后基因组时代选择性剪接的信号。评论0008。[PMC免费文章][公共医学][谷歌学者]
  • Lee J.Y.、Yeh I.、Park J.Y.,Tian B.、Yeh I、Park JY.、Tian B.,Park J.Y,Tian B.PolyA_DB 2:脊椎动物基因中的mRNA多腺苷化位点。核酸研究。2007(印刷中)[PMC免费文章][公共医学][谷歌学者]
  • Liang S.、Lutz C.S.和Lutz C.S.p54nrb是snRNP-free U1A(SF-a)复合物的一种成分,在多聚腺苷化过程中促进前mRNA切割。RNA。2006;12:111–121. [PMC免费文章][公共医学][谷歌学者]
  • Liu Y.、Kung C.、Fishburn J.、Ansari A.Z.、Shokat K.M.、Hahn S.、Kung C、Fishborn J.和Ansari A.Z.、Shokat K.、Hahn.S.、Fishbun J.、安萨里A.Z.,Shokat K.M.、哈恩S.、Shokat-K.M..、Shokhn S.、Shokat-K.M.、Hahmn S.和Hahn。两种细胞周期素依赖性激酶促进RNA聚合酶II转录和支架复合物的形成。分子细胞。生物。2004;24:1721–1735. [PMC免费文章][公共医学][谷歌学者]
  • Lou H.、Neugebauer K.M.、Gagel R.F.、Berget S.M.、Neugebauer K.M.、Gagel R.F.、Berget S.M.、Gagel R.F.、Berget S.M.、Berget S.M.通过U1 snRNP和SRp20对替代聚腺苷酸化的调节。分子细胞。生物。1998;18:4977–4985. [PMC免费文章][公共医学][谷歌学者]
  • Lutz C.S.、Murthy K.G.、Schek N.、O’Connor J.P.、Manley J.L.、Alwine J.C.、Murtthy K.G、Schek.、O’Connor J.P、Manley JL.、阿尔文J.C.、SchekN.、O'Connor JP.、曼利J.L。U1 snRNP-A蛋白与裂解-聚腺苷酸化特异性因子的160-kD亚基之间的相互作用提高了体外聚腺苷化效率。基因与发育。1996;10:325–337.[公共医学][谷歌学者]
  • Millevoi S.、Loulerge C.、Dettillier S.、Kara S.Z.、Keller W.、Antoniou M.、Vagner S.、Luulerge C、Dettwiler S.、Kraa S.Z、Keller-W.、安东尼奥M.、维格纳S.、Dettilier S.,Karaa S.Z.,Keller W、Antoniau M.,Vagner S,Kara S.Z、凯勒W.、安东纽M。U2AF 65和CF I(m)之间的相互作用将拼接和3′端加工机械连接起来。EMBO J。2006;25:4854–4864. [PMC免费文章][公共医学][谷歌学者]
  • Modrek B.,Lee C.,Lee C.选择性剪接的基因组观点。自然遗传学。2002;30:13–19. [谷歌学者]
  • Mootha V.K.、Lindgren C.M.、Eriksson K.F.、Subramanian A.、Sihag S.、Lehar J.、Puigserver P.、Carlsson E.、Ridderstrale M.、Laurila E.、Lindgren C.M.,Eriksson-K.F、Subraman A.、Siha S.、莱哈J.、普格塞尔P.、卡尔森E.、里德斯特拉勒M。,Riddestrale M.、Laurila E.、Subramanian A.、Sihag S.、Lehar J.、Puigserver P.、Carlsson E.、Riddestrale M.、Laurila E.、Sihag S.、Lehar J.、Puigserver P.、Carlsson E.、Riddestrale M.、Laurila E.、Lehar J.、Puigserver P.、Carlsson E.、Riddestrale M.、Laurila E.、Puigserver P.、Carlsson E.、Riddestrale M.、Laurila E.、Carlsson E。,Ridderstrale M.、Laurila E.、Riddersstrale M.,Laurila E..、Laurira E.等。参与氧化磷酸化的PGC-1α应答基因在人类糖尿病中协调下调。自然遗传学。2003;34:267–273.[公共医学][谷歌学者]
  • Moreira A.、Takagaki Y.、Brackenridge S.、Wollerton M.、Manley J.L.、Proudfoot N.J.、Takaga Y.、Brackenridge S、Wollert M.、曼利J.L。C2补体poly(A)信号的上游序列元件通过两种不同的机制激活mRNA 3′端的形成。基因与发育。1998;12:2522–2534. [PMC免费文章][公共医学][谷歌学者]
  • Nesic D.、Maquat L.E.、Maquat-L.E.上游内含子影响最终内含子去除和RNA 3′末端形成的效率。基因与发育。1994;8:363–375.[公共医学][谷歌学者]
  • Niwa M.、Berget S.M.和Berget S.M。AAUAAA多聚腺苷化信号的突变抑制了近端内含子而非远端内含子的体外剪接。基因与发育。1991;5:2086–2095.[公共医学][谷歌学者]
  • Pan Z.,Zhang H.,Hague L.K.,Lee J.Y.,Lutz C.S.,Tian B.,Zhang-H.,海牙L.K.、Lee J.Y,Lutz C.S.、Tian B.、Hague LK.、Lee J.Y.、Lutz CS.、Tian B、Lutz-C.S.、Tian-B.人和小鼠CstF-77基因中的内含子多腺苷化位点表明了进化上保守的调控机制。基因。2006;366:325–334.[公共医学][谷歌学者]
  • Proudfoot N.J.、Furger A.、Dye M.J.、Farger A.,Dye M.J.、Dyee M.J.将mRNA处理与转录整合。单元格。2002;108:501–512.[公共医学][谷歌学者]
  • Pruitt K.D.、Maglott D.R.、Maglot D.R.RefSeq和LocusLink:以NCBI基因为中心的资源。核酸研究。2001;29:137–140. [PMC免费文章][公共医学][谷歌学者]
  • Ren S.、Rollins B.J.、Rolins B.J.Cyclin C/cdk3促进Rb-dependent G0退出。单元格。2004;117:239–251.[公共医学][谷歌学者]
  • Schwartz S.、Kent W.J.、Smit A.、Zhang Z.、Baertsch R.、Hardison R.C.、Haussler D.、Miller W.、Kent W/J.、史密特A.、Zheng Z.、Baertsch R、Hardisson R.C.、豪斯勒D.、Miller W.、Smit A、Zhang-Z.、Bartsch R.、Hardison R.C、Hausler D.、Mille W.、Bartsch R.C.、Hardisor R.、Haus斯勒D.、。,Miller W.、Hardison R.C.、Haussler D.、Miller W.Haussler-D.、Miller W、Miller W-人类-小鼠与BLASTZ的比对。基因组研究。2003;13:103–107. [PMC免费文章][公共医学][谷歌学者]
  • Takagaki Y.,Seipelt R.L.,Peterson M.L.,Manley J.L.,Seipellt R.L..,Peterson-ML.,Manley J.L..,彼得森-ML。单元格。1996;87:941–952.[公共医学][谷歌学者]
  • Thanaraj T.A.、Clark F.、Muilu J.、Clarks F.、Puilu J..、MuiluJ。小鼠中人类选择性剪接事件的保护。核酸研究。2003;31:2544–2552. [PMC免费文章][公共医学][谷歌学者]
  • 田B.,胡J.,张H.,Lutz C.S.,Hu J.,Zhang H.,Lutz C.S,ZhangH.,卢茨C.S.。人类和小鼠基因mRNA多聚腺苷化的大规模分析。核酸研究。2005;33:201–212. [PMC免费文章][公共医学][谷歌学者]
  • Wang Z.,Xiao X.,Van Nostrand E.,Burge C.B.,Xiao X.,Van Nostrand E.,Burge C.B.,Van Nostrand E.,Burge C.B.,Burge C.B.外显子剪接沉默子在剪接控制中的一般和特定功能。分子细胞。2006;23:61–70. [PMC免费文章][公共医学][谷歌学者]
  • West S.、Gromak N.、Norbury C.J.、Proudfoot N.J.、Gramak N.、Nobury C.J、Proudfut N.J.和Proudfoet N.J.,人类细胞中共转录裂解前信使RNA的腺苷化和外显体介导的降解。分子细胞。2006;21:437–443.[公共医学][谷歌学者]
  • Yan J.、Marr T.G.和Marr T.G。对EST的3′端进行的计算分析表明,在人类、小鼠和大鼠中存在四类选择性聚腺苷酸化。基因组研究。2005;15:369–375. [PMC免费文章][公共医学][谷歌学者]
  • Yeo G.W.、Van Nostrand E.、Holste D.、Poggio T.、Burge C.B.、Van Nostrand E.,Holste D、Poggio-T.、Burge-C.B.、Holster D.、Pogio T.、Berge C.B.、Buggio-T、Bugge C.B.人类和小鼠中保守的选择性剪接事件的鉴定和分析。程序。国家。阿卡德。科学。2005;102:2850–2855. [PMC免费文章][公共医学][谷歌学者]
  • Zhang H.,Lee J.Y.,Tian B.,Lee JY.,Tain B.,Tian B..人体组织中的选择性聚腺苷酸化偏倚。基因组生物学。2005;6:R100。 [PMC免费文章][公共医学][谷歌学者]
  • Zhao W.、Manley J.L.和Manley J.L。复杂的替代RNA处理产生了聚合酶亚型的意外多样性。分子细胞。生物。1996;16:2378–2386. [PMC免费文章][公共医学][谷歌学者]
  • Zhao J.,Hyman L.,Moore C.,Hymon L.,摩尔C.,摩尔C.真核生物中mRNA 3′的形成:机制、调节以及与mRNA合成中其他步骤的相互关系。微生物。分子生物学。版次。1999;63:405–445. [PMC免费文章][公共医学][谷歌学者]

文章来自基因组研究由以下人员提供冷泉港实验室出版社