A large-scale analysis of mRNA polyadenylation of human and mouse genes

Bin Tian; Jun Hu; Haibo Zhang; Carol S. Lutz

doi:10.1093/nar/gki158

核酸研究。2005; 33(1): 201–212.

2005年1月12日在线发布。数字对象标识：10.1093/nar/gki158号

预防性维修识别码：项目编号：546146

PMID：15647503

人和小鼠基因mRNA多聚腺苷化的大规模分析

田斌（Bin Tian）,^* 胡军,张海波,¹和卡罗尔·卢茨

作者信息文章注释版权和许可信息 PMC免责声明

关联数据

补充资料: 【补充资料】

nar_33_1_201_index.html（845字节）
GUID:EF6803CB-4E8C-4431-90B5-D6418D28ED48

nar_33_1_201_1.pdf（216000）
GUID:D7C61263-D8F5-416A-AC35-7A3DEB0B8995

摘要

mRNA多聚腺苷酸化是真核生物的一个重要细胞过程。它涉及新生信使核糖核酸的3′端切割和poly（A）尾的添加，poly（A）尾在信使核糖核酸的细胞代谢的许多方面发挥着重要作用顺式-解理位点周围的作用元件及其结合因子。在这项研究中，我们调查了13 942个人类基因和11 155个小鼠基因的含有切割位点的基因组区域[本文称为聚（A）位点]。我们发现，很大一部分人类和小鼠基因具有选择性多聚腺苷化（分别为～54%和32%）。人类和小鼠同源基因之间的选择性多聚腺苷酸化类型或多聚腺苷酸化构型的保守性具有统计学意义，这表明这两个物种广泛使用选择性多聚核苷酸化来产生选择性基因转录物。根据基因本体论注释，属于几个功能群的基因在多聚腺苷化构型方面存在偏见。许多poly（A）位点含有多个切割位点（51.25%的人类位点和46.97%的小鼠位点），导致转录物的3′末端形成不均一。这意味着聚腺苷化的裂解过程在很大程度上是不精确的。不同类型的聚（A）位点，就其在基因中的相对位置而言，被发现在周围基因组区域具有不同的核苷酸组成。这项大规模研究为哺乳动物多聚腺苷酸化机制提供了重要见解，并代表了通过选择性多聚腺苷酸化调节基因表达的基因组观点。

简介

所有完全处理的真核mRNA（除大多数组蛋白基因外）的3′端都有一个多聚（a）尾。聚（A）尾巴已被证明影响mRNA的稳定性、翻译和转运(1–三). 近年来人们对3′末端的形成有了更深入的了解，它与其他转录和转录后过程相互关联，如剪接和转录终止(4–7). 制造聚（A）尾巴的细胞过程称为聚腺苷酸化，是一个两步反应(8–12)首先涉及由多聚腺苷酸化因子结合决定的位点的特异性内切裂解。第二步涉及将腺苷尾聚合到特定于物种的长度，例如哺乳动物中的约150–250，酵母中的约55–90(13). 因为卵裂可能不精确(14,15)我们将切割位点称为mRNA切割发生的位置，将poly（a）位点称为包含切割位点的区域(图1A). 应该指出，这种可变的3′末端形成与涉及多个聚腺苷化位点的选择性聚腺苷酸化不同，下文将对此进行讨论。当单个聚（a）位点中存在多个解理位点时，用第一个（或最多5′）解理位点的位置来表示聚（B）位点的位置。此外，末端序列被称为包含poly（a）位点的基因组序列（−300至+300nt）(图1A).

在单独的窗口中打开

图1

(A类)聚（a）位点和聚腺苷化配置的示意图。在本研究中，聚（a）位点是包含解理位点（箭头线）的区域。5′-最解理位点是poly（A）位点的参考点（位置0）。因此，poly（a）位点的基因组位置由其包含的5′-最裂解位点的位置表示。序列−300到+300被定义为端子序列。还描述了CPSF和CstF的位置。(B类)三种类型的聚腺苷酸化构型。1型基因有一个poly（A）位点；Ⅱ型基因具有多聚a位点，均位于最外显子3′处；一个III型基因在不同的外显子上有交替的poly（a）位点。还标记了聚（A）位点的类型。1S，单聚（a）位点；2F，Ⅱ型基因中5′-最多聚（A）位点；2L，Ⅱ型基因中3′-最多聚（A）位点；2M是II型基因中介于2F和2L之间的中间poly（a）位点；3U，位于3′-最外显子上游的poly（a）位点；和在III型基因的3′-最外显子中的单个位点3S。图中未显示3F、3M和3L，它们分别与2F、2M和2L相似，只是前者位于III型基因的最外显子3′处。外显子表示为盒子；pA，poly（A）位点。

据报道，超过29%的人类基因有一个以上的多聚腺苷化位点(16). 替代性聚（A）位点可以位于最后或3′-最外显子，通常产生具有可变3′-非翻译区（3′-UTR）的mRNA，也可以位于不同外显子中，这可能导致具有可变3’-UTR的mRNA以及不同的蛋白产物(17). 这里，我们使用聚腺苷酸化构型来指代替代性聚腺苷酸化的类型(图1B). 由于3′-UTR通常包含对mRNA稳定性、mRNA定位和蛋白质翻译至关重要的关键序列元素，因此选择性聚腺苷酸化的作用是多重的。还研究了选择性多聚腺苷化对蛋白质变体的影响(17). 一般认为，聚腺苷酸化位点的选择与组织类型和发育阶段有关(12,14,17). IgM重链基因是替代性多聚腺苷化的一个著名例子(18). 在B淋巴细胞活化期间，IgM重链基因从使用一个多聚（A）位点切换到另一个，由于负责膜相互作用的C末端疏水区的缺失，导致蛋白质生产从膜结合形式转移到分泌形式。这种转换是免疫反应中的一个重要步骤。

选择特定的聚（a）位点可能涉及特定的顺式-作用元件和反式-影响因素。大多数哺乳动物基因的末端序列包含实际切割位点上游10到30个核苷酸之间的共有AAUAAA六聚体（或近变异体），作为切割和多聚腺苷化特异性因子（CPSF）的结合位点。它被称为聚腺苷酸化信号（PAS）、上游核心元件或AAUAAA基序。这里，我们使用PAS表示这个元素。一些关于PAS的研究表明，虽然大多数人类多聚腺苷酸化位点包含典型的AAUAAA（～70%），但大部分基因具有单核苷酸变体，其中AUUAAA是最常见的一种(16,19,20). 此外，位于切割位点下游20–40 nt的富含U或U/G的元件通过作为切割刺激因子（CstF）的结合位点参与指导多腺苷酸化。PAS和CstF结合位点一起被认为决定了聚腺苷酸化反应。此外，PAS上游和裂解位点下游的一些辅助元素已被表征为可以提高病毒和细胞系统中的聚腺苷化效率(21–27). 一般来说，人类聚（A）位点周围的核苷酸成分富含铀(28)，并可用于计算预测聚（A）位点，表明聚腺苷酸化中含有聚（A(28,29).

在本研究中，我们调查了大量人类和小鼠多聚腺苷化位点，在基因基因组结构的背景下描绘了它们的构型，并研究了人类和小鼠直系亲属之间多聚腺苷化构型的保守性。我们还研究了人和小鼠PAS六聚体、多聚腺苷酸裂解的异质性、基因功能与多聚腺苷酸构型之间的关系以及围绕不同类型多（A）位点的核苷酸组成。这项全面的研究将有助于理解哺乳动物物种中的选择性多聚腺苷酸化，并为mRNA多聚腺苷酸化的机制提供见解。

材料和方法

将cDNA/EST与基因组序列比对

我们使用了人类和小鼠UniGene数据库（NCBI，2004年3月版本）中列出的与LocusLink ID相关的所有序列，并将其与基因组序列对齐（人类基因组构建34.2和小鼠基因组构建32，均来自NCBI）。RefSeq mRNA和cDNA序列（NCBI GenBank 2004年3月发布）和EST（NCBI-dbEST 2004年3月份发布）使用默认设置的BLAST和MegaBLAST套件与基因组对齐（J.Hu和B.Tian，未发布数据）。简而言之，MegaBLAST首先用于查找序列的基因组位置，而BLAST用于填补MegaBLAS留下的空白。在这两个步骤中，使用最长增加子序列（LIS）算法组装高得分对（HSPs）(30)对序列长度的计算进行了修改（J.Hu和B.Tian，未发表的数据）。通过使用标准和非标准剪接位点的评分矩阵定位外显子末端(31)在组装好的热休克蛋白的5′端和3′端。结果与使用BLAT获得的结果相当(32)（未显示数据）。基因组上序列的转录方向首先由其剪接位点决定，例如GT.AG（分别为5′和3′剪接位点）表示有义方向，而CT.AC表示反义方向，和/或其poly（a）尾部（见下文），因为聚腺苷酸化仅发生在3′端。如果由剪接指示的序列的方向与其poly（a）尾的方向相冲突，则丢弃该序列。如果不能从序列中获得任何一条信息，这会自动指示序列没有poly（a）tail（因此在本研究中不感兴趣），那么该序列也将被丢弃。

在这项研究中，基因由来自NCBI的LocusLink条目表示(http://www.ncbi.nih.gov/LocusLink网站/). RefSeq mRNA序列用于表示基因转录本。如果一个基因有多个RefSeq序列，则其相应的基因组区域需要重叠，并且其转录方向需要相同。RefSeq序列不符合这两个标准的基因将被丢弃。因此，每个基因的方向和基因组位置可以使用其RefSeq（s）明确确定。UniGene数据库中列出的与基因相关的cDNA/EST需要满足以下标准：（i）序列的转录方向需要与其相关基因的转录方向一致。（ii）与cDNA/EST对齐的基因组区域需要通过32 nt序列或整个外显子（cDNA/EST或RefSeq）与相应基因的RefSeq序列重叠。这是为了消除UniGene数据库中与LocusLink ID错误关联的序列。此外，它丢弃了位于其他基因内含子区域的序列。

对于每个基因，其RefSeqs的最3′-内含子/外显子连接被任意定义为该基因的最3’-内含子和外显子的连接。因此，基因的3′-最外显子由其RefSeqs决定。使用RefSeq GenBank注释文件定位基因的终止密码子。如果一个基因有多个终止密码子，则使用3′-most。

Poly（A）位点测定

对齐后，对与基因组序列对齐的cDNA/EST序列进行聚（A）尾检测。cDNA/EST的5′和3′端的未对齐序列分别检测T和a的延伸。对于3′端，如果序列在未对齐位置之后（i）包含8个或更多连续的As，或（ii）如果序列有一个其他核苷酸，则在其他核苷酸之后有8个或多个连续的As.，则认为序列具有多（a）尾。除了搜索连续的Ts外，5′端的标准相同。

对于包含多聚（A）尾的序列，基因组上的多聚（A）裂解位点被认为位于cDNA/EST与基因组对齐的最高位3′之后。为了解决内部启动问题，对切割位点周围的基因组序列−10到+10 nt进行了检测。如果序列在一个10 nt的窗口中有6个连续的As或大于7个As，则它被视为内部启动候选，与其他组所用的类似(16,33). 然而，如果一个内部启动候选位点由多个cDNA/EST支持，并且在−40到−1 nt区域有12个PAS六聚体之一(16)，它被认为是一个真实的网站。由于聚腺苷酸化裂解的不均一性，我们在24 nt内迭代聚集相邻的聚（A）裂解位点，即从5′-最高位开始，继续聚集裂解位点的过程，直到24 nt内没有相邻的裂解位点。我们使用一组聚集位点的5′-最解理位点作为poly（a）位点的参考位点。与poly（a）位点相关的cDNA/EST的数量是支持其组成切割位点的所有cDNA/EST的总和。在切割位点聚集后，如果一个poly（a）位点具有至少两个支持的cDNA/EST序列，或者在poly（a）位点的−40到−1区域中具有PAS六聚体（AAUAAA或11个变体），则认为它是一个真正的poly（B）位点。

PAS的识别

我们使用了Beaudoi开发的方法等. (16)识别PAS。简言之，检测到所有poly（A）位点−40至−1区域中最常见的六聚体，并删除包含六聚体的序列。重复该过程，直到剩下不到5%的序列。

人和小鼠同源基因的保护研究

人类和小鼠的同源基因来自同源基因数据库(ftp://ftp.ncbi.nih.gov/pub/HomoloGene公司/). 仅使用蛋白质序列的相互最佳BLAST命中。皮尔逊χ²-test用于确定同源物之间聚腺苷化构型的保守性。预期值通过χ获得²-R程序中的测试功能(http://www.r-project.org/).

基因本体分析

基因的基因本体注释来自NCBI的LocusLink数据库。生物过程（BP）、细胞成分（CC）和分子功能（MF）三类GO术语的完整列表可从基因本体联盟网站下载(http://www.geneontology.org/). 对于每个GO术语，所有相关的GO术语都是通过递归方法找到的，该方法通过“is a”或“part of”关系搜索整个基因本体树中的相关条目。共发现7315个GO项（3607个BP、690个CC和3039个MF）与9057个人类基因和7700个小鼠基因相关。使用2×2表进行Fisher精确检验，以评估每个GO项的聚腺苷酸化构型偏差。在表中，有两列是组成性聚腺苷酸化和选择性聚腺苷酸化，两行是“有GO项”和“没有GO项“。III型基因的测试以类似的方式进行，但其中一列是“III型基因”，另一列则是“不是III型基因。”。采用Benjamini和Hochberg方法消除多次测试产生的假阳性(34).

聚（A）位点类型和PAS六聚体的热图和双向聚类

热图由R中的图像函数生成(35). 利用欧氏距离进行层次聚类，生成树状图。

poly（A）位点的序列分析

对于每个poly（A）位点，从基因组中获得了与切割位点相邻的末端序列−300到+300 nt。如果一个切割位点位于距离基因组连接末端不到300 nt的位置，则使用切割位点和连接末端之间的序列。

结果

人类和小鼠基因组上poly（A）位点的定位

人类和小鼠几乎完整的基因组序列以及大量它们各自的cDNA和EST序列（本文统称为cDNA/EST，不同之处在于EST通常是转录物的部分序列，cDNA通常是全长的）的可用性为研究聚腺苷酸化提供了前所未有的机会。使用NCBI的一系列数据库，包括UniGene、LocusLink、RefSeq、dbEST和GenBank数据库（参见材料和方法），我们在基因组上绘制了大量人类和小鼠poly（a）位点(表1). 我们采用以基因为中心的方法，通过使用LocusLink条目来表示基因及其相关的RefSeq mRNA来表示转录本。然后将cDNA/EST映射到RefSeq序列。

表1

在人类和小鼠基因中鉴定的Poly（A）位点

	智人	小家鼠
使用的cDNA/EST^一	3 619 860	2 676 296
带有poly（A）尾部的cDNA／EST^b条	396 908	108 691
劈裂场地	67 440	31 179
Poly（A）位点	29 283	16 282
LocusLink条目	13 942	11 155
每个基因的多聚（A）位点	2.10	1.46

在单独的窗口中打开

^一UniGene数据库中的cDNA/EST序列数。

^b条使用材料和方法中详述的方法进行序列清理后。UniGene数据库中列出的cDNA/EST序列从GenBank和dbEST下载。序列与人类和小鼠基因组对齐，并鉴定和聚集聚（A）裂解位点（详见材料和方法）。根据UniGene数据库将cDNA/EST映射到LocusLink ID。

我们在13942个人类基因中29 283个poly（A）位点中鉴定了67 440个cDNA/ESTs支持的切割位点，在11 155个小鼠基因中16 282个polyA位点中鉴定出31 179个切割位点。据我们所知，这是迄今为止最全面的地图。每个基因的平均poly（A）位点对于人类基因为2.1，对于小鼠基因为~1.5。人和小鼠的数字之间的差异主要归因于以下事实：小鼠基因的cDNA/EST序列较少，其中有较少比例的基因具有poly（a）尾巴（11%的人类cDNA/EST与4%的小鼠cDNA/ES），导致人类基因具有比小鼠基因多约3.7倍的poly（a）尾巴cDNA/ETS(表1).

当存在多个位点时，基因中相邻多（A）位点之间的基因组距离分布显示两种模式(图2A)人类基因的一个峰位于～300 nt，另一个峰在～14 kb（小鼠基因显示类似分布，见补充材料）。这两种模式似乎分别对应于位于3′-最外显子的交替poly（A）位点和位于不同外显子中的交替polyA位点。这是基于以下观察结果：当我们仅使用位于RefSeq序列定义的最外显子3′的poly（A）位点时（参见材料和方法），我们可以看到类似于左峰的单模分布图2A(图2B). 在3′-最外显子中相邻poly（A）位点之间的距离，人类基因的中位数为288 nt，小鼠基因为345 nt。基因的终止密码子与其最接近的下游poly（a）位点之间的距离，人类基因的中值为324 nt(图2C)小鼠基因为385 nt（补充图2C）。

在单独的窗口中打开

图2

人类基因的聚（A）位点。(A类)基因中相邻多聚（A）位点之间的基因组距离直方图。(B类)相邻poly（A）位点之间的距离直方图，均位于基因的最外显子3′处（中位数=288nt）。(C类)终止密码子与其最近的下游poly（A）位点之间的距离直方图（中值=324 nt）。这个x个-所有图形中的轴都是以2为底的对数刻度。对于每个直方图，使用高斯平滑核方法生成密度线。

我们使用Beaudoi开发的方法研究了poly（A）位点上游−40到−1区域的PAS等. (16). 如所示表2，人类和小鼠poly（A）位点出现最多的PAS六聚体的频率非常相似，前五个六聚体具有相同的等级。AAUAAA和11个单核苷酸变体是检测到的显著六聚体。UUUAAA是其他六聚体中最常见的六聚体。人类多聚（A）位点顶部PAS六聚体的频率与Beaudoi报告的频率相似等.，但AAGAAA除外，其出现率在我们的结果中较高。因此，在本研究中，我们重点关注AAUAAA和11个单核苷酸变体，它们与约92%的人类和93%的小鼠多聚（A）位点相关。

表2

顶部检测到的PAS六聚体

	频率（%）			排名
	Hs公司	嗯	Hs（高度）。B类	Hs公司	嗯	Hs（高度）。B类
AAUAAA公司	53.18	59.16	58.2	1	1	1
AUUAAA公司	16.78	16.11	14.9	2	2	2
UAUAAA公司	4.37	3.79	3.2	三	三	三
AGUAAA公司	3.72	3.28	2.7	4	4	4
美国汽车协会	2.99	2.15	1.1	5	5	10
AAUAUA公司	2.13	1.71	1.7	6	7	5
AAUACA公司	2.03	1.65	1.2	7	8	8
CAUAA公司	1.92	1.80	1.3	8	6	6
GAUAAA公司	1.75	1.16	1.3	9	9	7
AAUGAA公司	1.56	0.90	0.8	10	11	11
UUUAAA公司	1.20	1.08	1.2	11	10	9
ACUAAA公司	0.93	0.64	0.6	12	12	13
AAUAGA公司	0.60	0.36	0.7	13	15	12

在单独的窗口中打开

使用位于poly（A）位点上游−40到−1 nt的人类和小鼠基因组序列检测可能作为聚腺苷酸化信号的六聚体。Hs，人类序列；Mm，鼠标序列；和Hs。B、 Beaudo报告的人类结果等. (16).

解理位点的异质性

我们发现大量聚（a）位点具有不止一个解理位点，正如其他组之前所指出的那样(14,15). 具体而言，51.25%的人类和46.97%的小鼠poly（A）位点有一个以上的卵裂位点；人类poly（A）位点的平均解理位点数为2.30个，SD为1.91，小鼠位点的平均断裂位点数为1.92，SD为1.33。在这两种情况下，每个聚（A）位点的解理位点数量的分布都不正常（高斯）。事实上，如果我们不聚类相邻的解理位点，相邻解理位点之间距离的直方图将产生三种模式(图3A)，在第一种模式下（图3A)对应于异质解理位点之间的距离。其他两种模式类似于从中所示的替代poly（A）位点导出的两个峰值图2A由于从拟合密度线导出的第一和第二模式之间在～24 nt处有一个谷(图3A)因此，我们迭代地将位于24nt内的所有解理位点聚集在一起。当一个poly（a）位点中存在多个解理位点时，聚集后5′-最解理位点与其他解理位点之间的距离如所示图2B由于大多数（>95%）的距离小于24nt，我们得出结论，poly（A）解理的异质性通常发生在5′-最解理位置之后的24nt内。

在单独的窗口中打开

图3

聚（a）位点中有多个解理位点。(A类)基因中相邻切割位点之间的基因组距离直方图。(B类)当poly（a）位点中存在多个切割位点时，5′端切割位点与其他下游切割位点之间的距离直方图（平均值=7.9nt，中位数=5nt）。(C类)与聚（a）位点相关的PAS六聚体（AAUAAA和其他11个变体）数量与聚（B）位点中的裂解位点数量之间的关系。误差条是平均值的标准误差（SEM）。(D类)多（A）位点的裂解位点数量与支持cDNA/EST序列数量之间的相关性（皮尔逊相关系数R（右）= 0.83). (E类)当只有一个PAS时，聚（a）位点与相关PAS之间的距离直方图。（A–E）中仅使用人类聚（A）位点。

为了研究导致这种异质性的机制，我们研究了PAS和裂解位点的支持cDNA/EST。我们发现mRNA切割的异质性似乎不是poly（a）位点上游多个PAS的结果(图3C)，但似乎与poly（a）位点具有的支持cDNA/EST的数量相关(图3D). 皮尔逊相关性R（右）当支持cDNA/EST的数量和卵裂位点的数量均为对数时，人类poly（A）位点为0.83，小鼠poly（A）位点为0.75。因此，解理位点的异质性一般是由于解理位置的随机选择。换句话说，研究的序列越多，发现异质解理位点的可能性越高。由于我们将cDNA/EST与基因组序列对齐的方法总是将聚（a）尾部的5′-最大腺苷与基因组序列匹配，如果−1位置是腺苷，我们不知道是否存在任何核苷酸对切割位点的偏好，例如之前报道的a>U>C≫G顺序(36).

对于仅与一个PAS相关的多（A）位点，我们测量了PAS的5′-最裂解位点和第一个核苷酸之间的距离(图3E). 中值为21 nt，这与之前的调查一致(16,36). 有趣的是，少量poly（a）位点与PAS非常接近。对所有12个PAS六聚体的仔细检查表明，它们主要是与AAGAAA相关的多聚（A）位点（补充图3），通常位于3′-最外显子的外显子上游（见下文）。讨论部分提供了这一发现的可能生物学意义。

人类和小鼠基因中广泛存在的替代性多腺苷酸化

poly（A）位点间基因组距离的双模分布(图2A)促使我们根据多聚（A）位点的位置对基因进行分类。爱德华兹-吉尔伯特等. (17)提出了三种类型的选择性聚腺苷酸化，即（i）串联多聚（A）位点，（ii）与复合in/末端外显子耦联，以及（iii）与跳跃外显子耦合。与此一致，我们根据其多聚腺苷化构型对基因进行了分类，如图1B只有一个poly（A）位点的基因被归类为I型基因，在3′-最外显子中具有多个poly。为了简单起见，我们没有区分Edwards-Gilbert提出的B型和C型选择性聚腺苷化等. (17)，这是由两种不同的选择性剪接机制产生的。相反，它们统称为III型基因，其中选择性多聚腺苷化与剪接有关。因此，I型基因有一个单一的组成poly（a）位点，而II型和III型基因有替代poly（a）位点。

我们发现，约54%的人类基因和约32%的小鼠基因具有多个poly（A）位点(表3). 这些数字明显高于先前所认为的选择性聚腺苷化的发生率。人类和小鼠体型之间的差异至少部分归因于小鼠多聚（A）尾部cDNA/EST比人类少(表1). 然而，人和小鼠同源基因之间多聚腺苷化构型的保守性具有统计学意义(P（P）-值2.0×10⁻¹³²使用χ²-测试；图4). 相应的人类和小鼠多聚腺苷酸化配置的所有值都比预期值高1.2倍以上，这表明替代性多聚腺苷酸化是人类和小鼠同源基因之间进化保守的细胞过程。

在单独的窗口中打开

图4

人和小鼠直系亲属间多聚腺苷化构型的保护。(A类)人（行）和鼠（列）直系物之间多聚腺苷化构型的保存（χ²-测试，P（P）-值=2.0×10⁻¹³²). 括号中显示了基于无相关性的零假设的预期值。（A）中的观察值绘制为(B类)，闭合条对应于保守配置，即人类i型与小鼠i型等。

表3

根据mRNA多聚腺苷化的构型对基因进行分类

	智人	小家鼠
基因数量	13 942	11 155
I型基因	6418	7576
II型基因	4416	2681
III型基因	3108	898
本构聚（A）位点	46.03%	67.92%
替代聚（A）位点	53.97%	32.08%

在单独的窗口中打开

基因根据mRNA多聚腺苷化的结构分类图1B.

为了解决基因的某些功能群是否具有偏向性多聚腺苷化构型的问题，我们研究了基因本体（GO）注释所示的基因功能与多聚腺苷化构型之间的关系。我们使用了多聚腺苷化结构在人类和小鼠同源基因之间保守的基因(图4). 共研究了7315个GO术语，分为三类，即生物过程、细胞成分和分子功能(表4). 发现功能与细胞表面受体连接的位点转导（生物过程）、细胞外基因（细胞成分）和位点转导活性（分子功能）相关的基因与I型组成型多腺苷酸化不成比例地相关(表4). 被发现与选择性多聚腺苷化异常相关的基因包括编码细胞内蛋白质（细胞成分）、参与细胞内蛋白质转运（生物过程）的蛋白质和具有蛋白质转运活性（分子功能）的蛋白质的基因。因此，具有细胞外蛋白产物的基因往往具有组成性多聚腺苷化位点，而具有细胞内蛋白产物的基因组倾向于选择性多聚腺苷化。此外，发现蛋白质产物位于细胞核并具有RNA-结合活性的基因与III型构型（即与剪接相关）不成比例地相关。

表4

基因本体术语与不同类型的多聚腺苷化构型不成比例地相关

GO术语^一	类型^b条	智人	小家鼠
生物过程
GO:0007166（细胞表面受体相关位点转导）	我	1.15E−04（171、37、3）	9.38E−06（154、30、1）
GO：0046907（细胞内运输）	II和III	1.29E−07（60、59、7）	1.57E−08（64、68、5）
GO:0015031（蛋白质运输）		1.41E−07（49、53、5）	1.53E−07（54、59、3）
GO:0006886（细胞内蛋白质转运）^c（c）		7.25E−08（46、52、5）	5.95E−07（51、55、3）
蜂窝组件
GO:0005576（细胞外）	我	9.98E−05（168、32、8）	2.54E−10（518、115、24）
GO:0005622（细胞内）	II和III	6.32E−08（819、337、109）	1.62E−04（826、335、92）
GO:0005524（核心）	三	7.84E−05（393、162、66）	2.50E−04（376、143、53）
分子功能
GO:0004871（现场传感器活动）	我	4.94E−06（344、77、18）	3.81E−06（315、71、13）
GO:0008565（蛋白质转运活性）	II和III	4.52E−07（30、42、1）	3.41E−07（25、40、0）
GO:0003723（RNA结合）	三	1.17E−05（46、32、19）	1.12E−04（40、22、14）

在单独的窗口中打开

^一对于每个GO术语，给出了其GO ID和注释（括号中）。

^b条类型是聚腺苷化配置的类型（如图1B).

^c（c）GO:0006886（细胞内蛋白质转运）通过“is a”关系与GO:0046907（细胞内转运）和GO:0015031（蛋白质转运）相关（有关详细信息，请参阅材料和方法）。研究了三类GO（生物过程、细胞成分和分子功能）与聚腺苷化构型的关系。对于一个物种中的每个GO项P（P）-提供了Fisher精确测试的值，该值表明了GO项与聚腺苷化构型之间关联的重要性，即P（P）-使用Benjamanini和Hochberg方法进行多次测试调整，以选择重要的GO项。括号中列出了三种多聚腺苷化配置（即i型、II型和III型）中的基因数量。例如，（171，37，3）表示171个I型基因，37个II型基因和3个III型基因。

不同类型聚（A）位点的特征

为了进一步表征具有不同poly（A）构型的基因中的poly（A）位点，我们根据poly（A）位点在基因中的位置对其进行了分类(图1B). poly（A）位点可以是以下九种类型之一：1S，I型基因中的单个poly（A）位点；2F，Ⅱ型基因中5′-最多聚（A）位点；2L，Ⅱ型基因中3′-最多聚（A）位点；2M是II型基因中介于2F和2L之间的中间poly（a）位点，如果它有两个以上的位点；3U，一个poly（a）位点，位于III型基因最外显子3′的上游，位于内含子区或外显子区；3F是III型基因最外显子3′的第一个位点；3L，III型基因中3′-最多的位点；3M是3F和3L之间的中间poly（a）位点，如果在3′-最外显子中有两个以上的位点；和3S，即III型基因最外显子3′端的单个poly（A）位点。

我们研究了所有类型的poly（A）位点的−40到−1区域，以使用12种PAS(16). 如所示图5A不同类型的poly（A）位点在不同程度上使用不同的PAS六聚体。对于组成型聚（A）位点（1S），其中约70%具有AAUAAA，15%具有AUUAAA，12%具有其他10种类型的PAS六聚体，其中约4%不具有任何已知的PAS六聚体。在3S中观察到几乎相同的模式。在2F和3F、2M和3M以及2L和3L之间也观察到PAS的类似用法。总的来说，根据PAS六聚体的使用情况，九种类型的聚（A）位点似乎分为两组。一组包括1S、2L、3L和3S。与其他类型的PAS六聚体相比，他们倾向于使用AAUAAA（>60%）。另一组包括2F、2M、3F、3M和3U，每种类型的位点中<50%含有AAUAAA，>35%使用除AAUAAA和AUUAAA外的PAS六聚体。有趣的是，与AAUAAA（38-70%）相比，含有AUUAAA的位点的百分比在所有类型的聚（A）位点之间变化不大（14-19%）。使用PAS六聚体在不同类型的聚（A）位点中的分布进行聚类分析也支持这种分组(图5B). PAS六聚体也可以按类似方式分组。有趣的是，与其他非AUUAAA变体相比，3U型中似乎存在AAGAAA。事实上，如果我们将每个PAS六聚体的poly（A）位点总数设置为100%，我们可以看到3U中更明显的AAGAAA存在（数据未显示）。

在单独的窗口中打开

图5

不同类型聚（A）位点的特征。(A类)不同PAS六聚体与不同类型聚（A）位点的关联[有关九种类型聚（A）位点的详细定义，请参见图1B和结果]。(B类)PAS六聚体和聚（A）型的聚类分析。灰度热图表示PAS六聚体在不同聚（A）类型中的使用百分比，每个聚（B）类型的所有值之和设置为100%。单元格的阴影表示其值，较深的单元格对应较高的值。以欧几里德距离为度量指标进行双向层次聚类。(C类)不同类型poly（A）位点的支持cDNA/EST序列的数量百分比。基因的支持cDNA/EST序列总数设置为100%。(D类)不同类型poly（A）位点的每个poly（A）位点的解理位点数量分布。不同的色度用于表示每个poly（A）位点的解理位点数量。

这一分组符合这样的观点，即3′-最多聚（A）位点通常是基因中所有位点中“最强”的位点(28). 进一步支持这一点的是cDNA/EST序列的数量(图5C). 与其他类型的poly（A）位点相比，基因的3′端poly（A）位点，如2L、3L和3S，具有更多的支持cDNA/EST序列。如果只使用非标准化cDNA文库，预计差异会更大。由于支持cDNA/EST的数量与切割位点的数量之间的相关性，当我们研究不同类型poly（a）位点的每个poly（a）位点的切割位点数量时，如预期的那样，观察到了类似的模式(图5D). 约70%的1S和3S poly（A）位点有一个以上的解理位点；～2L和3L为55%；2F、2M、3F和3M为45–49%；3U仅为～20%。

这一结果表明，mRNA序列的主要形式通常是最长的形式，由最长的3′-聚（A）位点产生，并采用交替的聚腺苷酸化来缩短mRNA。这种调控模式的确切含义可能因基因而异，因为调控区的序列可能包含顺式参与RNA代谢各个方面的元素，如RNA定位、翻译和RNA稳定性。

接下来，我们检查了poly（A）位点基因组序列的核苷酸组成。对于每个poly（A）位点，我们选择了围绕解理位点从−300到+300 nt的末端序列(图6). 对于所有类型的poly（A）位点，−100到+100区域的核苷酸组成与裂解位点的上游（<−100）或下游（>+100）区域不同。正如之前报道的那样，在这个窗口中，它总是富含铀(28)，在+20左右出现峰值，通常称为CstF-结合位点。区域−40至−10富含A，这会导致U含量下降。该区域与含有PAS六聚体的区域一致。

在单独的窗口中打开

图6

人类末端序列的核苷酸组成。绘制了包含九种类型poly（A）位点的人类末端序列。poly（A）位点类型标记在每个图中，用于每个图的序列数显示在括号中。这个年-每个图的轴是核苷酸的百分比（%）x个-轴是相对于poly（A）位点的基因组位置（nt）。请参见图1B和九种poly（A）位点类型的详细定义的结果。

尽管−100到+100区域相似，但不同类型的聚（A）位点之间存在显著差异。1S和3S型Poly（A）位点在−100上游和+100下游区域的GC和AU含量相似，而其他类型Poly（A）位点在这些区域的AU含量高于GC。然而，对于3′-最外显子（2F和3F）中的第一个poly（A）位点，上游区域（−300到−100）中AU和GC含量的差异小于下游区域（+100到+300）。有趣的是，对于3′-最多聚（A）位点（2L和3L），下游区域的AU和GC含量差异似乎小于上游区域。换句话说，5′-最具选择性的poly（A）位点的上游区域和3′-最具有选择性的poly-A位点的下游区域类似于本构位点的上游和下游区域。相反，3U、2M和3M聚（A）位点在−100上游的序列和+100下游的序列中具有相似的核苷酸组成，并且它们都富含AU。这种AU丰度在小鼠poly（A）位点中也可以识别，但程度较低（补充图5）。

讨论

我们调查了大量人类和小鼠的poly（a）位点基因。令人惊讶的是，我们发现约54%的人类基因和32%的小鼠基因具有多个可供选择的poly（A）位点。研究发现，人类和小鼠同源基因之间的多聚腺苷化构型保持具有统计学意义。这两个数字高于先前一项人类基因研究中获得的29%(16). 我们认为这主要归因于两个因素(1). 在本研究中，我们使用了更多的cDNA/EST。在Beaudoi及其同事的研究中，他们使用了157 775条含有EST的聚（A）尾巴，用于8775个UTR序列。序列清理后，消除了>23%的序列，平均UTR序列得到<14个EST的支持。在这项研究中，我们使用了396908个含有poly（A）尾的cDNA/EST（使用旨在在基因组比对步骤和poly（A）尾鉴定步骤丢弃有问题的cDNA/EST的标准；参见材料和方法），共有13942个人类基因，每个基因约有28个支持cDNA/EST。考虑到人类和小鼠数量的差异（54%对32%），这也是由于每个基因支持cDNA/EST数量的差异，这两项研究中确定的poly（A）位点数量的差异并不令人惊讶。然而，我们认为我们发现的大多数额外的poly（A）位点可能是弱位点，在少量cDNA/EST中难以找到(2). Beaudoi及其同事采用了以UTR为中心的方法，将EST映射到UTR序列。UTR用于表示mRNA，以找到mRNA序列的真正3′端。因此，Beaudoi及其同事的研究实际上侧重于发生在3′-最外显子的选择性聚腺苷酸化，因为大多数3′-UTR位于3′-最多外显子（数据未显示）。在这里，我们使用了一种以基因为中心的方法，其中cDNA/EST被映射到基因组，这使我们能够研究选择性多腺苷酸化与剪接。事实上，如果我们不考虑位于3′-最外显子上游的poly（A）位点，具有选择性多聚腺苷酸化的基因百分比将下降10%至约44%。然而，这两项研究都发现PAS六聚体AAUAAA的使用率相似（博多58.2%等和AUUAAA（分别为14.9%和17%）。但两项研究中含有其他类型PAS六聚体和不含PAS六聚合体的聚（A）位点的百分比不同。在博杜伊等.的研究表明，约15%的poly（A）位点包含10个PAS六聚体变体中的一个，而～22%的poly。在我们的研究中，这两个数字分别为～22%和～8%。区别在于，在我们的研究中，如果没有发现PAS六聚体，我们需要不止一个cDNA/EST序列。

我们的研究表明，选择性聚腺苷酸化在人类和小鼠中都很普遍。此外，大量人类和小鼠直系同源基因具有保守的多聚腺苷化构型，突出了其在生产可变基因产物，即mRNA和/或蛋白质方面的重要性。一些基因组与某些类型的聚（A）构型不成比例地相关。虽然编码细胞外蛋白的基因通常具有单一的poly（A）位点，而编码细胞内蛋白的基因往往具有其他poly（A）位点，但其生物学意义尚未阐明。有趣的是，编码RNA结合蛋白的基因往往具有替代的聚（A）位点，并且被发现与III型多腺苷酸化构型（即与剪接偶联的替代多腺苷酸化）不成比例地相关。

我们观察到，在最外显子3′的上游有大量poly（a）位点，即3U型poly（a）位点，这就提出了一个有趣的问题，即这种选择性聚腺苷酸化在基因调控中的作用。其生物学后果包括蛋白质序列的改变，例如IgM基因，或者如果产生的转录物缺少终止密码子，则mRNA会不间断地衰减(37). 需要进行广泛的研究，以阐明3′-最外显子上游mRNA多聚腺苷化的意义。有趣的是，发现AAGAAA PAS六聚体与3U型聚（A）位点不成比例地相关。通过详尽的六聚体搜索，发现AAGAAA作为PAS具有统计学意义(16). 然而，先前的生化研究表明，将AAUAAA突变为AAGAAA可以消除聚腺苷酸化(22,38). AAGAAA也被证明是外显子剪接增强子(39). 这个元素有可能在这两个过程中都发挥作用。基于剪接和聚腺苷酸化之间关系的现有知识，一个有吸引力的模型是剪接因子和聚腺苷酸化因子之间存在竞争，以结合AAGAAA。如果剪接因子能够与聚腺苷酸化因子有利竞争，则会发生剪接，这也会阻止相邻的聚腺苷酸化。同样，如果多聚腺苷酸化因子成功结合，则会发生多聚腺苷酸化，而不是剪接。由于AAGAAA到裂解位点的距离比其他类型的PAS六聚体（补充材料）短，我们认为所涉及的聚腺苷酸化机制可能与3′-最外显子的聚腺苷酸化过程中所涉及的机制不同。然而，这一假设需要大量的实验证据来评估其有效性。

在以往对单个基因的研究中，通过实验发现了mRNA切割的异质性(15,22,36,40). 在这里，通过大规模调查，我们证明了约51%的人类和47%的小鼠poly（a）位点具有多个卵裂位点。虽然异质性可能不是由多个PAS六聚体的存在引起的，但支持cDNA/EST的数量与切割位点的数量之间似乎存在相关性。这表明，切割位置的确定可能是随机的，尽管可能会有人偏好选择准确的切割位置，如生化分析中所示(36). 然而，其他身份不明者的参与顺式在确定解理位点时，不能排除聚（A）位点中的元素。然而，这种异质性表明了多聚腺苷化酶复合物进行RNA切割的不精确性。事实上，有人认为，基础聚腺苷酸化机制和mRNA之间的相互作用可能为灵活性、调节性和异质性提供了一些“机会”(15,22). 另一方面，cDNA/EST序列的质量也使情况复杂化，因为错误更多地发生在序列的末尾。然而，我们并不认为这是一个主要因素，因为错误的序列必须与我们研究中考虑的基因组序列完全匹配。

我们的数据表明，不同类型的聚（A）位点被不同核苷酸组成的序列包围。通常，−100到+100序列显示A和U的核苷酸偏倚。然而，位于其他poly（A）位点之间的替代poly（A）位点显示，在−100至+100区域之外，AU含量较高。这不太可能是由相邻的poly（A）位点引起的，因为在3′-最外显子中替代poly（A）位点之间的中位数距离约为288 nt。此外，当我们使用仅包含一个poly（B）位点的末端序列时（在上游和下游300 nt内没有其他poly（C）位点），我们仍然可以看到这种模式（数据未显示）。另一方面，蛋白质编码序列虽然有助于末端序列的核苷酸组成，但似乎不会改变总体趋势（补充图6）。这部分是因为终止密码子和第一个下游poly（A）位点之间的距离中值为324 nt。独特的AU富集环境为窝藏提供了机会顺式富含A和U的元素。一个显著的例子是被称为AREs的富含AU的特定元素，它们负责靶向许多哺乳动物的mRNA进行快速衰变(41,42). 已经鉴定出许多与这些元素结合的蛋白质。在某些情况下，蛋白质与RNA的相互作用似乎可以稳定mRNA(43–45)而在其他情况下，这种相互作用会破坏mRNA的稳定性(46). AU富集区与选择性聚（A）位点相关这一事实表明，选择性聚腺苷酸化可以有效调节mRNA的稳定性。然而，其他顺式参与mRNA代谢其他方面的元素也可以位于这个AU丰富的区域，因此受多聚腺苷化的选择性调控。

补充材料

补充材料可在NAR Online上获得。

补充材料

【补充材料】

单击此处查看。

致谢

我们感谢梅丽莎·罗杰斯（Melissa Rogers）、杰弗里·威鲁斯（Jeffrey Wilusz）以及B.T.和C.S.L.实验室的成员进行了鼓舞人心的讨论并提出了有益的建议，感谢三位匿名评论员提出了许多建设性意见。C.S.L.获得了美国癌症学会RPG-00-265-01-GMC、关节炎研究者奖2AI-LUT-A-5、NIH 5R03-HD042464-02和NSF奖MCB-0426195的资助。UMDNJ为支付本文的开放存取出版费用提供了资金。

参考文献

1.Lewis J.D.、Gunderson S.I.、Mattaj I.W.《5′端和3′端结构对前mRNA代谢的影响》。J.细胞。科学。供应商。1995;19:13–19.[公共医学][谷歌学者]

2Jacobson A.，Peltz S.W.真核细胞中mRNA衰变和翻译途径的相互关系。每年。生物化学评论。1996;65:693–739.[公共医学][谷歌学者]

三。Wickens M.、Anderson P.、Jackson R.J.《细胞质中的生与死：来自3′端的信息》。货币。操作。基因。开发。1997;7:220–232.[公共医学][谷歌学者]

4Maniatis T.，Reed R.基因表达机器之间广泛的耦合网络。自然。2002;416:499–506.[公共医学][谷歌学者]

5Proudfoot N.信使RNA 3′末端形成与转录连接的新观点。货币。操作。单元格。生物。2004;16:272–278.[公共医学][谷歌学者]

6Neugebauer K.M.关于共同转录的重要性。J.细胞。科学。2002;115:3865–3871.[公共医学][谷歌学者]

7Calvo O.，Manley J.L.《奇怪的床友：启动子处的多聚腺苷酸化因子》。基因发育。2003;17:1321–1327.[公共医学][谷歌学者]

8Wahle E.，Kuhn U.真核细胞前信使核糖核酸3′切割和多腺苷酸化的机制。掠夺。核酸研究分子生物学。1997;57:41–71.[公共医学][谷歌学者]

9Keller W.，Minvielle-Sebastia L.哺乳动物和酵母前mRNA 3′末端加工的比较。货币。操作。单元格。生物。1997;9:329–336.[公共医学][谷歌学者]

10Colgan D.F.，Manley J.L.mRNA多聚腺苷化的机制和调节。基因发育。1997;11:2755–2766.[公共医学][谷歌学者]

11Edmonds M.聚A序列的历史：从形成到因子再到功能。掠夺。核酸研究分子生物学。2002;71:285–389.[公共医学][谷歌学者]

12Zhao J.，Hyman L.，Moore C.真核生物中mRNA 3′的形成：机制、调节以及与mRNA合成中其他步骤的相互关系。微生物。分子生物学。版次。1999;63:405–445. [PMC免费文章][公共医学][谷歌学者]

13Brown C.E.，Sachs A.B.Poly（A）尾部长度控制酿酒酵母通过消息特定的二烯基化发生。摩尔细胞。生物。1998;18:6548–6559. [PMC免费文章][公共医学][谷歌学者]

14Beaudoi E.，Gautheret D.使用EST数据鉴定交替多聚腺苷化位点并分析其组织分布。基因组研究。2001;11:1520–1526. [PMC免费文章][公共医学][谷歌学者]

15Pauws E.、van Kampen A.H.、van de Graaf S.A.、de Vijlder J.J.、Ris-Stalpers C.哺乳动物mRNA序列中多聚腺苷酸裂解位点的异质性：对SAGE分析的影响。核酸研究。2001;29:1690–1694. [PMC免费文章][公共医学][谷歌学者]

16Beaudoi E.、Freier S.、Wyatt J.R.、Claverie J.M.、Gautheret D.人类基因中变异多聚腺苷酸化信号的使用模式。基因组研究。2000;10:1001–1010. [PMC免费文章][公共医学][谷歌学者]

17Edwards-Gilbert G.，Veraldi K.L.，Milcarek C.复杂转录单位中的选择性多（A）位点选择：目的是什么？核酸研究。1997;25:2547–2561. [PMC免费文章][公共医学][谷歌学者]

18Takagaki Y.，Seipelt R.L.，Peterson M.L.，Manley J.L.。多聚腺苷酸化因子CstF-64调节B细胞分化过程中IgM重链前体mRNA的选择性加工。单元格。1996;87:941–952.[公共医学][谷歌学者]

19Graber J.H.、Cantor C.R.、Mohr S.C.、Smith T.F。生物信息学控制信号检测：不同物种的mRNA 3′末端处理序列。程序。美国国家科学院。科学。美国。1999;96:14055–14060. [PMC免费文章][公共医学][谷歌学者]

20MacDonald C.C.，Redondo J.L.重新检查聚腺苷酸化信号：我们对AAUAAA的看法是错误的吗？摩尔细胞。内分泌学。2002;190:1–8.[公共医学][谷歌学者]

21Zarudnaya M.I.、Kolomiets I.M.、Potyhaylo A.L.、Hovorun D.M.哺乳动物前mRNA多腺苷化信号的下游元件：初级、次级和高级结构。核酸研究。2003;31:1375–1386. [PMC免费文章][公共医学][谷歌学者]

22Natalizio B.J.、Muniz L.C.、Arhin G.K.、Wilusz J.、Lutz C.S.胶原基因3′-非翻译区中存在的上游元素影响重叠聚腺苷酸化信号的处理效率。生物学杂志。化学。2002;277:42733–42740.[公共医学][谷歌学者]

23Chen F.，Wilusz J.哺乳动物前mRNA的有效多聚腺苷化需要辅助下游元件。核酸研究。1998;26:2891–2898. [PMC免费文章][公共医学][谷歌学者]

24Arhin G.K.、Boots M.、Bagga P.S.、Milcarek C.、Wilusz J.对hnRNP H/H′蛋白具有不同亲和力的下游序列元素影响哺乳动物多聚腺苷酸化信号的处理效率。核酸研究。2002;30:1842–1850. [PMC免费文章][公共医学][谷歌学者]

25Schek N.，Cooke C.，Alwine J.C.使用在体外分析。摩尔细胞。生物。1992;12:5386–5393. [PMC免费文章][公共医学][谷歌学者]

26Gilmartin G.M.、Fleming E.S.、Oetjen J.、Graveley B.R.CPSF对HIV-1 mRNA 3′加工增强子的识别：涉及多聚（A）位点定义的多序列接触。基因发育。1995;9:72–83.[公共医学][谷歌学者]

27Moreira A.，Takagaki Y.，Brackenridge S.，Wollerton M.，Manley J.L.，Proudfot N.J.C2补体poly（A）信号的上游序列元件通过两种不同的机制激活信使核糖核酸3′端的形成。基因发育。1998;12:2522–2534. [PMC免费文章][公共医学][谷歌学者]

28Legendre M.，Gautheret D.人类多聚腺苷化位点选择中的序列决定因素。BMC基因组学。2003;4:7. [PMC免费文章][公共医学][谷歌学者]

29Tabaska J.E.，Zhang M.Q.人类DNA序列中多聚腺苷酸化信号的检测。基因。1999;231:77–86.[公共医学][谷歌学者]

30Zhang H.基于最长递增子序列算法的BLAST高得分段对对齐。生物信息学。2003;19:1391–1396.[公共医学][谷歌学者]

31Burset M.、Seledtsov I.A.、Solovyev V.V.SpliceDB：规范和非规范哺乳动物剪接位点数据库。核酸研究。2001;29:255–259. [PMC免费文章][公共医学][谷歌学者]

32Kent W.J.BLAT—类似BLAST的对准工具。基因组研究。2002;12:656–664. [PMC免费文章][公共医学][谷歌学者]

33.Kan Z.、Gish W.、Rouchka E.、Glasscock J.、States D.使用基因组对齐的EST序列进行UTR重建和分析。程序。国际竞争情报。系统。分子生物学。2000;8:218–227.[公共医学][谷歌学者]

34Benjamini Y.，Hochberg Y.控制错误发现率：一种实用且强大的多重测试方法。J.R.统计社会服务。B。1995;57:289–300. [谷歌学者]

35Venables W.N.，Ripley B.D.公司。现代应用统计学与S。纽约州纽约市：斯普林格；2002[谷歌学者]

36Chen F.，MacDonald C.C.，Wilusz J.哺乳动物多聚腺苷酸化信号中的Cleavage位点决定因素。核酸研究。1995;23:2614–2620. [PMC免费文章][公共医学][谷歌学者]

37.Frischmeyer P.A.、van Hoof A.、O'Donnell K.、Guerrerio A.L.、Parker R.、Dietz H.C.一种消除缺少终止密码子的转录物的mRNA监测机制。科学。2002;295:2258–2261.[公共医学][谷歌学者]

38Wilusz J.，Shenk T.一种64 kD核蛋白与包含AAUAAA多聚腺苷化基序的RNA片段结合。单元格。1988;52:221–228.[公共医学][谷歌学者]

39.Fairbrother W.G.，Yeh R.F.，Sharp P.A.，Burge C.B.人类基因外显子剪接增强子的预测鉴定。科学。2002;297:1007–1013.[公共医学][谷歌学者]

40Sheets M.D.、Ogg S.C.、Wickens M.P.AAUAAA和poly（A）加成位点的点突变：对切割和聚腺苷化准确性和效率的影响在体外.核酸研究。1990;18:5799–5805. [PMC免费文章][公共医学][谷歌学者]

41Shaw G.，Kamen R.来自GM-CSF mRNA 3′非翻译区的保守AU序列介导选择性mRNA降解。单元格。1986;46:659–667.[公共医学][谷歌学者]

42Chen C.Y.，Shyu A.B.AU-富集元素：特性和在mRNA降解中的重要性。生物化学趋势。科学。1995;20:465–470.[公共医学][谷歌学者]

43Ford L.P.、Watson J.、Keene J.D.、Wilusz J.ELAV蛋白稳定新型脱烯基化中间体在体外mRNA二烯基化/降解系统。基因发育。1999;13:188–201. [PMC免费文章][公共医学][谷歌学者]

44Fan X.C.，Steitz J.A.核质穿梭蛋白HuR的过度表达增加了体内含ARE mRNA的稳定性。EMBO J。1998;17:3448–3460. [PMC免费文章][公共医学][谷歌学者]

45Peng S.S.，Chen C.Y.，Xu N.，Shyu A.B.通过富含AU元素的结合蛋白HuR（ELAV蛋白）稳定RNA。EMBO J。1998;17:3461–3470. [PMC免费文章][公共医学][谷歌学者]

46Loflin P.，Chen C.Y.，Shyu A.B.揭示hnRNP D在细胞内的作用体内富含AU元素的mRNA失稳。基因发育。1999;13:1884–1897. [PMC免费文章][公共医学][谷歌学者]

文章来自核酸研究由以下人员提供牛津大学出版社