自然。作者手稿;PMC 2009年5月27日提供。
以最终编辑形式发布为:
预防性维修识别码:项目经理2593745
NIHMSID公司:美国国立卫生研究院72491
人类组织转录体中的替代异构体调控
,1,2,* ,1,三,* ,4 ,4 ,4 ,5 ,6 ,4和1,7
埃里克·T·王
1美国马萨诸塞州剑桥市麻省理工学院生物系,邮编02139
2哈佛大学-麻省理工学院健康科学与技术部,美国马萨诸塞州剑桥02139
里卡德·桑德伯格
1美国马萨诸塞州剑桥市麻省理工学院生物系,邮编02139
三瑞典斯德哥尔摩卡罗林斯卡研究所细胞和分子生物学系,171 77
罗淑君
4Illumina Inc.,美国加利福尼亚州海沃德工业大道25861号,邮编94545
伊琳娜·赫勒布图科娃
4Illumina Inc.,美国加利福尼亚州海沃德工业大道25861号,邮编94545
张璐
4Illumina Inc.,美国加利福尼亚州海沃德工业大道25861号,邮编94545
克里斯汀·梅尔
5美国马萨诸塞州剑桥市怀特海生物医学研究所,邮编02142
斯蒂芬·金斯摩尔
6美国国家基因组资源中心,2935 Rodeo Park Drive East,Santa Fe,NM 87505
加里·施罗斯
4Illumina Inc.,美国加利福尼亚州海沃德工业大道25861号,邮编94545
克里斯托弗·B·伯格
1美国马萨诸塞州剑桥市麻省理工学院生物系,邮编02139
1美国马萨诸塞州剑桥市麻省理工学院生物系,邮编02139
2哈佛大学-麻省理工学院健康科学与技术部,美国马萨诸塞州剑桥02139
三瑞典斯德哥尔摩卡罗林斯卡研究所细胞和分子生物学系,171 77
4Illumina Inc.,美国加利福尼亚州海沃德工业大道25861号,邮编94545
5美国马萨诸塞州剑桥市怀特海生物医学研究所,邮编02142
6美国国家基因组资源中心,2935 Rodeo Park Drive East,Santa Fe,NM 87505
*这些作者对这项工作贡献均等
- 补充资料
1
GUID:091AF720-1582-4726-BC1C-27F2C0D250A2
摘要
通过对前mRNA的替代处理,单个哺乳动物基因经常产生多种mRNA和蛋白质亚型,这些亚型可能具有相关、独特甚至相反的功能。在这里,我们报告了基于cDNA片段的深度测序对15种不同的人类组织和细胞系转录体进行的深入分析,得出了基因和mRNA亚型表达的数字清单。序列读取到外显子-外显子连接的映射分析表明,92-94%的人类基因经历了选择性剪接(AS),~86%的基因经历了15%或更多的次要亚型频率。异型体特异性阅读密度的差异表明,大多数AS和选择性切割和多聚腺苷酸化(APA)事件在组织间存在差异,而个体间的差异不太常见,约为2到3倍。组织间剪接的极端或“开关样”调控与调控区域序列保守性增强以及全长开放阅读框的生成相关。AS和APA的模式在组织间有很强的相关性,这表明这些过程的协调调节,而选择性内含子和3′UTR中已知调控基序子集的序列保持表明剪接和聚腺苷酸化的组织级调控中共同涉及特定因子。
初级RNA转录物交替加工产生的mRNA和蛋白质亚型可能在结构、功能、定位或其他特性上有所不同1,2众所周知,AS尤其影响超过一半的人类基因,并被认为是哺乳动物表型复杂性进化的主要驱动因素三,4然而,对组织间mRNA亚型表达差异程度的评估提出了重大的技术挑战5使用表达序列标签(EST)的研究对组织特异性的估计相对较低,但在检测亚型水平差异方面的统计能力有限6-8微阵列分析已经实现了对组织的更一致的覆盖9但其分辨密切相关的mRNA亚型的能力受到限制。高通量测序技术有潜力通过产生跨组织mRNA的高平均覆盖率来绕过这些限制,同时使用直接测序而不是杂交来区分和定量mRNA亚型10,11.
组织特异性AS通常由组织特异性和普遍表达的RNA结合因子共同调节,这些因子与顺式-作用RNA元件影响邻近剪接位点的剪接体组装1,2许多因素都可以激活或抑制剪接,其活性通常可以通过“RNA图”来概括,该图描述了与核心剪接体组分的结合位置相关的依赖性12,13.
基因和亚型表达的数字清单
为了评估基因和替代mRNA亚型的表达,使用mRNA-SEQ协议(方法)从10种不同的人类组织和5种乳腺上皮或乳腺癌细胞系中扩增并测序了1200万到2900万个32 bp的cDNA片段,总共产生了4亿多个读码(图S1a)。组织样本来源于男女不相关的匿名个体;对于一个组织,小脑皮层,对来自六名无关男性的样本进行了分析,以评估个体之间的差异(表S1)。总的来说,约60%的读取是唯一映射到基因组的,允许多达2个失配,另外4%的读取是惟一映射到剪接连接(SJ)的。因此,大约三分之二的读取可以明确地分配给单个基因;基因组定位错误的频率估计为~0.1%(表S2).
外显子的读取密度(覆盖率)是内含子或基因间区域的100多倍(图S1c),只有~3%的读码映射到核糖体RNA基因,表明绝大多数读码来自成熟的mRNA。比较两个参考RNA样本中787个基因的相对mRNA-SEQ读码密度与已发表的定量RT-PCR测量值14在~5个数量级之间产生了近似线性关系(图S1d)表明mRNA-SEQ读取计数可以在一个非常宽的动态范围内提供精确的相对基因表达测量10.
选择性剪接在人类多基因中普遍存在
mRNA-SEQ数据用于评估人类基因中替代转录亚型的表达,如线粒体磷酸转运蛋白基因所示SLC25A3型在里面该基因的外显子3A和3B是“互斥外显子”(MXE),这意味着该基因的转录物包含这些外显子中的一个或另一个,但不是两者都包含。外显子3A在心脏和骨骼肌中的阅读覆盖率要大得多,在睾丸、肝脏(和其他研究组织)中几乎完全覆盖外显子3B,这与外显子AA-突变的主要心脏和肌肉症状一致15.
人类基因中AS亚型的频率和相对丰度a、,mRNA-SEQ读取映射到SCL25A3型基因位点。显示从每个核苷酸位置开始的映射读取数(log10)用于右边列出的组织。圆弧表示SJ读取检测到的连接(粗体圆弧表示>10个读取支持的连接)。下面是代表性转录本的外显子/内含子结构(GenBank的加入如右图所示)。b、,500个基因中检测到AS的多基因的平均比例,按每个基因的总读取数分组。如果SJ读取到将相同的5′SS连接到不同的3′SS,或将相同的3′SS连接到不同5′SS,则认为该基因是选择性剪接的。AS的真实范围是从最适合的S形曲线(红色)的上渐近线估计的。c、,仅考虑相对表达不太丰富(次要)剪接变异体超过给定阈值的事件,顶部箱中和估计后的AS频率(如b)。条形图表示SEM。
通过使用严格的标准搜索已知和假定的剪接连接来评估AS的全基因组范围,该标准要求每个替代亚型都由具有不同对齐起始位置的多个独立SJ读取支持。通过读取覆盖率对Refseq数据库中的多外显子基因(占所有Refseq基因的94%)进行二元化,并拟合S形曲线,可以在排除细胞系数据时估计该集合中AS基因的渐近分数为~98%(图S2),使用所有样本时为~100%()。该分析表明,AS在人类多基因中基本上是普遍存在的,这些基因占总基因的94%,重要的限定条件是检测到的AS事件的一部分可能代表等位基因特异性剪接16,17.
其中一些事件可能只涉及低频AS亚型。然而,当仅考虑一个或多个样本中次要(不太丰富)亚型相对频率超过15%的事件时,估计有92%的多xon基因发生AS()。因此,据估计,0.92×0.94或~86%的人类基因可产生两个或更多不同群体的mRNA亚型。相反,在被注释为由单个外显子组成的6%Refseq基因中,即使在搜索这些基因中预测外显子之间的连接时,也没有检测到AS的证据。
通过将读取结果与预测的外显子和连接进行映射,识别出转录数据库中以前未发现的新外显子及剪接连接。这种方法产生了一组1413个高置信的新外显子(表S3),估计错误发现率(FDR)<1.5%(补充信息。)以及数千部假定的小说SJ(未显示)。因此,mRNA-SEQ具有发现新外显子的巨大潜力,尽管高效检测低丰度异构体需要非常大的读取深度(图S3).
替代RNA加工的组织特异性调节程度
为了探索替代转录物的组织调节程度,我们检测了八种常见的“替代转录物事件”1,2,每一种都能通过AS、APA和/或其他启动子的使用从人类基因中产生多种mRNA亚型()。所考虑的事件类型包括跳过外显子(SE)和保留内含子(RI),其中单个外显子或内含子被选择性地包含或剪接出成熟信息,以及上述MXE。还包括选择性5′剪接位点(A5SS)和选择性3′剪接部位(A3SS)事件,这些事件特别难以通过微阵列进行检测,因为可变包含区域通常非常小。还考虑了串联UTRs和互斥3′UTRs(3pMXE),其中一对多聚腺苷酸化位点的交替使用分别导致3′UTR亚型更短或更长,或导致末端外显子不同。最后,我们考虑了相互排斥的5′外显子(5pMXE),在该外显子中,选择性启动子的使用导致mRNA亚型具有不同的5′UTR。
替代mRNA亚型的普遍组织特异性调节行表示图表中的8种不同的替代转录事件类型。支持上亚型、下亚型或两种亚型表达的映射读数分别以蓝色、红色和灰色显示。第1-4列显示了每种类型的事件数:(1)由cDNA和/或EST数据支持;(2) mRNA-SEQ读取支持≥1个亚型;(3) 两种亚型均由reads支持;(4)在5%的FDR下检测到组织调节事件(Fisher精确检验)。第5-6列显示:(5)检测到的两种亚型被观察到组织调节的事件的观察百分比;(6)校正组织偏倚检测能力和FDR后组织调节亚型的估计真实百分比(图S3)。对于某些事件类型,使用“普通读数”(灰色条)代替(串联3’UTR事件)或除“排除”读数之外的读数,以检测组织间亚型水平的变化。
对于这些事件类型中的每一种,从特定区域派生的读取可以支持一种替代亚型或另一种亚型的表达()。“包含比率”定义为“包含”(蓝色)读取数与“排除”(红色)读取数之比,可用于检测相应mRNA亚型比例的变化。包含外显子的mRNAs的比例-“拼接入百分比”(PSI或Ψ)值-可以估计为包含读取密度(即支持包含亚型的区域中每个位置的读取数)与包含和排除读取密度之和的比率。
为了评估组织调节性AS,基于可用的人类cDNA和EST数据,推导出了这8种类型的一组全面的~105K事件。三分之一以上的事件中观察到支持两种替代亚型的读数()通过比较每个组织相对于其他组织的包涵体比率来评估这些事件的组织特异性调节程度,要求包涵体比至少改变10%(图S4)。自然,被鉴定为在组织之间差异表达的转录物或亚型将反映转录物水平的细胞类型特异性差异、组织之间细胞类型相对丰度的变化以及组织来源个体之间的变化的综合影响。
值得注意的是,8种事件类型中的每一种都观察到了高频率的组织特异性调节,包括60%以上的SE、A5SS、A3SS和串联3′UTR事件(,表S4)。总的来说,共鉴定出22000多个组织特异性替代转录物事件,远远超过了以前组织特异性AS事件的集合,这些事件的数量通常在数百到数千之间6-9,18,19组织管制SE和MXE事件列于表S5和S6分别是。将事件按表达水平进行分类,通常会得到每种类型组织调节事件的比例的S形曲线,从而可以估计每种事件类型的组织调节真实频率(图S5、S6)。这些估计值从52%到80%不等(),表明大多数AS事件是在组织间调节的,为AS是哺乳动物表型复杂性进化的主要贡献者的假设提供了重要支持。
个体间替代mRNA亚型表达的差异
为了评估与组织调节的AS相比,个体之间AS亚型变异的程度,测定了成对样本之间所有表达的SE的包含率载体之间的相关性()和其他事件类型(未显示)类似。在这项分析中,观察到6个小脑皮层样本具有较强的聚类性,这些样本之间的相关性通常高于代表不同组织的配对之间的相关性。5个细胞系也表现出较强的聚集性。这可能是多种因素共同作用的结果,包括所研究细胞系的常见乳腺上皮起源、对培养条件的类似适应以及所选组织的高度多样性。
选择性亚型表达中个体特异性差异的程度人体组织和细胞系中SEΨ值的Spearman相关性。分别计算每对组织和细胞系的相关性,并使用平均连锁层次聚类法根据相似性进行聚类。
通过测定6个小脑皮质样本中差异表达外显子的数量,也可以确定个体间替代亚型表达的差异程度。使用与中相同的方法,在~10%到30%的选择性转录事件中,根据事件类型表现出个体特异性变化(图S7),提供了对个体间mRNA亚型变异范围的最新估计16这些数字高于基于微阵列分析的估计值20,但与多种数据类型的综合分析基本一致,该分析估计约21%的AS基因受多态性影响,多态性改变了替代亚型的相对丰度17然而,这些频率仍远低于10种组织之间出现差异的47-74%的事件()与6个组织亚群之间的比较中观察到的频率相比,减少了2到3倍(图S7)这表明,诱导间变异相当常见,但仍远低于组织间变异。因此,组织样本之间观察到的大多数差异可能代表组织特异性而非个体特异性变化。
开关样交替剪接外显子的独特性质
mRNA-SEQ方法的定量性质允许评估微妙和开关样AS事件。通过比较组织间SE的内含物水平,观察到一类“开关样”外显子在不同组织间显示出显著不同的内含物(显示心脏组织与其他9个组织的内含物))。中以彩色显示的示例(例如。,胎压监测1外显子2,心脏Ψ为2%,骨骼肌Ψ为95%SLC25A3型MXE对如所示)强调了剪接调控机制的灵活性,大量外显子主要被识别为一个组织中的外显子,而另一组织中的内含子,甚至与发育相关的成对组织,如心脏和骨骼肌。
开关型AS外显子的保守性和功能a、,散点图显示了SE和MXE的Ψ值,根据心脏(x轴)和第二组织(y轴)的比较确定了其开关得分。开关得分>0.5的外显子显示为填充符号,其他外显子则显示为灰色小点。b、,SE和MXE对开关得分的累积分布函数(基于Kolmogorov-Smirnov检验的P值)。c、,按开关得分分组的SE和MXE的读取帧保存。长度可被3整除的SE和长度相差0或3的倍数的MXE对被认为可以保存阅读框。P值基于费希尔精确测试。日期:,根据SE开关得分分组的SE和侧翼内含子区域的保守性。显示了每个位置的平均相位Cons评分(来自4个哺乳动物基因组的比对)和SEM。e、,组织调节SE附近UGCAUG基序的富集。彩色方块表示−log10(P值),用于在SE周围各组织相对于其他组织的包涵体显著增加(红色)或减少(蓝色)的区域中,相对于对照组6个个体的队列,UGCAUG计数的富集。
为了表征这种开关样外显子的功能特征,根据其“开关得分”将SE和MXE分为组,“开关得分”定义为组织之间的最大成对Ψ差异。成对MXE的切换分数相对于SE向更高的值转移(P=3.7×10−5Kolmogorov-Smirnov检验;),表明MXE更经常参与调节高度组织特异性功能。对于开关得分较高的外显子,这两种亚型中的阅读框保存更为常见,这两个外显子对于SE都是如此,这与参考文献一致。19,在更大程度上用于MXE()。因此,开关样调节似乎优先用于在不同组织中表达不同的“全长”蛋白质亚型,而不是通过产生截短的蛋白质或受到非传感介导mRNA衰变的信息来关闭基因21事实上,含有开关得分高的SE的基因丰富了基因本体功能类别,包括“发育过程”、“细胞通讯”、“转录调节活性”、,以及“新陈代谢的调节”,这可能会导致不同人体组织生物学上的根本差异(表S7).
值得注意的是,那些开关得分超过0.5的SE在受调控外显子本身中表现出较高的序列保守性19与外显子相比,侧翼内含子的部分开关得分更低()。这一观察表明,这些外显子具有非同寻常的生物学重要性,组织间的开关样调节需要额外的剪接调控序列信息。
Fox-1/2组织和位置特异性调节活性图的推断
其中最具特征的组织特异性剪接因子是Fox-1/Fox-2蛋白,它结合RNA顺式-含有UGCAUG六核苷酸或密切相关序列的元素22-24对UGCAUG频率的分析显示,外显子下游的内含子大量富集,心脏、骨骼肌、大脑和小脑皮层的内含子增多(),Fox蛋白高度表达的组织,表明该部位存在常见的剪接激活活性22-24骨骼肌内含物减少的外显子上游也发现了UGCAUG 6单体的富集,表明在这种情况下可能存在抑制活性。这个例子说明了这些扩展的组织特异性外显子集对推断“组织RNA图谱”的能力,总结了剪接调控元件的位置依赖性活性和组织特异性。
应用类似的方法分析组织特异性外显子附近区域所有6个单体的富集情况,确定了362个基序/组织富集模式(估计为17%FDR),代表在特定细胞系或组织中内含物增加或减少的外显子邻近区域显着富集的6个单体征(表S9)。骨骼肌高内含物外显子下游UGCAUG的富集似乎是继UCUC和CUCUCU富集后第三重要的基序/组织对(类似于PTB和nPTB的结合基序25)小脑皮质内含物增多的外显子上游。其余的基序/组织对包括各种已知的调控元件,包括ACUAAC(见下文),以及假定的新调控基序。
剪接和切割/聚腺苷化之间的协调
与所研究的SE或其他AS事件相比,串联3′UTR事件表现出更高的组织调节表达频率()然而,对于串联UTR的组织调节是如何实现的,例如,无论是通过APA还是通过替代UTR异构体的差异稳定性,人们知之甚少。根据开关评分对串联3′UTR进行分组,与在近端(5′)聚腺苷酸化信号(PAS)附近和上游以及远端(3′)PAS上游开关评分较低的事件相比,大多数开关样事件显示出更强的序列保守性()。同时顺式-有助于差异稳定性的调节元件应主要位于长UTR亚型特有的区域,APA可由位于其中一个或两个PAS附近的元件调节。因此,观察到开关型串联UTR中近端PAS周围和上游的保守性增加,支持了APA水平的调节的主要作用。
剪接和聚腺苷化之间协调的证据a、,串联3′UTR在近端和远端解理位点上游300 bp区域的平均值和SEM相位Cons得分,根据开关得分分组。插入,增加了串联3′UTR延伸区Fox-1/2基序的保守性。显示了所有含有7mers的非CpG(虚线)、miRNA种子匹配(黑色)和含有UGCAUG的7mers(红色)。b、,对14个样本中每一个样本中满足最小读取覆盖标准的SE在组织和细胞系中的SE包含水平进行SVD分析。投影以对应于两个主要特征值的维度表示,这两个特征值占方差的25%。c、,串联UTR内含物水平的SVD分析(如面板c所示)。日期:,基于5种指示的替代转录物事件类型的Ψ值或基于基因表达值,对14个样本进行SVD分析。显示了面板b和c中所示类型投影中相应成对距离之间的Spearman相关性。e、,S: SE侧翼内含子(x轴)和延伸的3′UTR区域(y轴)中非CpG-6单体的B比率。图中显示了典型的PAS 6mer AAUAAA(黑色三角形)、对应于保守哺乳动物miRNAs种子匹配的6mer(黑点)以及对应于所示剪接或3′UTR结合因子(颜色)的结合基序的6mers。
在评估顺式-可能驱动串联3′UTRs组织调节的元件,一组7个单体被鉴定为在串联3′UTRs延伸区表现出高度保守性(),4种哺乳动物的信号:背景(S:B)比率26超过2:1。正如预期的那样,这一组包括与许多保守哺乳动物miRNAs的扩展(7碱基)种子匹配26-28令人惊讶的是,它还包括了所有8个含有Fox-1/-2共有结合基序的7mer,UGCAUG:所有这些7mer的S:B比率都高于2.5:1,超过了与重要miRNAs如miR-7和miR-181(插图,)。根据Fox-1/Fox-2蛋白的典型剪接调控活性,预计该位置的UGCAUG基序不会得到很好的保存(距离最近的剪接位点平均>1 kbp)。相反,在延伸的3′UTR区域观察到的高度保守性表明,这些因子(或其他具有相同RNA结合特异性的因子)发挥了额外的3′UTR相关作用,例如在APA中,或在mRNA定位和/或翻译中。
为了进一步研究AS和APA的组织特异性调节之间的可能联系,对组织特异性替代亚型表达的全球模式进行了比较。应用奇异值分解(SVD)(补充方法)对于每个AS和APA事件类型样本的内含物比率载体,从所有组织样本中观察到乳腺细胞系(4个癌源性细胞系和1个永生化细胞系)的强烈且一致的分离()。这种分离意味着细胞系和组织之间的RNA加工调控存在系统性差异,这些差异适用于所研究的所有类型的AS事件。对于大多数AS和APA事件,SVD分析得出了相似的组织分组,例如心脏、骨骼肌、大脑和肝脏始终聚集在一起(图S8)。与该观察结果一致,不同类型AS事件(例如SE、A5SS和A3SS)的SVD预测之间的成对距离均高度相关(),表明这些类型事件的监管控制相似1,2,13更令人惊讶的是,串联3′UTR事件的SVD投影之间的距离也与纯剪接水平控制的事件(如SE)的SVD预测高度相关()。这一观察提出了剪接和多聚腺苷化可能在人体组织中协调调节的可能性。
探讨剪接和多腺苷酸化调控之间可能的调控联系(例如,参考文献29-32)比较了与保守AS和APA事件相邻的6个单体的保守。虽然典型的3′UTR调控基序(如共有PAS 6聚体AAUAAA和各种miRNA种子匹配)在扩展的3′UTR区域中表现出较高的S:B比率,通常为1.5:1或更高,但这些基序在as内含子中的S:B比率通常接近1:1。然而,在UTR和内含子中也观察到一个具有高S:B比率的独特基序子集,其中一些基序与众所周知的splicing相关基序相对应(,表S8)。这一组不仅包括福克斯-1/-2基序UGCAUG和变体,与第7阶段的分析一致,也包括(CUG)的排列n个,代表肌肉和脑特异性剪接因子CELF和MBNL家族的假定底物333′UTR和内含子中高度显著的S:B表明,这些众所周知的拼接相关基序也通常发挥3′UTR-相关的作用,例如控制APA或mRNA稳定性、定位或翻译,正如最近在Nova剪接因子家族中所证明的那样34.
6mer ACUAAC,与STAR家族RNA结合因子的一致结合基序非常匹配,尤其是Quaking/QKI35也值得注意。正如QKI在mRNA稳定性控制中的已知作用所预期的那样,ACUAAC不仅在3′UTR中具有显著的S:B36但在内含子中也显示出极高的S:B,超过7:1。这种极端保守性表明了剪接调控中一种常见而重要的功能,这种作用已经被提出,但尚未直接证明9,37.Motif富集分析也表明在脑特异性APA调节中可能起作用(图S9).
讨论
我们得出的结论是,组织特异性AS和APA事件之间的协调由组织偏倚的相关模式暗示可能至少部分由组织特异性RNA结合因子介导,这些RNA结合因子在调节这两个RNA加工步骤中发挥作用。这些因素可能包括典型的组织特异性剪接因子,例如Fox-1/2和CELF家族的剪接因子、3′UTR相关角色的兼职,以及典型的UTR结合因子,例如Quaking/QKI。这种功能二元性有可能实现聚腺苷酸化和剪接的紧密协调调控,确保适当的UTR调控序列与相关组织特异性蛋白质亚型的编码区一起表达。
方法总结
组织和细胞系
来自个人无关匿名捐赠者的组织样本(表S1)从Ambion中获得以下组织类型:脂肪、全脑、乳腺、结肠、心脏、肝脏、淋巴结、骨骼肌、睾丸。根据NIH保密和隐私指南,使用之前描述的协议,从6名匿名无关供体获取小脑皮层样本38HME是用hTERT永生化的人类乳腺上皮细胞系39其他细胞系均为来源于浸润性导管癌(ATCC)的乳腺癌细胞系。MCF-7、BT474和T47D为雌激素受体和孕激素受体阳性;MDA-MD435对两者均为阴性。
Illumina测序的文库准备
使用Poly-T捕获珠从10 ug总RNA中分离mRNA。第一链cDNA通过随机六聚体-正时逆转录生成,然后使用RNase H和DNA聚合酶生成第二链cDNA。使用Illumina Genomic DNA样品制备试剂盒连接测序适配器。如前所述,通过凝胶电泳分离出约200 bp长的片段,通过16次PCR扩增,并在Illumina基因组分析仪上测序40.
mRNA-SEQ读取数据的计算分析
读取数据分析中使用的计算和统计方法如所述补充方法.
致谢
我们感谢埃里克·安德森(Erik Anderson)、道格·布莱克(Doug Black)、布拉德·弗里德曼(Brad Friedman)和伯格实验室成员对手稿的有益评论,感谢诺亚·斯皮斯(Noah Spies)对分析的帮助,感谢乔安·穆奇(Joann Mudge)、格雷戈里·梅(Gregory D.May)、尼尔·A·米勒(Neil A.Miller)、埃里克·维尔马斯(Eric Vermaas)、茨维塔娜·凯雷尔斯卡(Tzve。Roberts和Nora Perrone-Bizzozero提供小脑皮质RNA样本。这项研究得到了NIH培训拨款(E.W.)、Knut&Alice Wallenberg基金会和瑞典战略研究基金会(R.S.)以及NIH(C.B.B.)的拨款支持。
工具书类
1黑色DL。选择性前信使RNA剪接的机制。生物化学年度收益。2003;72:291–336.[公共医学][谷歌学者] 2AJ马特林,F克拉克,CW史密斯。理解选择性剪接:走向细胞代码。Nat Rev Mol细胞生物学。2005;6:386–98.[公共医学][谷歌学者] 三。Lander ES等人,人类基因组的初步测序和分析。自然。2001;409:860–921。[公共医学][谷歌学者] 4Johnson JM等。利用外显子连接微阵列对人类选择性前体mRNA剪接的全基因组调查。科学。2003;302:2141–4.[公共医学][谷歌学者] 5Blencowe BJ。替代拼接:来自全球分析的新见解。单元格。2006;126:37–47.[公共医学][谷歌学者] 6Xu Q,Modrek B,Lee C.人类转录组中组织特异性选择性剪接的全基因组检测。核酸研究。2002;30:3754–66. [PMC免费文章][公共医学][谷歌学者] 7Gupta S、Zink D、Korn B、Vingron M、Haas SA。基于EST的组织特异性选择性剪接预测的优缺点。BMC基因组学。2004;5:72. [PMC免费文章][公共医学][谷歌学者] 8Yeo G、Holste D、Kreiman G、Burge CB。人类组织中选择性剪接的变化。基因组生物学。2004;5:R74。 [PMC免费文章][公共医学][谷歌学者] 9Sugnet CW等。剪接微阵列发现的组织调节外显子附近异常的内含子保守性。公共科学图书馆计算生物学。2006;2:e4。 [PMC免费文章][公共医学][谷歌学者] 10Mortazavi A、Williams BA、McCue K、Schaeffer L、Wold B.通过RNA-Seq对哺乳动物转录体进行定位和量化。自然方法。2008[公共医学][谷歌学者] 11Sultan M等人。通过人类转录组的深度测序对基因活性和选择性剪接的全球观点。科学。2008;321:956–60.[公共医学][谷歌学者] 12Ule J等。预测Nova依赖性剪接调控的RNA图谱。自然。2006;444:580–6.[公共医学][谷歌学者] 13Wang Z、Xiao X、Van Nostrand E、Burge CB。外显子剪接沉默子在剪接控制中的一般和特殊功能。分子细胞。2006;23:61–70. [PMC免费文章][公共医学][谷歌学者] 14Shi L等。微阵列质量控制(MAQC)项目显示了基因表达测量的平台间和平台内再现性。国家生物技术。2006;24:1151–61. [PMC免费文章][公共医学][谷歌学者] 15Mayr JA等。线粒体磷载体缺乏:一种新的氧化磷酸化紊乱。美国人类遗传学杂志。2007;80:478–84。 [PMC免费文章][公共医学][谷歌学者] 16Graveley BR。单倍体剪接转录组:人类群体中选择性剪接的常见变异。趋势Genet。2008;24:5–7. [PMC免费文章][公共医学][谷歌学者] 17Nembaware V,Wolfe KH,Bettoni F,Kelso J,Seoighe C.人类等位基因特异性转录亚型。FEBS信函。2004;577:233–8.[公共医学][谷歌学者] 18Pan Q等。利用定量微阵列平台揭示哺乳动物选择性剪接的全球调控特征。分子细胞。2004;16:929–41.[公共医学][谷歌学者] 19Xing Y,Lee CJ。选择性剪接外显子的蛋白质模块性与选择性剪接的组织特异性调控有关。公共科学图书馆-遗传学。2005;1:e34。 [PMC免费文章][公共医学][谷歌学者] 20Kwan T等。人类转录亚型变异的全基因组分析。Nat Genet。2008;40:225–31.[公共医学][谷歌学者] 21Lewis BP,Green RE,Brenner SE。人类选择性剪接和非传感介导mRNA衰变广泛耦合的证据。美国国家科学院院刊。2003;100:189–92。 [PMC免费文章][公共医学][谷歌学者] 22Underwood JG、Boutz PL、Dougherty JD、Stoilov P、Black DL。秀丽隐杆线虫Fox-1蛋白的同源物是哺乳动物的神经元剪接调节因子。分子细胞生物学。2005;25:10005–16. [PMC免费文章][公共医学][谷歌学者] 23Auweter SD等。人类选择性剪接因子Fox-1识别RNA的分子基础。Embo J。2006;25:163–73. [PMC免费文章][公共医学][谷歌学者] 24Nakahata S、Kawamoto S。哺乳动物Fox-1同源物的组织依赖性亚型与组织特异性剪接活动相关。核酸研究。2005;33:2078–89. [PMC免费文章][公共医学][谷歌学者] 25Oberstrass FC等。PTB与RNA结合的结构:特异性结合和剪接调控的意义。科学。2005;309:2054–7.[公共医学][谷歌学者] 26Lewis BP、Burge CB、Bartel DP。保守的种子配对,通常两侧有腺苷,表明数千人类基因是microRNA的靶标。单元格。2005;120:15–20.[公共医学][谷歌学者] 27Xie X,等。通过对几种哺乳动物的比较,系统地发现人类启动子和3′UTR中的调控基序。自然。2005;434:338–45. [PMC免费文章][公共医学][谷歌学者] 28Majoros WH,Ohler U。3′非翻译区微RNA靶点的空间偏好。BMC基因组学。2007;8:152. [PMC免费文章][公共医学][谷歌学者] 29Maniatis T,Reed R.基因表达机器之间广泛的耦合网络。自然。2002;416:499–506.[公共医学][谷歌学者] 30McCracken S,Lambermon M,Blencowe BJ。SRm160剪接辅激活子促进转录物3′端切割。分子细胞生物学。2002;22:148–60. [PMC免费文章][公共医学][谷歌学者] 31Castelo-Branco P等人。聚嘧啶束结合蛋白调节聚腺苷酸化的效率。分子细胞生物学。2004;24:4174–83. [PMC免费文章][公共医学][谷歌学者] 32Zhang L、Lee JE、Wilusz J和Wilusz CJ。RNA结合蛋白CUGBP1调节肌肉细胞中肿瘤坏死因子mRNA的稳定性:与强直性肌营养不良的关系。生物化学杂志。2008;283:22457–63。 [PMC免费文章][公共医学][谷歌学者] 33Ladd AN、Cooper TA。在后基因组时代寻找调节选择性剪接的信号。基因组生物学。2002;三评论0008。[PMC免费文章][公共医学][谷歌学者] 34Licatalosi D等。HITS-CLIP揭示的大脑中替代mRNA处理的机制。自然。2008新闻界。[谷歌学者] 35Galarneau A,Richard S.《震荡星蛋白的靶RNA基序和靶mRNA》。自然结构分子生物学。2005;12:691–8.[公共医学][谷歌学者] 36Kim HH,Gorospe M.GU-rich RNA:扩展CUGBP1功能,拓宽mRNA周转。分子细胞。2008;29:151–2。 [PMC免费文章][公共医学][谷歌学者] 37Wu JI,Reed RB,Grabowski PJ,Artzt K。震颤在髓鞘形成中的作用:选择性剪接的调节。美国国家科学院院刊。2002;99:4233–8. [PMC免费文章][公共医学][谷歌学者] 38Paz RD等。精神分裂症患者小脑谷氨酸能神经元中活性依赖基因的表达增加。美国精神病学杂志。2006;163:1829–31.[公共医学][谷歌学者] 39Elenbaas B等。通过原代乳腺上皮细胞的致癌转化产生的人类乳腺癌细胞。基因发育。2001;15:50–65. [PMC免费文章][公共医学][谷歌学者] 40Schroth GP、Luo S、Khrebtukova I。方法分子生物学。2008新闻界。[谷歌学者]