跳到主要内容
访问密钥 NCBI主页 MyNCBI主页 主要内容 主导航
自然资源部Genet。作者手稿;PMC 2010年10月4日发布。
以最终编辑形式发布为:
预防性维修识别码:项目经理2949280
NIHMSID公司:NIHMS229948号
PMID:19015660

RNA-Seq:转录组学的革命性工具

摘要

RNA-Seq是最近开发的一种利用深测序技术进行转录组分析的方法。使用这种方法的研究已经改变了我们对真核转录体的范围和复杂性的看法。与其他方法相比,RNA-Seq还可以更精确地测量转录水平及其亚型。本文介绍了RNA-Seq方法,应用中的挑战,以及迄今为止在表征几种真核转录体方面取得的进展。

转录组是细胞中针对特定发育阶段或生理条件的一整套转录物及其数量。理解转录组对于解释基因组的功能成分、揭示细胞和组织的分子组成以及理解发育和疾病至关重要。转录组学的主要目的是:对所有转录物物种进行分类,包括mRNA、非编码RNA和小RNA;根据基因的起始位点、5′端和3′端、剪接模式和其他转录后修饰来确定基因的转录结构;并量化每个转录物在发育过程中和不同条件下的表达水平变化。

已经开发了各种技术来推断和量化转录组,包括基于杂交或序列的方法。基于杂交的方法通常包括用定制的微阵列或商业高密度寡核苷酸微阵列培育荧光标记的cDNA。还设计了专门的微阵列;例如,带有跨越外显子连接的探针的阵列可用于检测和量化不同的剪接亚型1已经构建了以高密度表示基因组的基因组平铺微阵列,并允许将转录区域映射到非常高的分辨率,从几个碱基对到~100bp25基于杂交的方法具有高通量且相对便宜,但查询大型基因组的高分辨率平铺阵列除外。然而,这些方法有几个局限性,包括:依赖于现有的基因组序列知识;交叉杂交导致的高背景值6,7; 由于背景和信号饱和,检测的动态范围有限。此外,比较不同实验中的表达水平通常很困难,可能需要复杂的归一化方法。

与微阵列方法相比,基于序列的方法直接确定cDNA序列。最初,cDNA或EST文库的Sanger测序8,9虽然使用了,但这种方法的吞吐量相对较低,成本较高,而且通常不定量。基于标签的方法被开发来克服这些局限性,包括基因表达的系列分析(SAGE)10,11基因表达的cap分析(CAGE)1214和大规模并行签名排序(MPSS)1517这些基于标记的测序方法具有高通量,可以提供精确的“数字”基因表达水平。然而,大多数都是基于昂贵的桑格测序技术,短标签的很大一部分不能唯一地映射到参考基因组。此外,只分析了部分转录本,亚型之间通常无法区分。这些缺点限制了传统测序技术在转录组结构注释中的应用。

最近,新型高通量DNA测序方法的发展为转录组的定位和量化提供了一种新方法。这种被称为RNA-Seq(RNA测序)的方法与现有方法相比具有明显的优势,有望彻底改变真核转录体的分析方式。它已应用于酿酒酵母,葡萄裂殖酵母,拟南芥、小鼠和人类细胞1824在这里,我们解释了RNA-Seq的工作原理,讨论了它的挑战,并概述了使用这种方法的研究,这些研究已经开始改变我们对真核转录体的看法。

RNA-Seq技术及其优点

RNA-Seq使用最近开发的深测序技术。一般来说,一组RNA(总RNA或分馏RNA,如poly(a)+)被转换为cDNA片段库,其一端或两端都有适配器(图1). 每个分子,无论是否扩增,然后以高通量方式测序,以从一端(单端测序)或两端(对端测序)获得短序列。读数通常为30–400 bp,具体取决于所使用的DNA测序技术。原则上,任何高通量测序技术25可用于RNA-Seq和Illumina IG1821,23,24,Applied Biosystems SOLiD公司22和罗氏454生命科学2628系统已经用于此目的。Helicos Biosciences tSMS系统尚未用于已发表的RNA-Seq研究,但它也是合适的,并且具有避免目标cDNA扩增的额外优势。测序后,结果读取要么与参考基因组或参考转录本对齐,要么组装从头开始没有基因组序列来生成包含每个基因的转录结构和/或表达水平的基因组转录图。

保存图片、插图等的外部文件。对象名为nihms229948f1.jpg
一个典型的RNA-Seq实验

简言之,长RNA首先通过RNA片段或DNA片段转换为cDNA片段库(见正文)。测序适配器(蓝色)随后添加到每个cDNA片段中,并使用高通量测序技术从每个cDNA中获得短序列。由此产生的序列读数与参考基因组或转录组对齐,并分为三种类型:外显子读数、连接读数和poly(A)末端读数。这三种类型用于为每个基因生成碱基解析表达谱,如底部所示;显示了带有一个内含子的酵母ORF。

尽管RNA-Seq仍然是一项正在积极开发的技术,但与现有技术相比,它具有几个关键优势(表1). 首先,与基于杂交的方法不同,RNA-Seq不仅限于检测与现有基因组序列相对应的转录物。例如,基于454的RNA-Seq已被用于对格兰维尔贝母蝴蝶的转录组进行测序27这使得RNA-Seq对基因组序列尚未确定的非模型生物特别有吸引力。RNA-Seq可以以单碱基分辨率揭示转录边界的精确位置。此外,来自RNA-Seq的30 bp短读给出了两个外显子如何连接的信息,而长读或对端短读应该揭示多个外显基因之间的连接。这些因素使得RNA-Seq对于研究复杂转录体很有用。此外,RNA-Seq还可以揭示转录区的序列变异(例如SNP)22,24.

表1

RNA-Seq与其他转录组学方法相比的优势

技术平铺微阵列cDNA或EST测序转录组测序
技术规范
原理杂交桑格测序高通量测序
分辨率从几个到100 bp单个底座单个底座
吞吐量
依赖基因组序列是的在某些情况下
背景噪音
应用程序
同时绘制转录区和基因表达是的基因表达受限是的
量化基因表达水平的动态范围最多几倍不实用>8000倍
区分不同亚型的能力有限是的是的
区分等位基因表达的能力有限是的是的
实际问题
所需RNA量
绘制大基因组转录组的成本相对较低

相对于DNA微阵列,RNA-Seq的第二个优点是,RNA-Seq的背景信号非常低(如果有的话),因为DNA序列可以明确地映射到基因组的独特区域。RNA-Seq没有量化上限,这与获得的序列数相关。因此,它有一个很大的表达水平动态范围,在这个范围内可以检测到转录物:在一项分析了1600万个映射阅读的研究中,估计超过9000倍的范围酿酒酵母18,估计4000万只老鼠的序列读取量跨越五个数量级20相比之下,DNA微阵列对低水平或非常高水平表达的基因缺乏敏感性,因此动态范围小得多(一百倍到几倍)(图2). 正如使用定量PCR(qPCR)测定的那样,RNA-Seq在定量表达水平方面也被证明是高度准确的18和已知浓度的RNA对照中的刺突20RNA-Seq的结果也显示了技术复制和生物复制的高度重复性18,22最后,由于没有克隆步骤,并且Helicos技术没有扩增步骤,RNA-Seq需要较少的RNA样本。

保存图片、插图等的外部文件。对象名为nihms229948f2.jpg
定量表达水平:RNA-Seq和微阵列比较

通过RNA-Seq和平铺阵列测量,显示了酿酒酵母细胞生长在营养丰富的培养基中。这两种方法对于中等表达水平(中等)的基因非常一致,但对于低表达水平或高表达水平的基因,相关性很低。此图中使用的平铺数组数据来自REF。2,RNA-Seq数据取自REF。18.

考虑到所有这些优点,RNA-Seq是第一种基于序列分析的方法,它允许以非常高通量和定量的方式调查整个转录组。该方法在基因组尺度上提供注释的单碱基分辨率和“数字”基因表达水平,通常比平铺阵列或大规模Sanger EST测序成本低得多。

RNA-Seq面临的挑战

图书馆建设

转录组学的理想方法应该能够直接识别和量化所有RNA,无论大小(图1)在cDNA文库的生产过程中,它确实涉及几个操作阶段,这可能会使它在分析所有类型的转录物时的使用变得复杂。

与小RNA(microRNAs(miRNAs)、Piwi-interacting RNA(piRNA)、short interference RNA(siRNA)和其他许多小RNA不同,小RNA可以在连接接合器后直接测序,大RNA分子必须分割成较小的片段(200-500 bp)才能与大多数深测序技术兼容。常见的片段化方法包括RNA片段化(RNA水解或雾化)和cDNA片段化(DNA酶I处理或超声)。每种方法都会在结果中产生不同的偏差。例如,RNA片段对转录体几乎没有偏见20,但与其他方法相比,在成绩单结束时会耗尽(图3). 相反,cDNA片段化通常强烈倾向于识别转录物3′端的序列,从而提供关于这些端的精确身份的有价值信息18(图4).

保存图片、插图等的外部文件。对象名为nihms229948f3.jpg
DNA文库制备:RNA片段化与DNA片段化的比较

|寡脱氧核糖核酸启动的cDNA片段(蓝线)更偏向于转录物的3′端。RNA片段(红线)沿基因体提供了更均匀的覆盖,但5′端和3′端的覆盖相对较少。请注意,微阵列的最大和最小表达水平(或动态范围)之比为44,RNA-Seq为9560。标签计数是5000个酵母ORF的平均测序覆盖率18.b条|一种特殊的酵母基因,赛斯1(seryl-tRNA合成酶),如图所示。

保存图片、插图等的外部文件。对象名为nihms229948f4.jpg
来自RNA-Seq的Poly(A)标签

包含两个重叠转录本的区域(行动1,来自肌动蛋白基因,YFL040W,一种无特征的ORF)来自酿酒酵母显示基因组。箭头指向转录方向。来自RNA-Seq实验的poly(A)标签显示在这些转录物下方,箭头指示转录方向。由poly(A)标签识别的每个位点的精确位置揭示了poly(A)位点的异质性,例如,行动1有两个大的集群,都有一些局部异质性的基础。poly(A)标签揭示的转录方向也有助于解析3′端重叠转录区18.

在文库构建过程中的一些操作也使RNA-Seq结果的分析复杂化。例如,可以从已扩增的cDNA库中获得许多彼此相同的短阅读。这些可能是丰富RNA物种的真实反映,也可能是PCR人工制品。区分这些可能性的一种方法是确定是否在不同的生物复制中观察到相同的序列。

关于图书馆建设的另一个关键考虑因素是是否像两项研究中所做的那样,准备专门的图书馆21,22这些文库的优点是可以生成有关转录本方向的信息,这对于转录组注释很有价值,特别是对于转录方向相反的重叠区域2,19,29; 然而,特定于strand的库目前很难生成,因为它们需要许多步骤22或直接RNA-RNA连接21,效率低下。此外,必须确保反义转录物不是逆转录的人工制品30由于这些并发症,到目前为止,大多数研究都分析了没有链信息的cDNA。

生物信息学挑战

与其他高通量测序技术一样,RNA-Seq也面临着一些信息学挑战,包括开发高效的方法来存储、检索和处理大量数据,必须克服这些挑战,以减少图像分析和基数计算中的错误,并消除低质量读取。

一旦获得了高质量的读取数据,数据分析的首要任务是将RNA-Seq的短读取数据映射到参考基因组,或将其组装成连续序列,然后将其与基因组序列对齐,以揭示转录结构。有几个程序可以将读取映射到基因组,包括ELAND、SOAP31、MAQ32和RMAP33(有关这些信息,请访问Illumina论坛和SEQanswers)。然而,短转录组读数也包含跨越外显子连接或包含poly(A)末端的读数——这些不能以同样的方式进行分析。对于剪接罕见的基因组(例如,酿酒酵母)只需特别注意聚(A)尾和少量外显子-外显子连接。通过在某些读取结束时出现多个As或T,可以简单地识别Poly(A)尾巴。外显子-外显子连接可以通过特定序列背景(侧翼剪接位点的GT–AG二核苷酸)的存在来识别,并通过剪接过程中去除的内含子序列的低表达来确认。转录组图谱已经以这种方式生成酿酒酵母18对于复杂转录体,由于存在广泛的选择性剪接和反式-拼接。一个部分解决方案是编译一个包含所有已知和预测连接序列的连接库,并将读取的数据映射到该库19,20未来的一个挑战是开发计算简单的方法来识别发生在两个遥远序列之间或两个不同基因外显子之间的新剪接事件。

对于大型转录体,由于序列读取的很大一部分与基因组中的多个位置匹配,对齐也变得复杂。一种解决方案是根据映射到相邻唯一序列的读取数按比例分配这些多匹配读取20,22.此方法已成功用于低拷贝重复序列20。拷贝数高(>100)的短读和重复区域的长延伸带来了更大的挑战。获得更长的序列读取,例如使用454技术,应该有助于缓解多重匹配问题。或者,一种配对测序策略,其中短序列从DNA片段的两端确定25,34,35,将映射的片段长度扩展到200–500 bp,预计将来会有用。测序错误和多态性可能会给所有基因组带来绘图问题,而不仅仅是重复DNA。一般来说,单基差并没有问题,因为大多数映射算法都会容纳一个或两个基差。然而,解决较大差异需要更好的多态性参考基因组注释和更深入的测序覆盖。

覆盖率与成本

另一个重要问题是序列覆盖率,即被调查成绩单的百分比,这对成本有影响。更大的覆盖范围需要更多的测序深度。要检测罕见的转录本或变体,需要相当深入的研究。在简单转录组中,例如酵母(S.pombe公司酿酒酵母)没有证据表明存在选择性剪接,从poly(A)mRNA文库中读取3000万个35-核苷酸足以观察在单一条件下(即在富含营养的培养基中)生长的细胞的大多数(>90%)基因的转录18。对于大多数目的来说,这个深度可能已经足够了,因为在400万个唯一定位读取时,RNA-Seq检测到的表达基因数量达到了80%的覆盖率,之后将深度加倍仅会增加10%的覆盖率(图5). 其余的基因可能在这种情况下不表达(例如,产孢基因18)或者没有poly(A)尾巴。分析许多不同的条件可以进一步增加覆盖范围;在里面S.pombe公司六种不同生长条件下的1.22亿次读取检测到99%以上注释基因的转录19.

保存图片、插图等的外部文件。对象名为nihms229948f5.jpg
覆盖范围与深度

|在400万个唯一定位的RNA-Seq读取中检测到80%的酵母基因,尽管测序深度不断增加,但覆盖率随后达到一个稳定水平。表达基因定义为在3′端50-bp的窗口中至少有四个独立的读取。数据取自REF。18.b条|当测序深度在两个小鼠转录组中达到8000万时,检测到的唯一起始位点的数量开始趋于稳定。ES,胚胎干细胞;EB,胚胎体。经过许可,图从REF修改。22©(2008)Macmillan Publishers Ltd.保留所有权利。

总的来说,基因组越大,转录组越复杂,就需要更多的测序深度才能获得足够的覆盖率。与基因组测序覆盖率不同,计算转录组的覆盖率不那么简单;这是因为不同转录亚型的真实数量和水平通常不知道,而且转录活性在基因组中差异很大。一项研究使用独特转录起始位点的数量作为衡量小鼠胚胎细胞覆盖率的指标,并证明在8000万读时,起始位点的数目达到了一个稳定值22(图5b). 然而,这种方法并没有解决选择性剪接和转录终止位点的转录组复杂性;进一步测序可能会发现其他变体。

新的转录组学见解

尽管存在上述挑战,但RNA-Seq的优势使我们能够对许多物种和细胞类型的转录组及其组织形成前所未有的全局视图。在RNA-Seq出现之前,已知酵母的比例远高于预期,黑腹果蝇人类基因组被转录2,4,36对酵母和人类来说,已经发现许多基因有许多不同的亚型2,4然而,大多数转录本和外显子的开始和结束都没有得到精确的解析,而且对剪接异质性的程度仍知之甚少。RNA-Seq以其高分辨率和高灵敏度揭示了已知基因的许多新转录区和剪接亚型,并为许多基因绘制了5′和3′边界。

绘制基因和外显子边界

RNA-Seq的单碱基分辨率有可能修改现有基因注释的许多方面,包括已知基因的基因边界和内含子,以及新转录区的识别。通过信号的急剧下降,5′和3′边界可以映射到10-50个碱基内。通过搜索poly(A)标记可以精确地绘制3′边界,通过搜索跨越GT–AG剪接共识位点的标记可以绘制内含子。使用这些方法,分别绘制了80%和85%的注释基因的5′和3′边界酿酒酵母18类似地,在S.pombe公司RNA-Seq数据结合平铺阵列数据定义了许多边界19.

这两项研究发现了许多以前没有分析过的5′和3′UTR。酿酒酵母在两个水平上发现了广泛的3′端异质性:第一,存在局部异质性,涉及一组位点,通常在10bp的窗口内;其次,540个基因有不同的poly(A)加成区域(图4). 似乎这些不同的3′端赋予不同的mRNA亚型不同的属性,例如mRNA定位或降解信号,这反过来可能负责独特的生物功能18,19除3′异质性外,mRNAs(uORFs)5′UTR内的上游ORFs列表也从17个大大扩展到340个(占酵母基因的6%)18; uORF调节mRNA翻译37或稳定性38因此,这些序列可能对真核生物基因组的调控复杂性做出了以前未被重视的贡献。有趣的是,许多带有uORF的mRNAs是转录因子,这表明这些调节因子本身受到了严格的调控。

转录边界的定位揭示了真核生物基因组织的几个新特征。发现许多酵母基因在3′端重叠18使用与最近研究中使用的标准类似的宽松标准18我们发现808对,约占所有酵母ORF的25%,在3′端重叠18同样,反义表达在小鼠转录物的3′外显子中富集22这些特征可能赋予受影响基因有趣的调控特性。对于多细胞生物,反义转录可以通过产生siRNA或通过dsRNA编辑来调节基因表达39,40对于似乎缺乏siRNA和dsRNA编辑功能的酵母,来自一个基因的转录可能会干扰来自重叠基因的转录,或通过其他机制协调基因表达。

广泛的转录复杂性

RNA-Seq可用于通过搜索跨越已知剪接接头和潜在新接头的读数来定量检查剪接多样性。在人类中,确认了31618个已知剪接事件(占所有已知剪接活动的11%),发现了379个新的剪接事件24另一项对人类细胞的研究发现了94241个连接,其中4096个是新的,并进一步证明了选择性剪接的普遍形式是外显子跳跃41在小鼠中,观察到3462个基因的广泛选择性剪接20此外,检测到42个连接多个小鼠基因外显子的剪接事件22.

新型转录

先前使用转座子标签和贴片微阵列的研究表明,在酵母基因组中,D.黑腹果蝇和人类,有许多新的转录区以poly(A)+RNA表示2,36,42,43然而,由于对交叉杂交的担忧,平铺阵列结果的准确性是不确定的(见下文)。RNA-Seq不存在背景噪音问题,已确认至少75%,可能大于90%酿酒酵母S.pombe公司基因组被表达18,19此外,RNA-Seq的结果表明,在每个被调查的基因组中都存在大量新的转录区,包括拟南芥21,鼠标20,22,人类24,酿酒酵母18S.pombe公司19基因组。487和453个新的转录本被发现于酿酒酵母S.pombe公司分别为18,19; 对于酿酒酵母其中一半没有通过微阵列进行鉴定。酵母中许多新的转录区似乎不编码任何蛋白质,其功能尚待确定。目前的测序深度不足以确定哺乳动物中新转录单位的边界;然而,30-40%的读取映射到未标记的区域20,22,24这些新的转录区,再加上许多未被发现的新剪接变异体,表明转录物的复杂性比以前认识到的要大得多。

定义转录水平

由于RNA-Seq是定量的,因此可以比微阵列更准确地确定RNA表达水平。原则上,可以确定细胞群中每个分子的绝对数量,并直接比较实验结果。已经使用了几种方法进行量化。对于RNA片段化后再进行cDNA合成,使每个外显子的覆盖更加均匀,基因表达水平可以从基因外显子中的总读取次数中推断出来,并通过可唯一映射的外显子长度进行标准化24; 对于3′偏置方法,使用3′端附近窗口的读取计数18这些方法测定的基因表达水平与对照组的qPCR和RNA峰值密切相关。

RNA-Seq的一个特别强大的优点是,它可以捕获跨不同组织或条件的转录组动力学,而无需复杂的数据集标准化19,20,22RNA-Seq已用于准确监测酵母营养生长期间的基因表达18,酵母减数分裂19和小鼠胚胎干细胞分化22,以跟踪发育过程中的基因表达变化,并提供不同组织之间基因表达差异的“数字测量”20由于这些优点,RNA-Seq无疑将对理解发育和正常生理变化期间的转录组动力学以及生物医学样品的分析具有重要价值,在生物医学样品分析中,它将使疾病组织和正常组织之间的可靠比较以及疾病状态的亚类化成为可能。

未来的方向

尽管RNA-Seq仍处于使用的早期阶段,但与之前开发的转录组学方法相比,它具有明显的优势。RNA-Seq的下一大挑战是以更复杂的转录体为靶点,以识别和跟踪所有基因中罕见RNA亚型的表达变化。促进实现这一目标的技术包括对端测序、特定于股的测序以及使用更长的读取时间来增加覆盖范围和深度。随着测序成本持续下降,RNA-Seq有望在许多涉及确定转录组结构和动力学的应用中取代微阵列。

致谢

我们感谢D.Raha的许多宝贵意见。

词汇表

基因表达的Cap分析(CAGE)与SAGE类似,只是分析转录本的5′端信息而不是3′端信息。
轮廓代表基因组或转录组重叠区域的一组序列。
dsRNA编辑通过dsRNA特异酶对前体mRNA进行定点修饰,从而产生来自同一基因的变异mRNA。
基因组平铺微阵列一种DNA微阵列,使用一组重叠的寡核苷酸探针,以非常高的分辨率表示基因组的子集或整个基因组。
大规模并行签名排序(MPSS)一种基因表达定量方法,使用多个酶切和连接循环从cDNA分子末端确定17-20个bp的“特征”。
小RNA(miRNA)由微小RNA基因产生的发夹状小RNA(shRNA)前体加工而成的小RNA分子。miRNAs的长度为21–23个核苷酸,通过RNA诱导的沉默复合物靶向并沉默含有不完全互补序列的mRNAs。
Piwi相互作用RNA(piRNA)由单链前体RNA加工而成的小RNA物种。它们的长度为25-35个核苷酸,与鼠兔蛋白形成复合物。piRNAs可能参与转座子沉默和干细胞功能。
定量PCR(qPCR)PCR在测定样品中DNA或RNA数量中的应用。测量通常是实时进行的,这种方法也称为实时PCR。
排序深度在单个测序实验或一系列实验中表示的所有序列读取或碱基对的总数。
基因表达系列分析(SAGE)一种使用转录物3′端的短约14–20 bp序列标签来测量基因表达水平的方法。
短干扰RNA(siRNA)由长双链RNA加工而成的21–23个核苷酸长的RNA分子;它们是RNAi诱导沉默复合物的功能成分。siRNA通常通过结合mRNA中完全互补的序列来靶向和沉默mRNA,并导致其降解和/或翻译抑制。
刺入RNA在RNA-Seq实验中添加的具有已知序列和数量的几种RNA作为内部对照。

脚注

更多信息

Gerstein实验室主页: http://bioinfo.mbb.yale.edu

斯奈德实验室主页: 网址:http://www.yale.edu/snyder

454生命科学: 网址:http://www.454.com

应用生物系统: www.appliedbiosystems.com

Helicos生物科学: http://www.helicosbio.com网站

Illumina公司: 网址:http://www.illumina.com

Illumina论坛: http://www.illumina.com/pagesnrn.ilmn?iD=245

SEQ回答: http://seqanswers.com/forums/showthread.php?t=43

在线PDF中的所有链接都处于活动状态

工具书类

1Clark TA,Sugnet CW,Ares M.,Jr使用剪接特异性微阵列对酵母中mRNA加工进行全基因组分析。科学。2002;296:907–910.[公共医学][谷歌学者]
2David L等人。酵母基因组中高分辨率转录图谱。程序。美国国家科学院。科学。美国。2006;103:5320–5325. [PMC免费文章][公共医学][谷歌学者]
三。Yamada K等人拟南芥基因组。科学。2003;302:842–846.[公共医学][谷歌学者]
4Bertone P等人。用基因组拼接阵列对人类转录序列进行全球鉴定。科学。2004;306:2242–2246.[公共医学][谷歌学者]
5程杰,等。人类10条染色体的5核苷酸分辨率转录图谱。科学。2005;308:1149–1154.[公共医学][谷歌学者]
6Okoniewski MJ,Miller CJ。短寡核苷酸微阵列中探针之间的杂交相互作用导致虚假相关性。BMC生物信息学。2006;7:276. [PMC免费文章][公共医学][谷歌学者]
7Royce TE、Rozowsky JS、Gerstein MB。走向通用微阵列:通过最近邻探针序列鉴定预测基因表达。核酸研究。2007;35:e99。 [PMC免费文章][公共医学][谷歌学者]
8Boguski MS、Tolstoshev CM、Bassett DE.、Jr在dbEST中的基因发现。科学。1994;265:1993–1994.[公共医学][谷歌学者]
9Gerhard DS等人。NIH全长cDNA项目的现状、质量和扩展:哺乳动物基因收集(MGC)基因组研究。2004;14:2121–2127. [PMC免费文章][公共医学][谷歌学者]
10Velculescu VE,Zhang L,Vogelstein B,Kinzler KW.基因表达的系列分析。科学。1995;270:484–487。[公共医学][谷歌学者]
11Harbers M,Carninci P.基于标记的转录组研究和基因组注释方法。自然方法。2005;2:495–502.[公共医学][谷歌学者]
12Kodzius R等人。CAGE:基因表达的cap分析。自然方法。2006;:211–222.[公共医学][谷歌学者]
13Nakamura M,Carninci P.Cap分析基因表达:CAGE。Tanpakushitsu Kakusan Koso。2004;49:2688–2693.(日语)[公共医学][谷歌学者]
14Shiraki T等。用于高通量分析转录起点和识别启动子用法的Cap分析基因表达。程序。美国国家科学院。科学。美国。2003;100:15776–15781. [PMC免费文章][公共医学][谷歌学者]
15Brenner S等人。通过微珠阵列上的大规模并行签名测序(MPSS)进行基因表达分析。自然生物技术。2000;18:630–634.[公共医学][谷歌学者]
16Peiffer JA等人拟南芥MPSS的花转录组。BMC植物生物学。2008;8:43. [PMC免费文章][公共医学][谷歌学者]
17Reinartz J等人。大规模并行签名测序(MPSS)作为所有生物体中深入定量基因表达谱分析的工具。简介。功能。基因组蛋白质组学。2002;1:95–104.[公共医学][谷歌学者]
18Nagalakshmi U等人。通过RNA测序确定的酵母基因组转录图谱。科学。2008;320:1344–1349. [PMC免费文章][公共医学][谷歌学者]
19Wilhelm BT等。在单核苷酸分辨率下调查的真核生物转录组的动态库。自然。2008;453:1239–1243.[公共医学][谷歌学者]
20Mortazavi A、Williams BA、McCue K、Schaeffer L、Wold B.通过RNA-Seq对哺乳动物转录体进行定位和量化。自然方法。2008;5:621–628.[公共医学][谷歌学者]
21李斯特R,等。表观基因组高度整合的单碱基分辨率图谱拟南芥.单元格。2008;133:523–536. [PMC免费文章][公共医学][谷歌学者]
22Cloonan N等。通过大规模mRNA测序进行干细胞转录组分析。自然方法。2008;5:613–619.[公共医学][谷歌学者]
23Marioni J、Mason C、Mane S、Stephens M、Gilad Y.RNA-seq:技术再现性评估和与基因表达阵列的比较。基因组研究。2008年6月11日;(doi:10.1101/gr.079558.108)[PMC免费文章][公共医学][谷歌学者]
24Morin R等。使用随机引物cDNA和大规模平行短阅读测序分析HeLa S3转录组。生物技术。2008;45:81–94.[公共医学][谷歌学者]
25Holt RA,Jones SJ。流式细胞测序的新范式。基因组研究。2008;18:839–846.[公共医学][谷歌学者]
26Barbazuk WB,Emrich SJ,Chen HD,Li L,Schnable PS.通过454转录组测序发现SNP。工厂J。2007;51:910–918. [PMC免费文章][公共医学][谷歌学者]
27Vera JC等。使用454焦磷酸测序对非模式生物进行快速转录组鉴定。摩尔生态。2008;17:1636–1647.[公共医学][谷歌学者]
28Emrich SJ,Barbazuk WB,Li L,Schnable PS。使用LCM-454转录组测序的基因发现和注释。基因组研究。2007;17:69–73. [PMC免费文章][公共医学][谷歌学者]
29Dutrow N等葡萄裂殖酵母RNA–DNA杂交图谱显示。自然遗传学。2008;40:977–986. [PMC免费文章][公共医学][谷歌学者]
30Wu JQ等人使用RACE测序对ENCODE区域转录基因座的系统分析揭示了人类基因组中的广泛转录。基因组生物学。2008;9:R3。 [PMC免费文章][公共医学][谷歌学者]
31Li R,Li Y,Kristiansen K,Wang J.SOAP:短寡核苷酸比对计划。生物信息学。2008;24:713–714.[公共医学][谷歌学者]
32Li H,Ruan J,Durbin R.绘制短DNA测序读数,并使用绘制质量分数调用变体。基因组研究。2008(doi:10.1101/gr.078212.108)[PMC免费文章][公共医学][谷歌学者]
33Smith AD、Xuan Z、Zhang MQ。使用质量分数和更长的读取时间可以提高Solexa读取映射的准确性。BMC生物信息学。2008;9:128. [PMC免费文章][公共医学][谷歌学者]
34Hillier LW等。全基因组测序和变异发现秀丽线虫.自然方法。2008;5:183–188.[公共医学][谷歌学者]
35Campbell PJ等。使用全基因组大规模平行配对末端测序鉴定癌症中的体细胞获得性重排。自然遗传学。2008;40:722–729. [PMC免费文章][公共医学][谷歌学者]
36Manak JR等,未标记转录在胚胎发育早期的生物学功能黑腹果蝇.自然遗传学。2006;38:1151–1158.[公共医学][谷歌学者]
37Hinnebusch AG.翻译法规GCN4号机组酵母的一般氨基酸控制。每年。微生物评论。2005;59:407–450.[公共医学][谷歌学者]
38Ruiz-Echevarria MJ,Peltz SW。RNA结合蛋白Pub1调节包含上游开放阅读框的转录物的稳定性。单元格。2000;101:741–751.[公共医学][谷歌学者]
39Tomari Y,Zamore PD。微RNA生物发生:没有伴侣,drosha无法切割。货币。生物学。2005;15:R61–R64。[公共医学][谷歌学者]
40RNA编辑如何影响dsRNA介导的基因沉默?冷泉港。交响乐团。数量。生物学。2006;71:285–292. [PMC免费文章][公共医学][谷歌学者]
41Sultan M等人。通过人类转录组的深度测序对基因活性和选择性剪接的全球观点。科学。2008;321:956–960.[公共医学][谷歌学者]
42Ross-Macdonald P等人。通过转座子标记和基因破坏对酵母基因组进行大规模分析。自然。1999;402:413–418.[公共医学][谷歌学者]
43Kumar A、des Etages SA、Coelho PS、Roeder GS、Snyder M.通过转座子标签大规模分析基因功能的高通量方法。方法酶制剂。2000;328:550–574.[公共医学][谷歌学者]