跳到主要内容

这是2024年10月15日PMC网站的更新预览。了解更多信息

返回当前站点

                                  PMC主页
NIHPA Author手稿徽标Link to NIHPA Author Manuscripts
.作者手稿;PMC:2012年1月11日。
以最终编辑形式发布为:国家生物技术。2011年7月11日;29(7):572–573. 数字对象标识:10.1038/nbt.1910

测序技术不能消除生物变异性

卡斯珀·德汉森 1,吴志进 2,拉斐尔·A·爱尔兰 1,*,杰弗里·特里克 1,*
PMCID:PMC3137276 NIHMSID:NIHMS287698 PMID:21747377

摘要

RNA测序因其相对于微阵列的优势而备受瞩目。这种兴奋导致了大量的出版物贬低生物变异性的重要性;正如20世纪90年代微阵列出版物所做的那样。通过比较微阵列和测序数据,我们证明,无论测量技术如何,表达测量在个体之间都表现出生物变异性。我们的分析表明,旨在评估生物变异性的RNA测序实验更有可能产生可重复的结果。


RNA测序(RNAseq)技术与微阵列相比具有多种优势。例如,可以测量替代转录1或测量非编码区的转录2从头开始.另一个潜在优势是技术差异小2-4这导致了该技术的迅速采用以及最近的出版物激增5然而,兴奋情绪导致许多此类出版物低估了生物变异性的影响;也许忘记了基因表达测量中不需要的变异不仅仅是由于测量误差。基因表达是一个随机过程6已知在被认为是同一人群的不同单位之间存在差异,例如在个体的特定健康组织样本中7在典型的实验中,可以分解基因表达测量的变化8作为:

变量(Expr公司)=跨组变异性+测量误差+生物变异性

群体可变性是实验中考虑的组导致的基因表达变化。例如,众所周知,肿瘤样本的基因表达谱与匹配的健康对照的表达谱不同9这种变异性可以通过比较不同生物组的样品来测量,通常是感兴趣的结果。基因表达变异的第二个组成部分,测量误差,可以通过技术复制品进行估算,即使用技术多次测量同一样品的不同等分。这是随着技术改进而可能减少的变化类型4测序和微阵列研究中众所周知的技术变异来源是实验室10,11和批次12影响。表达式变化的第三个部分是真的生物变异性,这只能通过考虑从同一组内的多个生物样本中进行的表达测量来进行测量。无论使用何种技术来测量表达水平,真正的基因表达水平都会因个体而异,因为表达本质上是一个随机过程6在一个主要关注群体比较的实验中,测量误差和生物变异可能会与关注的结果相混淆:组间表达的估计差异。

为了说明同一组内个体之间的生物变异性如何无法通过测序技术消除,我们从仅有的两个具有大量生物复制品的RNA测序实验中收集了公共数据,分别为n=60和n=6913,14我们将这些测序数据的子集(分别为43和51个样本)与来自两个不同平台的微阵列数据进行了比较15,16在每次比较中,使用这两种技术分析完全相同的细胞系。在研究一中,m=14797基因在所有样本的测序和微阵列中进行了表达测量。在第二项研究中,m=7157基因在所有样本上都通过这两种技术进行了表达测量(补充方法).

对于这两项研究中的每一个表达基因,我们计算了用微阵列和测序测量的个体表达水平的变异性估计值(补充方法). 我们发现,在微阵列和测序技术中,每个基因的表达差异是相似的(图1a-b). 不同的可变性度量选择也存在相同的趋势(补充图1a-b)以及根据测序计算表达式的不同方法(补充图1c-d). 我们还发现,转录本在生物变异性方面表现出显著差异。例如,COX4NB公司在这两种人群中都没有强烈的变化,而RASGRP1系统无论技术如何,这两种人群的差异都很大(图1c). 两个基因的技术变异性都明显小于总变异性(补充图2a). 这些结果与生物变异性是基因表达本身的特性相一致,而不是用于测量表达的技术。为了证实这一结果,我们通过将混合效应模型应用于测序(11个样本)和微阵列(14个样本)实验的数据,估算了每个基因的总变异性比例,其中我们有两个技术重复。一般来说,大多数观察到的变异是生物性的,而不是技术性的(补充图2b).

图1。

图1

用测序和微阵列测量生物变异性。(a)在《陌生人》中用微阵列测量的表达值标准偏差图.研究15蒙哥马利(x轴)和测序.研究13(y轴)。测序对表达变异性的估计与微阵列的估计类似。(b)Choy基因芯片测量的表达值标准偏差图.研究16(x轴)和Pickrell.研究14(y轴)。测序的表达变异性估计值与微阵列的估计值几乎相同。(c)两个基因的表达图COX4NB公司(左栏,粉红色)和RASGRP1系统(右栏,蓝色)通过测序(顶行)和微阵列(底行)与生物样品进行测量。这两项研究的平均中心测量值分别绘制为圆和三角形。这两个基因的标准偏差在a、 b。该图表明,无论测量技术或研究如何COX4NB公司表达式的变量远小于RASGRP1系统表达式。

生物变异性对RNA测序实验的设计、分析和解释具有重要意义。例如,在考克斯4nb两组之间可能很重要,因为该基因的表达在个体之间差异不大。同时RASGRP1系统这可能是毫无意义的,因为该基因的表达是高度可变的。如果只有少数生物复制品可用,就不可能在一项研究中估计每个基因表达的生物变异水平。补充表1总结了过去三年中发表的大量RNA测序研究。在所有情况下,除了我们在这里分析的两项研究外,结论都是基于少量(n≤2)的生物复制。RNA测序研究的一个目标可能只是简单地识别和编目新的或替代转录物的表达。然而,所有这些研究都是在极少数生物复制的基础上做出更广泛的生物学声明。

我们的分析对使用少量生物复制品进行的研究有两个重要影响:(1)这些研究的显著结果可能是由于生物变异,可能不可重复;(2)不可能知道表达模式是针对研究中的个体还是研究人群的特征。这些想法现在在微阵列实验中被广泛接受,现在需要大量的生物复制来证明科学结论的合理性。我们的分析表明,由于生物变异性是基因表达的一个基本特征,测序实验应遵循类似的要求。

补充材料

1
NIHMS287698-补充-1.pdf(982.4KB,pdf)

工具书类

关联数据

本节收集本文中包含的任何数据引用、数据可用性声明或补充材料。

补充资料

1
NIHMS287698-补充-1.pdf(982.4KB,pdf)

资源