跳到主页内容
美国国旗

美国政府的官方网站

Dot政府

政府意味着它是官方的。
联邦政府网站通常以.gov或.mil结尾。之前分享敏感信息,确保你在联邦政府政府网站。

Https系统

该站点是安全的。
这个https(https)://确保您连接到官方网站,并且您提供的任何信息都是加密的并安全传输。

访问密钥 NCBI主页 MyNCBI主页 主要内容 主导航
.2010;11(2):R14。
doi:10.1186/gb-2010-11-2-r14。 Epub 2010年2月4日。

RNA-seq的基因本体分析:选择偏差的解释

附属公司

RNA-seq的基因本体分析:选择偏差的解释

马修·D·杨等人。 基因组生物学. 2010.

摘要

我们提出了GOseq,一种对RNA-seq数据进行基因本体(GO)分析的应用程序。在全基因组表达研究中,GO分析被广泛用于降低复杂性和突出生物过程,但标准方法对RNA-seq数据给出了有偏见的结果,因为过度检测了长转录物和高表达转录物的差异表达。将GOseq应用于前列腺癌数据集表明,GOseq显著改变了结果,突出了与已知生物学更加一致的类别。

PubMed免责声明

数字

图1
图1
基因本体范畴中基因的长度分布.(a)在log10尺度上GO类别中平均基因长度的分布。GO类别基因长度由类别内基因的中位数给出。(b)P(P)-双边Mann-Whitney U检验的值比较GO类别中基因的中位数长度与7873个GO类别的基因总体分布。超低P(P)-数值表明,有许多GO类别包含一组显著的长或短基因。
图2
图2
差异表达与基因长度和读取计数的关系.(a)DE基因的比例绘制为转录长度的函数。每个点代表300个基因组成的基因箱中称为DE的基因的百分比,与箱中基因的中位数长度相对应。绿线是通过对二进制数据拟合6节点的单调三次样条得到的概率加权函数。可以看出,在更长的基因长度上,有一个明显的趋势,即检测到更多的差异表达。(b)同样,除了使用每个基因的读取总数而不是转录长度之外。再一次,可以看到一种趋势,即基因的DE越大,读取次数越多。注意,与(a)相比,概率范围更大。
图3
图3
标准方法和GOseq方法之间基因本体类别排名的变化.(a)GO类别等级的变化,从超几何方法到GOseq校正长度偏差,绘制的长度偏差与类别平均基因长度的对数相对应。(b)GO类别的等级变化,从超几何方法到GOseq校正总读取计数,绘制的总读取计数与类别中每个基因的平均计数的对数相对应。可以清楚地看到,标准方法低估了包含短(或高表达)基因的GO类别的重要性,高估了包含长(或低表达)基因GO类别重要性的趋势。
图4
图4
GOseq与标准超几何方法的比较.(a)这个P(P)-使用Wallenius近似和标准超几何方法用GOseq生成的值与P(P)-使用随机抽样(重复200k次)用GOseq计算的值。Wallenius方法(绿色十字)与高分辨率(200000次重复)随机采样显示出良好的一致性。P(P)-在GOseq和超几何方法之间可以看到值。(a)对于给定的列表大小,显示列表之间的差异数量。黑线将使用高分辨率采样的GOseq与超几何方法进行比较。红线将使用高分辨率采样的GOseq与Wallenius近似值进行比较。同样,使用Wallenius方法的GOseq与使用随机抽样方法(重复20万次)的GOsez几乎没有差异,而超几何方法显示了大量差异(约20%)。
图5
图5
在相同样本上使用RNA-seq和微阵列进行基因本体分析的比较RNA-seq数据识别的GO类别中与微阵列GO分析重叠的部分显示为所选类别数量的函数。使用GOseq和超几何方法分析了RNA-seq数据。GOseq类别与微阵列GO类别的重叠度始终高于标准方法。
图6
图6
与标准方法相比,校正总读取计数偏差或长度偏差时,最重要类别的变化.使用不同方法生成的最重要GO类别中的差异数量图。该图将GOseq的长度偏差校正版本与标准超几何方法(绿线)进行了比较,并将GOseque的总读取计数偏差校正版本和标准超几何法(黑线)进行比较。

类似文章

引用人

工具书类

    1. Fu X,Fu N,Guo S,Yan Z,Xu Y,Hu H,Menzel C,Chen W,Li Y,Zeng R,Khaitovich P.用蛋白质组学评估RNA-Seq和微阵列的准确性。BMC基因组学。2009;10点61分。-项目管理咨询公司-公共医学
    1. Wang ET、Sandberg R、Luo S、Khrebtukova I、Zhang L、Mayr C、Kingsmore SF、Schroth GP、Burge CB。人类组织转录体中的替代亚型调控。自然。2008;456:470–476.-项目管理咨询公司-公共医学
    1. Wang X,Sun Q,McGrath SD,Mardis ER,Soloway PD,Clark AG。新生小鼠脑内新印迹基因的转录组全鉴定。公共科学图书馆一号。2008;3:e3839。-项目管理咨询公司-公共医学
    1. Wahlstedt H,Daniel C,Enstero M,Ohman M。大尺度mRNA测序决定了大脑发育过程中RNA编辑的全球调节。基因组研究2009;19:978–986.-项目管理咨询公司-公共医学
    1. Oshlack A,韦克菲尔德MJ。RNA-seq数据中的转录长度偏差混淆了系统生物学。生物直接。2009;4:14.-项目管理咨询公司-公共医学