跳到主页内容
美国国旗

美国政府的官方网站

Dot政府

gov意味着它是官方的。
联邦政府网站通常以.gov或.mil结尾。之前分享敏感信息,确保你在联邦政府政府网站。

Https系统

该站点是安全的。
这个https(https)://确保您连接到官方网站,并且您提供的任何信息都是加密的并安全传输。

访问密钥 NCBI主页 MyNCBI主页 主要内容 主导航
.2014年2月3日;15(2):R29。
doi:10.1186/gb-2014-15-2-r29。

voom:精确权重解锁用于RNA-seq读取计数的线性模型分析工具

voom:精确权重解锁用于RNA-seq读取计数的线性模型分析工具

慈善与法律等。 基因组生物学. .

摘要

为了分析RNA-seq实验的读取计数,提出了新的正常线性建模策略。voom方法估计对数计数的均值-方差关系,为每个观测值生成精确权重,并将其输入极限经验贝叶斯分析管道。这为RNA-seq分析人员提供了一个为微阵列开发的大量方法体系。仿真研究表明,voom的性能与基于计数的RNA-seq方法相当或更好,即使数据是根据早期方法的假设生成的。两个案例研究说明了线性建模和基因集测试方法的使用。

PubMed免责声明

数字

图1
图1
平均方差关系。RNA-seq数据的基因平均值和方差由带有LOWESS趋势的黑点表示。绘图是根据数据集中生物变异程度的增加进行排序的。(a)SEQC项目样本A、B、C和D的HBRR和UHRR基因的voom趋势;仅技术变更。(b)C57BL/6J和DBA小鼠实验;低水平生物变异。(c)存在100个上调基因和100个下调基因的模拟研究;中度生物变异。(d)尼日利亚淋巴母细胞系;高级生物变异。(e)黑腹果蝇胚胎发育阶段;由于样品之间的系统差异,生物变异性很高。(f)数据集(a)–(e)的LOWESS voom趋势。HBRR,Ambion的人脑参考RNA;LOWESS,局部加权回归;UHRR,Stratagene的通用人类参考RNA。
图2
图2
voom均值-方差建模。(a)根据平均对数绘制基因平方剩余标准偏差。(b)通过对这些点进行稳健的LOWESS拟合,给出了基因平均值和方差之间的函数关系。(c)均值-方差趋势使每个观测值能够使用其对数拟合值映射到平方标准偏差值。LOWESS,局部加权回归。
图3
图3
在缺乏真微分表达式的情况下,I型错误率。条形图显示了具有P(P)每种方法均<0.01(a)当库大小相等且(b)当库大小不相等时。红线表示标称类型I错误率为0.01。结果是100次模拟的平均值。将I类错误控制在标称水平或以下的方法应位于红线以下。
图4
图4
检测真实差异表达的能力。条形图显示检测到的具有统计显著性的基因总数(FDR<0.1)(a)具有相同的库大小和(b)具有不相等的库大小。蓝色部分显示真阳性数,而红色部分显示假阳性数。200个基因真正差异表达。结果是100次模拟的平均值。蓝色条的高度表示经验幂。红色段与蓝色段的比率表示经验FDR。FDR,错误发现率。
图5
图5
错误发现率。绘制了每种方法的错误发现数量与差异表达基因的选择数量。100次模拟的平均结果(a)具有相同的库大小和(b)具有不相等的库大小。在这两种情况下,voom在任何截止点都具有最低的FDR。FDR,错误发现率。
图6
图6
根据SEQC峰值数据评估错误发现率。绘制了每种方法的错误发现数量与差异表达基因的选择数量。voom的错误发现率总体上最低。
图7
图7
RNA-seq方法的计算时间。条形图以秒为单位显示分析MacBook笔记本电脑上的一个模拟数据集所需的时间。方法按从最快到最昂贵的顺序排列。
图8
图8
男性与女性的MA图比较,突出显示男性和女性特异性基因。MA图是由limma-plotMA函数生成的,是每个基因的对数变化与平均对数cpm的散点图。Y染色体基因男性特异区域的基因突出显示为蓝色,在男性中持续上调,而X染色体上报告的逃避X失活的基因则突出显示为红色,通常在男性中下调。log-cpm,百万分之log-counts。
图9
图9
的多维比例图黑腹果蝇胚胎阶段。距离是根据log-cpm值计算得出的。连续12个胚胎发育阶段从最早到最晚标记为1到12。
图10
图10
与每个基因相关的基因数量黑腹果蝇胚胎期。记录每个阶段出现峰值估计表达的基因数量。
图11
图11
每个基因的峰值表达趋势黑腹果蝇胚胎期。面板(1)(12)对应于12个连续的发育阶段。每个面板显示了在该阶段达到峰值表达的前十个基因的拟合表达趋势。特别是面板(1)显示了在第一阶段和面板中表达最高的基因(12)显示基因在最后阶段表达最高。面板(7)(8)值得注意的是,它们显示的基因分别在12-14小时和14-16小时出现显著峰值。

类似文章

引用人

工具书类

    1. Tusher VG,Tibshirani R,Chu G.应用于电离辐射反应的微阵列显著性分析。国家科学院院刊。2001;98:5116–5121. doi:10.1073/pnas.091062498。-内政部-项目管理咨询公司-公共医学
    1. Wright GW,Simon RM。检测小型微阵列实验中差异基因表达的随机方差模型。生物信息学。2003;19:2448–2455. doi:10.1093/bioinformatics/btg345。-内政部-公共医学
    1. 用于评估微阵列实验中差异表达的线性模型和经验贝叶斯方法。统计应用基因分子生物学。2004;3:第3条。-公共医学
    1. 崔X,黄志刚,邱J,Blades NJ,Churchill GA。通过缩小方差分量估计值改进差异基因表达的统计检验。生物统计学。2005;6点59分至75分。doi:10.1093/biostatistics/kxh018。-内政部-公共医学
    1. Smyth G,Michaud J,Scott H。使用阵列内复制点评估微阵列实验中的差异表达。生物信息学。2005;21:2067–2075. doi:10.1093/bioinformatics/bti270。-内政部-公共医学