RNAseqCovarImpute(RNAseqCovar生效)
RNA测序研究中的有效协变量数据
生物导体版本:释放(3.19)
RNAseqCovarImpute软件包对与缺失协变量的多重插补(MI)兼容的RNA序列读取计数进行线性模型分析。在RNA测序研究中实施MI的一个主要问题是,结果数据必须包含在插补预测模型中,以避免偏差。这在高维数据的组学研究中是困难的。我们在RNAseqCovarImpute软件包中开发的第一种方法通过将基因分成较小的组来分析伪相关性,克服了高维结果数据的问题。该方法通过以下方式在基因表达研究中实现协变量MI:1)将基因随机分为较小的组,2)在每个箱子内分别创建M个插补数据集,其中插补预测矩阵包括所有协变量和每个箱子内基因的百万分对数(CPM),3)在每个基因库中的每个M插补数据集上,分别使用“limma::voom”和“limma::lmFit”函数估计基因表达变化,4)在应用“limma::squeezeVar”函数之前,先对基因集进行解包并堆叠M组模型结果,以对每个M组模型的结果应用方差收缩贝叶斯程序,5)将结果与Rubins规则合并,以生成组合系数、标准误差和P值,和6)调整多重性的P值以解释错误发现率(FDR)。一种更快的方法使用主成分分析(PCA)来避免将基因装箱,同时仍保留MI模型中的结果信息。将基因分成较小的组需要进行多次(通常是数百次)MI和limma-voom分析。计算效率更高的MI PCA方法通过1)使用Bioconductor“PCAtools”包对所有基因的对数CPM值进行PCA,在基因表达研究中实现协变量MI,2)创建M个插补数据集,其中插补预测矩阵包括所有协变量和要保留的最佳PC数量(例如,基于Horn的并行分析或占解释变量>80%的PC数量),3)在每个M插补数据集上使用“voom”、“lmFit”和“eBayes”函数执行标准limma-voom管道,4)将结果与Rubins规则合并,以产生组合系数、标准误差和P值,5)调整多重性的P值以说明错误发现率(FDR)。
作者:布伦南·贝克、Sheela Sathyananarayana[aut]、Adam Szpiro[aut'、James MacDonald[aut]和Alison Paquette[aut'
维护人员:布伦南·贝克(Brennan Baker)<brennanhilton at gmail.com>
引文(从R中输入引文(“RNAseqCovarImpute”)
):
安装
要安装此软件包,请启动R(版本“4.4”)并输入:
if(!require(“生物管理器”,悄悄=TRUE))install.packages(“BiocManager”)BiocManager::安装(“RNAseqCovarImpute”)
对于R的旧版本,请参阅相应的生物导体释放.
文档
要查看系统中安装的此软件包版本的文档,请启动R并输入:
浏览渐晕图(“RNAseqCovarImpute”)
细节
生物视图 |
差异表达式,基因表达式,RNA序列,排序,软件 |
版本 |
1.2.0 |
在生物导体中 |
生物柴油3.18(R-4.3)(1年) |
许可证 |
GPL-3公司 |
取决于 |
R(>=4.3.0) |
进口 |
博科生物,生物遗传学,生物并行,统计,利马,数字播放器,马格里特,爱尔兰航空公司,边缘R,foreach公司,老鼠 |
系统要求 |
|
统一资源定位地址 |
https://github.com/brennanhilton/RNAseqCovarImpute公司 |
Bug报告 |
https://github.com/brennanhilton/RNAseqCovarImpute/issues网站 |
查看更多
程序包档案
跟随安装在R会话中使用此包的说明。