收缩贝叶斯
该网站对应于以下文件:
Van de Wiel MA、Neerincx M、Buffert TE、Sie D、Verheul HMW(2014)。ShrinkBayes:一个通用的R包,用于分析复杂研究设计中基于计数的测序数据。BMC生物信息学. 15(1):116.
Van de Wiel MA、de Menezes RX、Siebring E、Van Beusechem VW(2013)。分析使用多参数的小样本临床基因组学研究收缩:在高通量RNA干扰筛选中的应用.BMC医学基因组6(补充2), 第1章。
Van de Wiel马萨诸塞州,Leday GGR,Pardo L,Rue H,Van der瓦尔特AW,Van Wieringen WN(2012年)。贝叶斯主义者RNA测序数据分析估计多个收缩先验。生物统计学 14, 113-128。
为什么使用ShrinkBayes?
- 它被证明比大多数其他方法更具重现性,特别是对于小样本
- 它建立在INLA基础之上。因此,比MCMC快得多。
- 允许(零膨胀)计数和高斯数据[因此可以应用于(mi)RNAseq、CAGE、,mRNA/miRNA微阵列、HT RNAi等…]
- 在设计方面非常通用。GLM上下文,并允许随机效果。
- 提供贝叶斯FDR和lfdr估计。
- 适应各种先验,包括混合和非参数先验。
- 启用多参数收缩
R套餐(自2016年4月20日起在吉布提提供)
注意:如果您有选择使用Windows或Unix/Linux,选择后者。ShrinkBayes在Unix/Linux下的运行效率高于在Windows下。注意:运行ShrinkBayes时,您可能会看到***来自INLA的警告***(例如关于本征值或关于收敛,甚至18500人堕胎……)。他们目前不能令人惊讶,因为它们是由C代码生成的。请忽略它们。
安装说明
对于Windows用户:请关闭Windows错误报告。Windows XP:Windows键+暂停/中断、高级、错误报告、完全(无关键错误)。Windows 7(及其他)请参见:停机错误报告
ShrinkBayes依赖于以下软件包(安装请参见下文):
INLA公司(需要软件包sp和pixmap)、降雪、VGAM、mclust、logcondens、Iso、XML、rgl[全部可从CRAN获得]
步骤:
1install.packages(c(“sp”,“pixmap”,“降雪”,“VGAM”,“mclust”,“logcondens”,“Iso”,“XML”,“rgl”),repos=“网址:http://cran.r-project.org")
Unix/Linux:如果无法安装“XML”、“rgl”,请尝试
苏多apt-get构建dep r-cran-xml
sudo apt-get build-dep r-cran-rgl
2。源(“http://www.math.ntnu.no/insa/givemeINLA.R")
[或者,如果您在2012年10月1日之前安装了INLA,则应使用INLA.upgrade()进行升级]
3. 库(devtools)
install_github(“markvdwiel/SrinkBayes”)
####重要提示####
ShrinkBayes做到了不是 执行内部标准化。这里有一个使用的解决方案edgeR的TMM规范化。
库(edgeR)
cnf<-calcNormFactors(mydat,method=“TMM”)
normfac<-cnf$samples[,3]#这里是存储的归一化因子
库大小<-colSums(mydat)
rellibsize<-libsize/exp(平均值(log(libsize)))#相对库大小
核燃料<-normfac*rellibsize#包括库大小在内的最终归一化因子
解决方案 1: 生成标准化计数并对其应用ShrinkBayes。
mydatnorm=圆形(扫描(mydata,2,nf,“/”))
解决方案 2:保持计数不变(因此对mydat数据应用ShrinkBayes),但通过指定
myoffsets<-log(nf)
形式<-~1+组+偏移(myoffsets)
第二种解决方案是首选方案,但第一种可能有用当您希望将正常化计数用于其他目的时。
####通知结束####
转录组测序数据
完整数据集可从ReCoun公司t吨网站。下面是ShrinkSeq文件中使用的数据。
平衡的分裂。
四次不平衡分割
第一次拆分的小集合用作补充材料生物统计学纸张。