ppcseq公司
RNA序列广义线性模型的概率异常识别
生物导体版本:释放(3.19)
相对转录物丰度已被证明是理解生物系统中基因功能的一个有价值的工具。对于使用RNA测序数据进行转录物丰度的差异分析,负二项模型是目前最常用的模型。然而,基于负二项模型的常用方法对极端异常值不具有鲁棒性,我们发现这些异常值在公共数据集中非常丰富。到目前为止,还没有为RNA测序数据开发出严格的、概率性的异常值检测方法,将识别工作主要留给目视检查。贝叶斯计算的最新进展允许将观测数据与统计模型中给出的理论分布进行大规模比较。在此,我们提出ppcseq,这是一种关键的质量控制工具,用于识别差异表达分析中包含异常数据点的转录本,这些异常数据点不遵循负二项分布。应用ppcseq,使用流行工具分析几个公开可用的数据集,我们发现算法和数据集中差异丰富的转录本中有3%到10%的统计数据因存在离群值而膨胀。
作者:斯特凡诺·曼吉奥拉[aut,cre]
维护人员:Stefano Mangiola<mangiolastefano at gmail.com>
安装
要安装此软件包,请启动R(版本“4.4”)并输入:
如果(!require(“BiocManager”,悄悄地=TRUE))install.packages(“BiocManager”)BiocManager::安装(“ppcseq”)
对于R的旧版本,请参阅相应的生物导体释放.
文档
要查看系统中安装的此软件包版本的文档,请启动R并输入:
浏览幻影(“ppcseq”)
细节
生物视图 |
群集,差异表达式,基因表达式,规范化,质量控制,RNA序列,排序,软件,转录,转录组学 |
版本 |
1.12.0 |
在生物导体中 |
生物化学3.13(R-4.1)(3年) |
许可证 |
GPL-3公司 |
取决于 |
R(>=4.1.0),rstan公司(>= 2.18.1) |
进口 |
基准线,数字播放器,边缘R,foreach公司,ggplot2、图形、,生命周期,马格里特,方法,并行,呜呜声,卢比(>= 0.12.0),Rcpp并行(>= 5.0.1),爱尔兰航空公司,甾醇(>=2.1.1),统计,易怒的,河豚,第三年(>=0.8.3.9000),实用工具 |
系统要求 |
GNU制造 |
统一资源定位地址 |
https://github.com/stemangiola/ppcseq |
错误报告 |
https://github.com/stemangiola/ppcseq/issues |
查看更多
程序包档案
跟随安装在R会话中使用此包的说明。