跳到主页内容
美国国旗

美国政府的官方网站

Dot政府

gov意味着它是官方的。
联邦政府网站通常以.gov或.mil结尾。之前分享敏感信息,确保你在联邦政府政府网站。

Https系统

网站是安全的。
这个https://确保您连接到官方网站,并且您提供的任何信息都是加密的并安全传输。

访问密钥 NCBI主页 MyNCBI主页 主要内容 主导航
.2010;11(8):R83。
doi:10.1186/gb-2010-11-8-r83。 Epub 2010年8月11日。

用Myrna进行云尺度RNA测序差异表达分析

附属机构

用Myrna进行云尺度RNA测序差异表达分析

本·兰美德等人。 基因组生物学. 2010.

摘要

随着测序吞吐量接近每天几十千兆字节,对转录组测序(RNA-Seq)数据分析的高效软件的需求越来越大。Myrna是一个云计算管道,用于计算大型RNA-Seq数据集中的差异基因表达。我们将Myrna应用于公共数据集的分析,并评估标准统计模型的拟合优度。Myrna可从http://bowtie-bio.sf.net/myrna。

PubMed免责声明

数字

图1
图1
Myrna管道.(a)使用平行版本的Bowtie将读数与基因组对齐。(b)读取被聚合为每个基因组特征的计数-例如,注释文件中的每个基因。(c)对于每个样本,根据计数分布的摘要计算归一化常数。(d)统计模型用于计算R编程语言中跨多个处理器并行的微分表达式。(e)重要性总结,如P(P)-计算并返回值和特定于基因的计数。(f)Myrna还返回差异表达基因的出版就绪覆盖图。
图2
图2
Hapmap结果.的柱状图P(P)-来自六种不同分析策略的值应用于随机标记的样本。在每种情况下P(P)-值应该均匀分布(蓝色虚线),因为标签是随机分配的。(a)泊松模型,第75百分位归一化。(b)泊松模型,包括第75个百分位作为术语。(c)高斯模型,第75百分位归一化。(d)高斯模型,包括第75个百分位作为术语。(e)置换模型,第75百分位归一化。(f)排列模型,第75个百分位作为术语。
图3
图3
单体型图P(P)-值与读取深度.绘制P(P)-使用随机标记样本的六种不同分析策略,对每个基因的平均计数的对数基数10进行比较。在每种情况下P(P)-值应均匀分布在0和1之间。(a)泊松模型,第75百分位归一化。(b)泊松模型,包括第75个百分位作为术语。(c)高斯模型,第75百分位归一化。(d)高斯模型,包括第75个百分位作为术语。(e)置换模型,第75百分位归一化。(f)排列模型,第75个百分位作为术语。
图4
图4
Myrna的可扩展性。从EC2分配的工作CPU内核数量与每小时实验测量的吞吐量:也就是说,在11亿次读取的Pickrell上进行全人类实验所需的壁时钟时间的倒数数据集[32]。标记为“线性加速”的行跟踪了相对于80个处理器内核的吞吐量的假设线性加速。

类似文章

  • RNA-seq阅读差异表达分析:概述、分类和工具。
    Chowdhury HA,Bhattacharyya DK,Kalita JK。 Chowdhury HA等人。 IEEE/ACM Trans-Comput生物信息。2020年3月至4月;17(2):566-586. doi:10.1109/TCBB.2018.2873010。Epub 2018年10月1日。 IEEE/ACM Trans-Comput生物信息。2020 PMID:30281477 审查。
  • SPARTA:基于参考的细菌RNA-seq转录组自动分析简单程序。
    Johnson BK、Scholz MB、Teal TK、Abramovitch RB。 Johnson BK等人。 BMC生物信息学。2016年2月4日;17:66. doi:10.1186/s12859-016-0923-y。 BMC生物信息学。2016 PMID:26847232 免费PMC文章。
  • RNA CoMPASS:RNA-seq数据集病原体和宿主转录组分析的双重方法。
    Xu G、Strong MJ、Lacey MR、Baribault C、Flemington EK、Taylor CM。 Xu G等。 公共科学图书馆一号。2014年2月25日;9(2):e89445。doi:10.1371/journal.pone.0089445。2014年电子收集。 公共科学图书馆一号。2014 PMID:24586784 免费PMC文章。
  • RNA-seq数据处理和质量评估的管道。
    Goncalves A、Tikhonov A、Brazma A、Kapushesky M。 Goncalves A等人。 生物信息学。2011年3月15日;27(6):867-9. doi:10.1093/bioinformatics/btr012。Epub 2011年1月13日。 生物信息学。2011 PMID:21233166 免费PMC文章。
  • 从RNA-seq读取到差异表达结果。
    Oshlack A,Robinson医学博士,Young医学博士。 Oshlack A等人。 基因组生物学。2010;11(12):220. doi:10.1186/gb-2010-11-12-220。Epub 2010年12月22日。 基因组生物学。2010 PMID:21176179 免费PMC文章。 审查。

引用人

工具书类

    1. Metzker ML.测序技术-下一代。Nat Rev基因。2010;11点31分至46分。doi:10.1038/nrg2626。-内政部-公共医学
    1. Pepke S,Wold B,Mortazavi A.ChIP-seq和RNA-seq研究的计算。自然方法。2009;6:S22–S32。doi:10.1038/nmeth.1371。-内政部-项目管理咨询公司-公共医学
    1. Wang Z,Gerstein M,Snyder M.RNA-Seq:转录组学的革命性工具。Nat Rev基因。2009;10:57–63. doi:10.1038/nrg2484。-内政部-项目管理咨询公司-公共医学
    1. Bullard JH,Purdom E,Hansen KD,Dudoit S。mRNA-Seq实验中归一化和差异表达统计方法的评估。BMC生物信息学。2010;11:94. doi:10.1186/1471-2105-11-94。-内政部-项目管理咨询公司-公共医学
    1. Birol I、Jackman SD、Nielsen CB、Qian JQ、Varhol R、Stazyk G、Morin RD、Zhao Y、Hirst M、Schein JE、Horsman DE、Connors JM、Gascoyne RD、Marra MA、Jones SJ。与ABySS的从头转录组组装。生物信息学。2009;25:2872–2877. doi:10.1093/bioinformatics/btp367。-内政部-公共医学

出版物类型