跳到主页面内容
美国国旗

美国政府的官方网站

Dot政府

gov意味着它是官方的。
联邦政府网站通常以.gov或.mil结尾。之前分享敏感信息,确保你在联邦政府政府网站。

Https系统

该站点是安全的。
这个https(https)://确保您连接到官方网站,并且您提供的任何信息都是加密的并安全传输。

访问密钥 NCBI主页 MyNCBI主页 主要内容 主导航
.2010年6月;185(2):405-16.
doi:10.1534/genetics.110.114983。 Epub 2010年5月3日。

RNA测序数据的统计设计与分析

附属公司

RNA测序数据的统计设计与分析

保罗·L·奥尔等。 遗传学. 2010年6月.

摘要

下一代测序技术正迅速成为表征和量化整个基因组的首选方法。尽管从这些技术产生的数据被证明是迄今为止信息最丰富的,但很少有人关注数据收集和分析的基本设计方面,即采样、随机化、复制和分块。我们在RNA测序框架中讨论这些概念。通过模拟,我们展示了根据划分生物和技术变异来源的众所周知的统计设计收集复制RNA测序数据的好处。为了测试微分表达式,给出了这些设计及其相应模型的示例。

PubMed免责声明

数字

图1-
F类鬣蜥1.—
从七个不同治疗组的受试者中分离出mRNA的假想Illumina GA流细胞公式图像并加载到各个车道(例如第1组中受试者的mRNA在第1通道中测序。作为控制公式图像基因组样本通常被装载到第5车道。噬菌体公式图像基因组是精确已知的,可以用于重新校准其他通道测序读取的质量评分(B进入 等。2008).
图2-
F类鬣蜥2.—
日志2褶皱变化,治疗之间1和治疗2,标准化基因表达的-轴和平均对数2表达式绘制在x个-轴。基因表达计数通过相应的2×2表的列总数进行标准化(例如,表1)。蓝色圆点表示通过Fisher精确测试确定的显著差异表达基因;灰色圆点表示具有类似表达的基因。零处的红色水平线可目视检查对称性。
图</sc>3-
F类鬣蜥3.—
基于七个治疗组中三个生物复制的多流细胞设计。有三个流动池,每个流动池有八条车道。控件公式图像样品位于每个流动池的通道5中。T型ij公司指的是公式图像在中复制公式图像治疗组公式图像.
图4-
F类鬣蜥4.—
比较两种设计以测试处理A和B之间的差异表达。处理A用红色调表示,处理B用蓝色调表示。在理想的平衡块设计(左)中,有六个样品公式图像条形码、池和一起处理。然后将泳池分成六个相等的部分,输入六条车道公式图像流动池的。平衡块设计中的条形码在六次技术复制中产生结果公式图像同时平衡批次和车道效应以及车道阻塞。平衡区块设计还允许从组内生物变异性中划分批次和车道效应。混淆设计(右)代表一个典型的RNA-Seq实验,由相同的六个样本组成,没有条形码,并且不允许从组内生物变异性的估计中划分批次和车道效应。
图5-
F类鬣蜥5.—
三个治疗组的平衡不完全区组设计(BIBD)(T型1,T型2,T型3)每个治疗组一名受试者(T型11, T型21,T型31)以及每种产品的两个技术副本(T型111,T型112, T型211,T型212, T型311,T型312). 破碎后,三个样本中的每个样本都进行条形码编码并分为两个(例如.,T型11会被分成T型111T型112)然后按照图示进行汇总和排序(例如.,T型111T型212作为车道1的输入)。
图6-
F类鬣蜥6.—
一种基于七个治疗组中三个生物重复的设计。对于三个流动单元中的每一个,每个流动单元都有八条通道和一个控件(公式图像)在车道5中取样。T型ij公司指的是公式图像在中复制公式图像治疗组公式图像在本设计中,流动单元形成平衡完整块,车道形成平衡不完整块。
图7-
F类鬣蜥7.—
在治疗的模拟研究中比较了四种设计(A–D)公式图像公式图像设计A是一个生物无重复的无阻塞设计,治疗组只有一个受试者公式图像治疗组1名受试者公式图像设计B是一种生物上无重复的平衡块设计公式图像将(条形码)分成两份技术副本公式图像公式图像分成两个技术副本公式图像并输入车道1和2。C设计是一种生物复制的无阻塞设计,有三名受试者来自治疗组公式图像和治疗组的三名受试者公式图像设计D是每个受试者的生物复制平衡块设计(例如.,公式图像)将(条形码)分成六份技术副本(例如.,公式图像)并输入到六条车道。
图8-
F类鬣蜥8.—
组内可变性设置的ROC曲线公式图像. Thex个-轴表示假阳性率-轴表示真阳性率。图表的四个面板显示了四种模拟设置中每种设置的结果。未阻塞的未复制设计(A)的ROC曲线为纯红色,阻塞的未重复设计(B)为点红色,未阻塞的复制设计(C)为纯蓝色,而阻塞的复制设(D)为点蓝色。复制的设计总是优于未复制的设计,并且无论何时出现批量效应或车道效应,阻塞的设计都优于未阻塞的设计。

类似文章

  • 使用下一代测序技术表征自然变异。
    Gilad Y、Pritchard JK、Thornton K。 Gilad Y等人。 趋势Genet。2009年10月;25(10):463-71. doi:10.1016/j.tig.2009.09.003。Epub 2009年10月2日。 趋势Genet。2009 PMID:19801172 免费PMC文章。 审查。
  • 第二代测序数据的基于模型的质量评估和基础计算。
    布拉沃HC,爱尔兰RA。 Bravo HC等人。 生物计量学。2010年9月;66(3):665-74. doi:10.1111/j.1541-0420.2009.01353.x。 生物计量学。2010 PMID:19912177 免费PMC文章。 审查。
  • RNA测序实验设计的生物学观点。
    Pasmanik Chor M。 Pasmanik-Chor M。 方法分子生物学。2021;2243:327-337. doi:10.1007/978-1-0716-1103-6_17。 方法分子生物学。2021 PMID:33606266
  • 下一代测序时代运动障碍的遗传学。
    Olgiati S、Quadri M、Bonifati V。 Olgiati S等人。 Mov Disord公司。2016年4月;31(4):458-70. doi:10.1002/mds.26521。Epub 2016年2月22日。 莫夫·迪索德。2016 PMID:26899883 审查。
  • 差异表达——下一代及以后。
    Auer PL、Srivastava S、Doerge RW。 Auer PL等人。 功能基因组学简介。2012年1月;11(1):57-62. doi:10.1093/bfgp/elr041。Epub 2011年12月30日。 功能基因组学简介。2012 PMID:22210853 审查。

引用人

工具书类

    1. Agresti,A.,2002年。分类数据分析,第2版。新泽西州霍博肯威利。
    1. Alkan,C.、J.M.Kidd、T.Marques-Bonet、G.Aksay、F.Antonacci等人,2009年。使用下一代测序技术的个性化拷贝数和分段重复地图。自然遗传学。41 1061–1067.-项目管理咨询公司-公共医学
    1. Audic,S.和J.Claverie,1997年。数字基因表达谱的意义。基因组研究7 986–995。-公共医学
    1. Baggerly,K.A.、L.Deng、J.S.Morris和C.M.Aldaz,2004年。SAGE的过度分散逻辑回归:建模多组和协变量。BMC生物信息学5 144。-项目管理咨询公司-公共医学
    1. Balwierz,P.J.、P.Carninci、C.O.Daub、J.Kawai、Y.Hayashizaki等人,2009年。分析深测序表达数据的方法:利用deepCAGE数据构建人和小鼠启动子。基因组生物学。10 R79。-项目管理咨询公司-公共医学

出版物类型

LinkOut-更多资源