跳到主页面内容
美国国旗

美国政府的官方网站

Dot政府

gov意味着它是官方的。
联邦政府网站通常以.gov或.mil结尾。之前分享敏感信息,确保你在联邦政府政府网站。

Https系统

该站点是安全的。
这个https(https)://确保您连接到官方网站,并且您提供的任何信息都是加密的并安全传输。

访问密钥 NCBI主页 MyNCBI主页 主要内容 主导航
.2010年8月10日11:422。
doi:10.1186/1471-2105-11-422。

baySeq:识别序列计数数据中差异表达的经验贝叶斯方法

附属公司

baySeq:识别序列计数数据中差异表达的经验贝叶斯方法

托马斯·哈德卡斯尔等。 BMC生物信息学. .

摘要

背景:高通量测序已成为研究多种基因组,尤其是转录组数据中表达水平的重要技术。分析此类数据的一个关键方法是寻找显示特定差异表达模式的数据元素,以便进一步分析和验证。

结果:我们提出了一个定义差异表达模式的框架,并开发了一种新的算法baySeq,该算法使用经验Bayes方法检测一组测序样本中的差异表达模式。该方法假设数据为负二项分布,并从整个数据集推导出经验确定的先验分布。我们在真实数据和模拟数据上检验了该方法的性能。

结论:我们的方法在分析真实数据和模拟数据中的两两微分表达式时,至少与现有方法一样好,而且往往更好。当我们比较涉及多个样本组的实验设计数据的分析方法时,我们的方法再次显示出显著的性能提升。我们认为,这种方法因此代表了对测序实验计数数据的分析向前迈出的重要一步。

PubMed免责声明

数字

图1
图1
根据观察到的fold-change估计差异表达的后验概率对一万个元组的单个模拟观察到的折叠变化进行差异表达的估计后验概率,其中一千个元组是真正差异表达的(DE),而九千个元组不是差异表示的(非DE)。
图2
图2
不同库数和差异表达度的平均FDR曲线平均FDR曲线,基于100个模拟,比较了多种方法在识别成对差异表达方面的性能。数据包含1000个真正的DE元组和9000个非DE元元组,并使用不同数量的库进行模拟n个1n个2,不同程度的差异表达b条,并随机选择每个元组的离散度(~Γ(0.85,0.5))。
图3
图3
恒定离散数据的平均ROC曲线平均ROC曲线,基于100个模拟,比较了多种方法识别成对差异表达的性能。该数据包含5000个真正的DE元组和5000个非DE元团,并通过所有元组具有恒定离散度的负二项分布进行模拟ϕ=0.17、0.42或0.95。
图4
图4
实际序列数据在零假设下的(对数)p值与每个序列的平均表达水平无过度分散.(Log)无过度分散原假设和过度分散替代假设下实际序列数据的p值。我们通过对泊松模型和另一种负二项模型的拟合进行相似比检验,从而获得每个序列的相似比,同时考虑到库大小和两种样本类型之间的差异。虽然一些序列与泊松模型没有显著差异,但有相当多的序列表现出非常显著的差异。过度分散特别显著的序列是那些平均表达水平较高的序列,因为这些序列最容易检测到过度分散。
图5
图5
在RDR6基因敲除实验中发现差异表达的tasRNA相关小RNA的数量在对来自两个野生型样品和两个RDR6敲除样品的小RNA数据的分析中,与通过每种方法获得的每个列表顶部的差异表达的小RNA的数量相对的tasRNA相关的小RNA的数量。我们预计tasRNA相关的小RNA在RDR6基因敲除样本中表达不足,因此可以在差异表达的元组中找到这些小RNA。
图6
图6
用于分析更复杂实验设计的平均FDR曲线平均FDR曲线,基于100个模拟,比较了多种方法在识别更复杂的差异表达模式方面的性能。数据是从三种实验条件下的样品中模拟出来的A类,B类C类,给出了总共五种可能的差异表达模式。我们在这里显示了一种实验条件与另两种不同的元组识别的错误发现率({A类1, ...,A类n个,B类1, ...,B类n个} {C类1。。。C类n个})以及三种实验条件都不同的元组的识别({A类1, ...,A类n个}{B类1。。。B类n个}{C类1。。。C类n个}). 使用不同数量的库模拟数据n个在每个实验条件下。
图7
图7
的比较bay序列复杂实验设计中不同模型的方法性能平均FDR曲线,基于100个模拟,比较了bay序列在更复杂的实验设计分析中识别不同类型差异表达的方法。数据是从三种实验条件下的样品中模拟出来的A类,B类C类,给出了总共五种可能的差异表达模式。我们在这里显示了一种实验条件与另两种不同的元组识别的错误发现率({A类1, ...,A类n个,B类1。。。B类n个}{C类1。。。C类n个})以及三种实验条件都不同的元组的识别({A类1, ...,A类n个}{B类1。。。B类n个}{C类1。。。C类n个}). 我们还显示了用于识别显示任何类型的差分表达式的元组的错误发现率。

类似文章

引用人

工具书类

    1. Margulies M、Egholm M、Altman WE、Attiya S、Bader JS、Bemben LA、Berka J、Braverman MS、Chen YJ、Chen Z、Dewell SB、Du L、Fierro JM、Gomes XV、Godwin BC、He W、Helgesen S、Ho CH、Ho CH、Irzyk GP、Jando SC、Alenquer ML、Jarvie TP、Jirage KB、Kim JB、Knight JR、Lanza JR、Leamon JH、Lefkowitz SM、Lei M、Li J、Lohman KL、Lu H、Makhijani VB、McDade KE、,McKenna MP、Myers EW、Nickerson E、Nobile JR、Plant R、Puc BP、Ronan MT、Roth GT、Sarkis GJ、Simons JF、Simpson JW、Srinivasan M、Tartaro KR、Tomasz A、Vogt KA、Volkmer GA、Wang SH、Wang Y、Weiner MP、Yu P、Begley RF、Rothberg JM。微加工高密度微晶反应器中的基因组测序。自然。2005;437:376–380.-项目管理咨询公司-公共医学
    1. Bentley DR.全基因组重新排序。2006年通用操作基因开发;16:545–552. doi:10.1016/j.gde.2006.10.009。-内政部-公共医学
    1. 下一代测序改变了今天的生物学。自然方法。2008年;5:16–18. doi:10.1038/nmeth1156。-内政部-公共医学
    1. 下一代测序技术对遗传学的影响。趋势Genet。2008年;24:133–141.-公共医学
    1. Velculescu VE,Zhang L,Vogelstein B,Kinzler KW。基因表达的系列分析。科学。1995;270:484–487. doi:10.1126/science.270.5235.484。-内政部-公共医学

出版物类型

LinkOut-更多资源