跳到主页内容
美国国旗

美国政府的官方网站

Dot政府

gov意味着它是官方的。
联邦政府网站通常以.gov或.mil结尾。之前分享敏感信息,确保你在联邦政府政府网站。

Https系统

网站是安全的。
这个https(https)://确保您连接到官方网站,并且您提供的任何信息都是加密的并安全传输。

访问密钥 NCBI主页 MyNCBI主页 主要内容 主导航
比较研究
.2004年8月31日5:519。
doi:10.1186/1471-2105-5-119。

基因表达序列分析中类内生物变异的贝叶斯模型

附属公司
比较研究

基因表达序列分析中类内生物变异的贝叶斯模型

里卡多·Z·N·Véncio等。 BMC生物信息学. .

摘要

背景:转录计数方法(如基因表达序列分析(SAGE)、“数字北部”或大规模并行签名测序(MPSS))面临的一个重要挑战是进行统计分析,以解释类内变异,即:。,由于同一类别的采样个体之间固有的生物学差异而产生的变异性,而不仅仅是由于技术采样误差而产生的变异性。

结果:我们引入了一个贝叶斯模型,该模型通过混合分布来解释类内变异性。我们表明,以前可用的池中聚集方法(“伪线性”)和贝塔-二项式模型是混合模型的特例。我们通过使用公共数据库中的SAGE数据进行脑瘤与正常对照来说明我们的方法。我们展示了一些标签的例子,这些标签被视为差异表达,如果忽略了类内变异性,那么它们具有很高的显著性,但是如果考虑到它,那么它们显然没有那么显著。

结论:利用生物复制的可用信息,可以将显示差异表达的候选转录本列表转换为更可靠的转录本。我们的方法可以在GPL/GNU copyleft下,通过一个用户友好的基于web的在线工具或作为补充网站上的R语言脚本免费获得。

PubMed免责声明

数字

图1
图1
贝叶斯错误率图解。此图显示了贝叶斯错误率的两个建议使用示例E类基于表达丰度的pdf定义差异表达基因π左边的例子显示了类的pdf的明显叠加,因此具有该图谱的基因不会提供类之间差异表达的证据。正确的例子显示两个pdf“相距甚远”,具有这种行为的基因应被安全地视为在两个类别之间差异表达。
图2
图2
最大值后部主要原型案例中类的Beta pdf预测pdf和Bayes错误率E类图中显示了肿瘤(T)类和正常(N)类的标记,例如文本中描述的三个重要原型病例中包含的标记。“x”和“o”标记表示每个肿瘤和正常中观察到的丰度。框架a)显示了案例(i)中方法符合“无差异表达”结论的示例。框架b)显示了案例(ii)方法符合“微分表达式”结论的示例。框架c)和d)显示案例(iii)经典时的示例-值方法导致类之间的差异表达显著,如果考虑到类内的可变性,我们的方法表示pdf叠加。个别观察表明,这些类别没有明确划分,这让人们对“差异表达”的结论产生了怀疑。
图3
图3
“小”尺寸库对最终结果的影响。预测pdf和Bayes错误率E类显示了文本中描述的三个重要原型案例中包含的示例标记的肿瘤(T)类和正常(N)类。“x”和“o”标记代表每个肿瘤和正常库中观察到的丰度。框架a)显示了使用所有库的结果。突出显示“小型”库(大小<50000),并显示其相对于库大小的计数。帧b)显示了排除那些“小”库的结果。很明显,结果几乎相同,“小”库不一定是采样的异常值。
图4
图4
贝叶斯错误率和-测试近似值。它显示了贝叶斯错误率(E类)与-测试近似值-每个标签的值(Baggerly)[12]。红线是定义显著性区域E≤0.1和Baggerly≤0.01的任意截止线。绿线是LOWESS潮流搭配。
图5
图5
最大值图解a后部参数估计。在一个人工示例中显示了方程12的最大后验参数。从中提取“帽子”(箭头所指)参数的二维pdf与等式8中描述的参数成正比。
图6
图6
我们的SAGEbetaBin方法的web界面快照。为使我们的方法易于使用而实现的在线工具的示例如下所示。研究人员提交他们的数据(A),并在我们完成工作时通过电子邮件接收警报,以及在密码保护的网页(B)中获取结果的指示。如果提供的ID是人类标签(C),则结果与SAGE基因的标签到基因图相关联。本工作中使用的个别观测图形可按需提供(D)。

类似文章

引用人

  • DEAD-box RNA解旋酶RhlB是在低温下高效RNA加工所必需的茎乳杆菌.
    de Araüjo HL、Picinato BA、Lorenzetti APR、Muthunayake NS、Rathnayaka-Mudyanselage IW、Dos Santos NM、Schrader J、Koide T、Marques MV。 de Araüjo HL等人。 微生物规范。2023年12月12日;11(6):e0193423。doi:10.128/光谱.01934-23。Epub 2023年10月18日。 微生物规范。2023 PMID:37850787 免费PMC文章。
  • 高通量miRNA测序揭示了胃癌的场效应,并提出了表观遗传网络机制。
    阿萨姆普桑奥MB、莫雷拉FC、哈莫伊IG、马加莱斯L、维达尔A、佩雷拉A、布尔巴诺R、卡亚特A、席尔瓦A、桑托斯S、德马奇基S、里贝罗·多斯桑托斯、阿萨姆普桑奥P。 阿萨姆普桑·MB等人。 Bioninform Biol Insights公司。2015年7月6日;9:111-7. doi:10.4137/BBI.S24066。2015年电子收集。 Bioninform Biol Insights公司。2015 PMID:26244015 免费PMC文章。
  • miRNAs高通量测序揭示胃癌的组织特征,并提出新的潜在生物标记物。
    达内特·S、莫雷拉·FC、哈莫伊·IG、布尔巴诺·R、卡亚特·A、克鲁兹·A、马加莱斯·L、席尔瓦·A、桑托斯·S、德马奇基·S、阿萨姆普桑·M、阿萨姆普桑·P、里贝罗·多斯桑托斯。 Darnet S等人。 Bioninform Biol Insights公司。2015年6月28日;9(补充1):1-8。doi:10.4137/BBI.S23773。2015年电子收集。 Bioninform Biol Insights公司。2015 PMID:26157332 免费PMC文章。
  • RNA-Seq数据的差异表达分析。
    Gupta R、Dewan I、Bharti R、Bhattacharya A。 Gupta R等人。 ISRN生物信息。2012年9月20日;2012:817508. doi:10.5402/2012/817508。eCollection 2012。 ISRN生物信息。2012 PMID:25937942 免费PMC文章。
  • 一种用于RNA-seq数据差异表达分析的迭代归一化和测试方法。
    周瑜、林恩、张波。 周毅等。 BioData Min.2014年8月13日;7:15. doi:10.1186/1756-0381-7-15。2014年电子收集。 生物数据2014年版。 PMID:25285156 免费PMC文章。

工具书类

    1. Velculescu VE,Zhang L,Vogelstein B,Kinzler KW.基因表达的系列分析。科学。1995;270:484–487.-公共医学
    1. Margulies EH、Kardia SL、Innis JW。SAGE库中GC内容偏差的识别和预防。2001年《核酸研究》;29:e60。doi:10.1093/nar/29.12.e60。-内政部-项目管理咨询公司-公共医学
    1. Stern MD、Anisimov SV、Boheler KR。能否根据SAGE目录估计转录组大小?生物信息学。2003;19:443–448。doi:10.1093/bioinformatics/btg018。-内政部-公共医学
    1. Stollberg J、Urschitz J、Urban Z、Boyd CD。SAGE的定量评估。基因组研究。2000;10:1241–1248. doi:10.1101/gr.10.8.1241。-内政部-项目管理咨询公司-公共医学
    1. Akmaev VR、Wang CJ。基因表达序列分析中基于序列的伪影修正。生物信息学。2004;20:1254–1263. doi:10.1093/bioinformatics/bth077。-内政部-公共医学

出版物类型