跳到主页面内容
美国国旗

美国政府的官方网站

Dot政府

gov意味着它是官方的。
联邦政府网站通常以.gov或.mil结尾。之前分享敏感信息,确保你在联邦政府政府网站。

Https系统

该站点是安全的。
这个https(https)://确保您连接到官方网站,并且您提供的任何信息都是加密的并安全传输。

访问密钥 NCBI主页 MyNCBI主页 主要内容 主导航
.2009年4月;5(4):e1000352。
doi:10.1371/journal.pcbi.1000352。 Epub 2009年4月10日。

检测临床宏基因组样本差异丰富特征的统计方法

附属公司

检测临床宏基因组样本差异丰富特征的统计方法

詹姆斯·罗伯特·怀特等。 公共科学图书馆计算生物学. 2009年4月.

摘要

目前正在进行大量研究,以确定居住在我们世界上的微生物群落的特征。这些研究旨在极大地扩展我们对微生物生物圈的理解,更重要的是,希望揭示我们与共生菌群之间复杂共生关系的秘密。这些发现的一个重要前提是计算工具能够快速准确地比较复杂细菌群落生成的大型数据集,以识别区分它们的特征。我们提出了一种统计方法,用于在计数数据(例如通过测序获得的数据)的基础上比较来自两个治疗群体的临床宏基因组样本,以检测差异丰富的特征。我们的Metastats方法使用错误发现率来提高高复杂度环境中的特异性,并使用Fisher精确检验分别处理稀疏样本特征。在各种模拟下,我们表明,与以前使用的方法相比,转移算法表现良好,并且在具有稀疏计数的特征方面显著优于其他方法。我们在多个数据集上证明了我们的方法的实用性,包括对肥胖和瘦削人类肠道微生物组的16S rRNA调查,婴儿和成熟肠道微生物组COG功能谱,以及从85个宏基因组的随机序列推断出的细菌和病毒代谢子系统数据。将我们的方法应用于肥胖数据集,揭示了原始研究中未报告的肥胖和瘦削受试者之间的差异。对于COG和子系统数据集,我们首次对这些群体之间的差异进行了严格的统计评估。本文中描述的方法是第一个解决由多个受试者样本组成的临床宏基因组数据集的方法。我们的方法在不同复杂度和采样水平的数据集上是稳健的。虽然设计用于宏基因组应用,但我们的软件也可以应用于数字基因表达研究(例如SAGE)。我们的方法和免费源代码的web服务器实现可以在http://metastats.cbcb.umd.edu/。

PubMed免责声明

利益冲突声明

提交人声明,不存在相互竞争的利益。

数字

图1
图1。特征丰度矩阵的格式。
每行代表一个特定的分类单元,而每列代表一个主题或复制。The frequency of the 第个中的功能j个 第个主题(c(i,j))记录在矩阵的相应单元格中。如果在第一个群体中,他们由第一个群体代表矩阵的列,而其余列表示第二个总体的主题。
图2
图2。检测稀疏特征的差异丰度。
Fisher精确检验中使用了2×2列联表来区分稀有特征之间的丰度差异。(f)11是特征的观察数在治疗1的所有个体中。(f)21是非特征的观察数在治疗1的所有个体中。(f)12(f)22对治疗2的定义类似。
图3
图3。离散度估计(φ)用于本研究中使用的三个宏基因组数据集。
这些图比较了(A)肥胖和瘦肉人类肠道分类数据、(B)婴儿和成熟人类肠道COG分配以及(C)微生物和病毒子系统注释之间的离散值。我们在这一数据中发现了广泛的可能分散性,并且两个群体之间的分散性存在显著差异。
图4
图4。模拟研究中比较统计方法的ROC曲线。
序列从具有可变离散度和组平均比例的β二项分布中选择第页1第页2对于每组参数,我们模拟了1000次试验,其中500次是在零假设下产生的(第页1 = 第页2),而其余部分则不同程度地丰富,其中a*p公司1 = 第页2例如,p=0.2和a=2表示包括20%的种群的特征,这些特征在两个感兴趣的种群之间的丰度相差两倍。的参数值第页1显示在每个图的上方。
图5
图5。极端稀疏采样模拟研究中比较统计方法的ROC曲线。
序列从具有可变离散度和组平均比例的β二项分布中选择第页1第页2。对于每一组参数,我们模拟了1000个试验,其中500个是在零假设下生成的(第页1 = 第页2),其余的则有差异地丰富,其中a*p公司1 = 第页2例如,p=0.2和a=2表示包含20%种群的特征,两个感兴趣种群之间的丰度相差两倍。的参数值第页1显示在每个图的上方。

类似文章

引用人

工具书类

    1. Schloss PD,Handelsman J.研究不可培养微生物的宏基因组学:解决难题。基因组生物学。2005年;6:229.-项目管理咨询公司-公共医学
    1. Bik EM、Eckburg PB、Gill SR、Nelson KE、Purdom EA等。人类胃中细菌微生物群的分子分析。美国国家科学院院刊2006;103:732–737.-项目管理咨询公司-公共医学
    1. Batzoglou S、Jaffe DB、Stanley K、Butler J、Gnere S等。《ARACHNE:一个全系列霰弹枪装配工》。基因组研究2002;12:177–189.-项目管理咨询公司-公共医学
    1. Palmer C、Bik EM、Digiulio DB、Relman DA、Brown PO。人类婴儿肠道微生物群的发展。《公共科学图书馆·生物》。2007;5:e177。doi:10.1371/journal.pbio.0050177。-项目管理咨询公司-公共医学
    1. Sogin ML、Morrison HG、Huber JA、Welch DM、Huse SM等。深海和未充分开发的“稀有生物圈”中的微生物多样性。美国国家科学院院刊2006;103:12115–12120.-项目管理咨询公司-公共医学

出版物类型