微生物群落多样,包含多达10种12每克个体数代表数千个物种。鉴于这种巨大的生物多样性,比较微生物群落具有挑战性。尽管微生物群落分析的许多方面一直是最近努力的重点,以使细菌群落的分析具有统计严谨性(12,13,17,20,23,26-29),我们仍然缺乏比较社区的方法。群落结构的比较,即群落中物种之间个体总数的分布(1),对于将分类群的相对丰度与特定活动关联起来至关重要。例如,将抑制植物病原体的土壤群落与不抑制植物病因体的土壤群落进行比较,可以确定构成土壤抑制的群落的特征或建议使用生物控制剂,并将重点放在种植上。在过于复杂的社区中,无法对超过一小部分成员进行抽样,因此无法通过描述性分析确定观察到的序列表征差异是由于随机机会还是生物显著差异。因此,需要定量工具来支持基于人群样本的统计推断。
我们之前根据LIBSHUFF中实现的Cramér-von Mises统计数据修改了一项分析(29)并指定了我们的实现(27). 该测试使用成对距离矩阵来确定是从同一人群中抽取两个样本,还是其中一个样本是另一个样本的子集。LIBSHUFF类型分析的一个局限性是,每次两两比较实际上都需要两个假设检验。如果要比较两个样本,则进行两次比较;如果有四个样本,则有12个比较(比较次数=N个对待 [N个对待− 1]). 这种方法可与执行大量成对操作相媲美t吨测试,而不是进行单一的方差分析(ANOVA)。多次比较需要调整族I型错误率,即错误检测到显著差异的概率,以保持理想的实验型I错误率,通常设置为0.05。调整多重比较的影响会降低检测实际存在差异的统计能力(33). 第二个限制是用户必须使用基于距离的方法来执行分析,而不是潜在的更稳健的贝叶斯、简约或最大似然方法。由于所有的系统发育方法都有局限性(9),如果研究人员能够灵活地使用各种方法比较他们的结果,那将是有利的。
最近,Martin(20)建议采用群体遗传学中用于描述基因流的简约性检验(19,30,31),比较16S rRNA基因库。该方法已被用于进行类似的分析,称为UniFrac(17). 微生物生态学家使用16S rRNA的简约性测试进行比较(16,34),18S rRNA(25),核酮糖1,5-二磷酸羧化酶/加氧酶(22),好氧一氧化碳脱氢酶(7),和病毒(三)来自不同环境集合的序列集合。尽管简约性检验在微生物生态学中得到了广泛应用,但没有人清楚地阐明该方法在统计学或生物学方面所测试的确切假设。
在以前的简约测试实现中,测试人员使用了MacClade(http://www.macclade.org)软件包,这是一个昂贵的特定于平台的计算机程序,不容易适应此测试。我们开发了一个免费的计算机程序TreeClimer,它以快速、易于使用和简化的方式实现了简约测试。在这里,我们陈述了在简约测试中评估的假设,展示了TreeClimer实现简约测试的能力,并讨论了测试实现中以前未涉及的几个方面。
材料和方法
简约测试算法。
简约测试由三部分组成(19,30,31). 首先,重建一组群落的复合系统发育,并将该分类群与它们起源的处理相关联。其次,确定了解释系统发育与处理的共变所需的最小步骤或转换次数。最后,计算由随机链接分类群生成的随机系统发育树的得分。此步骤重复多次(n个≥1000),以获得描述通过将序列组合成组的随机过程观察到每个分数的概率分布。TreeClimer执行最后两个部分,使用用户提交的树和随机树生成观察每个简约分数的概率分布。
系统发育重建。
在ClustalW(1.83版)中使用10.0的间隙开放惩罚和0.10的间隙扩展惩罚构建序列比对。使用邻接连接、引导邻接连接和简约算法构建的树是使用PAUP*计算的(35). 因为不可能对我们分析的所有数据集进行最节约型树的穷尽搜索,所以我们保留了1000棵最节俭型树。使用MrBayes构造的树是通过假设一个通用的时间可逆模型和伽马分布率来计算的。MrBayes分析使用了四条马尔可夫链,它们最多运行了500000代,因此每代的最大可能性相对恒定。最后的10万棵树每100代取样一次,得到1000棵树。ARB的最新版本(18),菲律宾(10)、PAUP*(35)、MEGA3(14)和MrBayes(24)从适当的网站获得。用于执行此处显示的许多模拟的NEXUS格式文件可在TreeClimer网站上找到(http://www.plantpath.wisc.edu/fac/joh/treeclimber.html).
用吝啬来得分。
给定一个系统发育树,其中每个分类单元都与一个处理相关联,TreeClimer使用Fitch算法确定处理之间最节省的转换次数(11). 简约测试算法使用系统发育树,其中每个外部分支(图。,叶1至8)根据序列产生的处理进行标记。该算法比较每个叶子,以确定每个内部节点的适当标签(图。,节点a到g),通过比较共享同一节点的两个分支的标签。如果两组标签之间存在交集,则节点将被标记为交集的结果,并且惩罚不会评估为简约分数。如果两个标签之间没有交集,则应用两个标签的并集,并对简约分数评估1的惩罚。这种评分算法可以应用于任何具有任意多个不同标签的分支树。图显示了一个来自两种处理的分析的系统发育树示例。这棵树的节俭得分是三分。
使用惠誉算法的示例(11)当从两个群落获得样本时,对系统发育树进行评分。字母表示节点的治疗,数字表示每个序列的治疗标签。显示了每个节点的简约分数(P)和治疗标签,因为它们通过节点聚合。
简约分数的显著性。
TreeClimer为每个测试构建了10000个随机连接树,以生成每个随机概率分布。TreeClimer通过对实际数据集中的每个治疗使用相同数量的个体来生成随机连接树。该程序随机选择两个分类单元、两个节点或一个节点和一个分类单元,并在新节点处将它们连接起来。重复此过程,直到构建完整的树。计算每个随机树的简约性得分。假设正在评估的假设是正确的,那么10000棵随机连接的树中具有该简约分数的那一部分就是偶然观察到该分数的概率。将用户输入树的简约分数与累积概率分布进行比较,可以看出偶然观察到相同或更低简约分数的概率。
TreeClimer公司。
TreeClimer可以作为C++源代码在Linux或Mac OSX中免费编译,也可以作为Windows操作系统的二进制可执行文件免费提供(http://www.plantpath.wisc.edu/fac/joh/treeclimber.html). 运行程序需要两个输入文件:一个是PHYLIP或NEXUS格式的Newick文件,其中包含一个或多个系统发育树,另一个是包含序列名及其相应处理的文件。用户可以选择构建测试分布所需的随机连接树的数量。任何数量的处理和复制的概率分布都可以在不输入一组观察到的系统发育或序列标识符的情况下确定。最后,TreeClimer生成一个文件,其中包含观察用户和随机加入树的每个简约分数的概率。
结果和讨论
TreeClimer评估。
我们开发了TreeClimer,以提供执行简约测试的简化方法。为了测试简约测试的实现,我们使用从文献中获得的各种数据集(表). 我们实施的结果与原始研究中观察到的结果一致。在PHYLIP、ARB、MEGA3、PAUP*和MrBayes中生成的系统发生树已成功用于TreeClimer(图。).
McCaig等人的数据的MrBayes生成和邻接(NJ)系统发育树的TreeClimer生成概率分布(21). 将苏格兰土壤数据集与10000棵随机连接的树木的得分分布进行比较,当时每种处理有137个和138个样本。简约分数为84的星号表示累积随机概率等于0.047的分数。当使用MrBayes生成的树时,98.2%的树具有P(P)值小于0.05且P(P)邻接连接树的值为0.004。
表1。
的比较P(P)对于不同的系统发育树构建方法和16S rRNA序列收集,使用Ş-LIBSHUFF和TreeClimber获得的值一
站点(参考) | 库名称(序列号) | б-LIBSHUFFP(P)价值 | TreeClimer(树弯曲器)P(P)第95个百分位的值(占P(P)值≤0.05)
|
---|
邻居加入 | 吝啬 | 邻居加入引导 | 贝叶斯先生 |
---|
序批式反应器(2) | SBR1(97)、SBR2(92) | 0.065, 0.747b条 | 0.103 (0.000) | 0.159 (0.003) | 0.522 (0.032) | 0.409 (0.005) |
干旱土壤(6) | C0(59),S0(53) | 0.012*, 0.187b条 | 0.147 (0.000) | 0.147 (0.000) | 0.244 (0.355) | 0.147(0.483) |
苏格兰土壤(21) | SAF(138),SL(137) | 0.030, 0.073b条 | 0.004* (1.000) | 0.018* (1.000) | 0.031* (0.989) | 0.047* (0.982) |
威斯康星州土壤(15) | 1997年(139)、2000年(129) | <0.001*, <0.001*b条 | <0.001* (1.000) | <0.001* (1.000) | <0.001* (1.000) | <0.001*(1.000) |
高山冻原真菌(25) | 春季(56)、夏季(27)、冬季(42) | <0.001*c(c) | <0.001* (1.000) | <0.001* (1.000) | <0.001* (1.000) | <0.001* (1.000) |
接受抗生素治疗的患者粪便(36) | 抗生素前(84)、治疗期间(74)、抗生素后(84) | <0.001*c(c) | <0.001* (1.000) | <0.001* (1.000) | <0.001* (1.000) | <0.001* (1.000) |
使用П-LIBSHUFF对每项研究进行平行分析,以确定所调查的每个社区是否是另一个图书馆中所代表社区的子样本。在我们分析的六项研究中,有四项获得了低P(P)两种技术的值(表). 对于六项研究中的一项,我们计算出P(P)值使用的是б-LIBSHUFF和高P(P)使用TreeClimer的值(6)另一方面,我们观察到了相反的结果(21). 两种方法之间的显著性差异可能是由于统计能力和分析中测试的假设的差异。
自从简约测试算法被引入并在其他研究中实现以来(三,7,16,22,25,34),我们发现了五个潜在的问题。最值得注意的问题是陈述简约检验所评估的假设。其他问题包括选择系统发育,使用数据子集进行分析,以确定治疗对特定生物群体的影响,设计适合测试的适当实验,以及确定是否在分析中使用重复序列。
假设发展。
马丁(20)概括地描述了简约性测试的应用,该测试用于确定两个16S rRNA序列集合是否具有不同的谱系。由Maddison和Slatkin开发(19,30,31)然而,该假说假设不同处理的人群要么是泛发型,要么是流行型,要么是克隆型。将该假设应用于微生物群落存在许多问题,包括细菌之间缺乏经典的有性交配,缺乏一个物种的单一种群,以及泛殖、流行、克隆和种群的概念,微生物学中的定义是指使用多点酶电泳在不同位点上的基因关联(32).
为了应用于群落系统发育,有必要修改原始假设。我们修正的假设是,两个群落共享一个祖先群落结构(即联合群落结构),两个或多个群落结构之间观察到的系统发育差异是由于随机变异的积累。如果这个假设是正确的,随机连接树就是一个可能观察到的系统发育的例子,因为在每个处理中都很可能发现种群。当社区中的人口经历某种影响(即扰动或选择),导致人口增加或减少时,就会偏离这一假设。或者,一些影响可能会阻碍社区展示变异迹象。如果种群面临选择压力,那么相似成员的种群更可能选择单一处理而非多重处理。这将导致比随机变化预期的简约分数更低。如果没有发生随机变异,那么在一个治疗中发现的相同血统在所有治疗中都会出现。这将导致节俭分数高于随机变化的预期分数。根据可用数据(表),两个或多个社区似乎不太可能彼此相同。因此,我们有兴趣测试一种治疗对多个社区结构施加选择压力的可能性。
系统发育重建。
我们发现P(P)使用不同系统发育方法进行的分析中的值,表明潜在系统发育的稳健性对分析至关重要(表). 使用不同方法构建的系统发育比较可能会增加P(P)价值观是由生物效应引起的,而不是方法论的产物。我们认为MrBayes生成的树是最可靠的系统发育树,因为它们代表了真实系统发育的等概率随机抽样。当生成的1000棵树中至少95%的树具有P(P)值小于0.05,我们认为治疗之间的差异是显著的(图。).
简约测试和LIBSHUFF之间的一个显著区别是,-LIBSHUFF计算连续统计量,而TreeClimer计算离散统计量,其范围取决于所分析的序列数。在∑-LIBSHUFF分析中,如果执行10000次随机化,统计数据通常有10000个不同的值。对于相同数量的随机化,分布局限于一个更窄的可能性窗口,这意味着简约分数1或2的差异可能表示P(P)值。这导致分辨率降低P(P)值,并可能导致统计能力降低。例如,在分析Dunbar等人的数据集时(6),我们得到邻接树和简约树的简约得分为34,使用自举邻接树与MrBayes树的中位数得分为33;这些分数P(P)数值分别为0.147和0.081。如果有一个分数是32P(P)该值将为0.040,并被视为略微重要。这表明分析对系统发育的质量很敏感。
理想情况下,使用TreeClimer的实验将设计为最大化P(P)值,从而提高统计能力。当每个处理至少有100个分类群时,每添加一个分类群到两个处理中,第5百分位和第95百分位之间的简约度得分平均增加0.03(数据未显示)。当每个处理至少有100个序列时,每个库中添加的每个分类单元的第5百分位简约度得分增加0.65(数据未显示)。考虑到在Dunbar等人的数据集中,仅从这两个群落获得了53和59个序列(6),社区成员的额外测序可能会导致发现差异选择压力证据的概率很高。
实验设计。
McCag等人的16S rRNA基因库(21)微生物学家对未经改良的牧场和接受化肥的改良牧场进行了广泛研究,开发了研究微生物生态学的工具(5,12,20,26,27,29). 尽管完整的收集代表了来自每个牧场的三个重复16S rRNA基因库,但之前对数据集的每个分析都忽略了嵌套实验设计,将每个站点内的三个库合并在一起,并实施了单一分类设计。这些调整是必要的,因为不幸的是,简约测试和LIBSHUFF类型测试只适用于单分类分析。
在经典的嵌套方差分析中,当一个治疗中重复之间的变异性不显著时,允许汇集重复并使用单分类方差分析(33). 我们采用了类似的方法,将每个牧场的三个重复中的每一个都视为一个单独的处理。通过对改进后的牧场图书馆进行比较,得出了略高的结果P(P)价值(87.6%的树木P(P)值小于0.05),并且P(P)通过比较未改进的库(100%的树具有P(P)值小于0.001)。这表明改良的土壤副本可以合并,而未改良的土壤复制无法合并。对三个未改进的重复进行配对比较,结果显示P(P)值(所有三个比较中95%的树具有P(P)值小于0.015),表明三个图书馆所代表的社区结构存在显著差异。鉴于这一结果以及在简约试验分析中无法解释土内类型的变异性,尚不清楚P(P)比较汇集数据集时观察到的值是由于未改良土壤重复之间的差异或未改良土壤复制之间的差异造成的。根据样本的选择方式,数据可能表明施肥可以使改良土壤中的细菌分布更加均匀。
Schadt等人(25)春季采集高山土壤18S rRNA基因序列(n个=56),夏季(n个=27)和冬季(n个=42)调查真菌群落的季节变化。他们没有报告所有三个处理之间的比较结果,也没有报告夏季和冬季处理之间的成对比较结果,但他们描述了夏季和春季序列收集之间成对比较的结果(100%的树木具有P(P)值<0.05)和春季和冬季序列收集之间(60%的树木P(P)值<0.05)。两两比较法存在问题,因为它增加了识别由于偶然性而产生的显著差异的概率(33). 然而,当我们复制Schadt等人的分析,并在所有三种处理中进行一次比较时,1000棵树中100%有P(P)值小于0.001,表明原始研究者的两两比较是适当的。与经典方差分析一样,只有在证明存在一些实验范围的差异以缓解与多重比较相关的问题后,才适合进行两两比较(33).
个体血统分析。
通过对移除特定组的树进行简约性测试,并使用仅包含一组序列的树,完成了对导致群落结构差异的谱系的识别。McCaig等人的数据集(21)通过研究α-变形杆菌属改良与未改良土壤图书馆的群落结构(20). 在前面的分析中,使用了邻接树,当α-变形杆菌属序列被删除,两个群体之间没有统计上的显著差异(P(P)>0.05),当α-变形杆菌属从每个库中进行比较,有显著差异(P(P)= 0.004) (20). 然后,工人们发现α-变形杆菌属序列类似于红杆菌属,副球菌、和水生细菌spp.在α-变形杆菌属血统。然而,当我们删除α-变形杆菌属并在TreeClimer中使用邻接树,我们得到了一个P(P)值0.043,表示排除α-变形杆菌属在系统发育和治疗之间,谱系仍然显示出边缘但显著的共变。作为原件P(P)前面的分析中没有说明值,我们不知道与前面的有多大不同P(P)价值来自我们自己的略微重要的结果。
为了说明从系统发育树中修剪序列组的问题,我们使用了DOTUR(26)将序列分配给操作分类单元(OTU)。将OTU定义为相互之间最多0.30个Jukes-Cantor距离单位的序列集合,我们确定了23个包含1到105个序列的OTU。然后,对于包含10个或更多序列的7个OTU,我们从树中依次修剪每个OTU的序列,并重新计算P(P)值。如前所述(20),如果移除OTU导致高P(P)值,则分析表明,OTU代表的生物在两个群落中具有不同的代表性。当我们使用邻接生成的树重复分析并删除每个OTU时P(P)值均大于0.05。当我们从总体系统发育中删除七个OTU中的每一个时,删除其中六个OTU会导致不到95%的MrBayes生成树具有P(P)值小于0.05;第七个OTU含有α-变形杆菌属序列。虽然α-变形杆菌属在群落结构的总体差异中,38.2%的序列集合被删除,导致检测差异的统计能力降低,这可能掩盖了使用简约检验检测这种影响。
然后我们计算了P(P)仅使用每个修剪OTU中的序列进行比较的值。修剪每个OTU后,对MrBayes生成的树的分析显示,七个OTU中有六个表现出随机变化(每个OTU的95%的树具有P(P)值大于0.05)。删除包含12个序列的第七个OTU(N个改进=5,N个未改进的=7)与γ-蛋白杆菌有关军团菌sp.序列导致P(P)值(95%具有P(P)值小于0.05)。我们无法检测到其他因选择压力而表现出来的OTU,可能是因为在10到105个序列的比较中缺乏统计能力。或者,我们可能已经找到了一个OTU,其代表性是选择压力的结果,因为我们进行了足够数量的比较,偶然发现了差异。最终,使用域级PCR引物的研究评估的是域级差异,而不是特定谱系的差异。测试特定谱系的假设需要为特定群体设计PCR引物,然后测试比较(34).
社区成员或结构?
简约测试比较了不同群体之间血统的差异,这一通用语句意味着该测试衡量的是社区成员身份,而不是结构(20). 在一些分析中,治疗中相同的序列从群落系统发育中删除(25)因此,类型的丰富性是无法衡量的。简约检验中检验的假设是对群落结构差异的度量,它考虑了序列的组成和分布。如果一个血统是正选择的对象,那么在不进行正选择的治疗中,它会比同一血统更加丰富。衡量选择压力对社区的影响需要了解每个社区中每个血统的相对丰度。
我们重新评估了Schadt等人的两两比较(25),他们在分析之前从每个治疗中删除了所有重复序列。当我们使用TreeClimer(即ANOVA风格设计)对所有三个处理进行比较时,所有MrBayes生成的树都有一个P(P)当我们包括或排除相同序列时,该值小于0.001。与TreeClimber生产的产品进行夏季-冬季和夏季-春季的配对比较P(P)具有和不具有冗余序列的所有MrBayes树的值均小于0.001。当我们使用TreeClimer进行有冗余序列和无冗余序列的冬春季成对比较时,95%的MrBayes生成的树P(P)值分别小于0.004和0.129。使用Jaccard和Sorenson相似指数的非参数估计(4)我们发现,当OTU中的序列由一组最多相差4%的序列定义时,OTU的相似性值显著小于1.0。这些结果表明,社区的成员身份并不相似,这突出表明,节俭测试比较的是社区结构,而不是成员身份。
结论。
分子微生物生态学已经超越了编目序列的范畴,发展到阐明生态机制,这需要回答一个普遍的问题:“两个群落不同吗?”微生物群落的复杂性使得没有专门的工具就不可能解决这个问题。过去几年引入的许多统计工具都是从宏观生态学种群遗传学中改进而来的。尽管在宏观生态学中已经开发了许多工具,但在将工具应用于微生物群落时,准确定义假设至关重要。例如,最初对简约测试的描述将其描述为对典型的混血儿的测试,这种现象在细菌中没有发现。
简约性测试是一个强大的工具,用于衡量迫使社区结构改变的机制。我们的分析假设了一个单尾假设检验,该检验将确定两个社区之间的差异是由于随机变异引起的,还是来自一个社区的世系通过负选择压力或正选择压力变得更具优势。这一假设受到数据集的影响,数据集表明微生物群落通常并不完全相同。双尾测试可能适用于环境为特定社区结构进行选择的其他环境。
简约测试并不是统计微生物生态学研究的灵丹妙药。实验设计和概率分布的离散性限制了可以执行的分析类型和分析的统计能力。尽管LIBSHUFF类型的分析受到对每次成对比较执行两个测试的要求的限制,但它们的优点是能够确定一个社区结构是否是另一个社区的子集。其他方法,如分子方差分析(8,20),可用于确定两个或多个群落之间的总体遗传变异是否大于群落内的多样性。需要进一步开展工作,以开发对时间序列分析、多元方差分析和重复样本有用的额外测试。这些进展可能为“两个社区不同吗?”这个问题提供了其他答案