摘要

物种形成不是瞬间的,而是需要时间的。长期出生-死亡多样化模型结合了这一事实,并预测了经常观察到的世系积累向现在的放缓。长期物种形成模型的数学复杂性阻碍了对其参数的估计,直到最近,一种在该模型下计算系统发育分支时间可能性的方法才被提出(Lambert等人。2014). 在这里,我们实现了这一方法,并利用现有物种的模拟系统发育来研究我们如何估计模型参数(物种形成起始率、早期物种和良好物种灭绝率以及物种形成完成率)以及物种形成持续时间,这是上述参数的组合。我们通过将其应用于灵长类系统发育来说明我们的方法。模拟结果表明,系统发育通常不包含足够的信息来提供物种形成率和灭绝率的无偏估计,但物种形成的持续时间可以无偏估计。灵长类分支物种形成持续时间的估计与文献估计一致。我们的结论是,系统发育与长期物种形成模型相结合为估计物种形成持续时间提供了一种有希望的方法。

物种形成需要时间。详细的物种形成模型和化石数据都支持这一点(Avise1999; 加夫里莱斯2004; 诺里斯和赫尔2012). 只有在多倍体物种形成的情况下,物种形成才能在一个世代发生(McCarthy等人。1995)但这仅占植物所有物种形成事件的15-31%(Wood等人。2009). 不管物种形成的潜在机制如何,问一个新物种形成需要多长时间,以及是什么因素影响这一持续时间,都是很有趣的。玛丽·居里物种形成网络将这个问题确定为关键的开放性问题之一(2012). 在这里,我们关注问题的第一部分:我们如何量化物种形成的持续时间?

答案也许可以通过研究化石数据找到,但除了少数例外情况(例如,Ezard et al。2011),限制了这种方法。即使有很多化石数据,基于这些数据的估计也会有偏差,因为寿命短的年轻物种往往无法被识别(诺里斯和赫尔2012). 分子系统发育提供了一条可能对这个问题有所启发的替代路线。自从Avise及其同事(Avise和Walker1998; Avise等人。1998)在过去十年中几乎没有取得进展,直到最近,艾蒂安和罗森德尔(2012)根据Purvis等人(2009)和Rosindell等人(2010)物种形成是一个渐进而漫长的过程。早期物种不断形成,经过物种形成过程,并在完成这一过程后成为好物种。好的和早期的物种都可以产生新的早期物种。因此,一个物种由所有谱系组成的复合体组成,这些谱系不会被物种形成事件所分离。该模型预测了目前经常观察到的谱系积累减缓(艾蒂安和罗森德尔2012,另见Purvis等人。2009)因为目前正在形成过程中的早期物种尚未被确定为优良物种。因此,长期物种形成模型也可以被视为物种识别的模型,即观察者区分不同物种的能力(Purvis等人。2009)但很明显,物种识别的概率在很大程度上取决于物种形成过程的进展,也就是说,积累足够数量的差异或(生殖)不亲和性以吸引分类学关注(Purvis等人。2009; 艾蒂安和罗森德尔2012). 物种是否被认为是好的关键取决于一个人的物种概念。我们故意不挑出任何特定的物种概念,因为长期物种形成模型在概念上独立于物种概念;只有对物种形成完成率的解释会因物种划分方法的不同而不同。

长期物种形成模型为给定模型参数集(Etienne和Rosindell)的完整物种形成事件的持续时间提供了预测2012). 艾蒂安和罗森德尔(2012)为长期物种形成模型开发了一种似然方法,在没有灭绝的情况下,从现存物种的系统发育中估计模型参数,并将模型性能与其他模型进行比较。Lambert等人(2014)开发了一个新的数学框架,允许在物种灭绝不为零的情况下,在给定系统发育的情况下计算延长模型的可能性。该方法基于合并点过程表示(Popovic2004; 兰伯特2010; 兰伯特和斯塔德勒2013). 在这里,我们在一个R包中实现了这个方法,这个包被称为“延年益寿”(PBD)。此外,我们还介绍了物种形成持续时间的各种特性,这些特性也包含在PBD中。我们利用模拟数据研究了模型参数(物种形成开始速度、早期物种和良好物种灭绝速度、物种形成完成速度)以及物种形成的预期持续时间的估计程度。我们发现,虽然模型参数无法可靠估计,但物种形成的持续时间可以可靠估计,这是这些模型参数的函数。我们用Fabre等人的灵长类系统发育来说明我们的方法(2009). 根据文献(Curnoe et al。2006),为长期物种形成模型的实用性提供了进一步的支持。

方法

型号

在这里,我们概述了长期物种形成模型,如图所示1A.长期物种形成模型假设存在物种形成初期物种的物种形成事件。这些早期物种可能会成为好物种,当它们最终变得好时,物种形成就完成了。初生物种和优良物种都会灭绝,它们都能产生初生物种。因此,一个物种由一个好的(或代表性的,见下文)物种及其所有现存的早期后代(或亲属)组成:物种形成事件将不同的物种分开,但这些事件没有记录在系统发育中,因为正是物种形成事件标志着分化的时间。

长期物种形成模型。(A) 转换的示意图概述。初期物种和良好物种以速率b产生初期物种。每个阶段都有自己的灭绝率μi,早期物种的灭绝率λ很好。(B) 根据Lambert等人(2014年),对识别优良物种的问题和我们所做的一阶校正进行了说明。实线表示良种,虚线表示初生种,圆圈表示物种形成事件,箭头表示亲本种,小写字母表示不同分类群。分类单元a是一个很好但已经灭绝的物种,它产生了分类单元b,而分类单元b反过来又产生了在第一组中经历物种形成完成的分类单元c,而在第二组中,分类单元b经历了物种形成完成。从生物学角度来看,两个面板中都有两个好的(代表性)物种:在面板I中,分类单元b代表物种a,分类单元c是不同的物种,而在面板II中,分类子c代表物种a并且分类单元b是不同的种。Lambert等人(2014)的方法是一种近似方法,因为它在第一组中识别出两个良好的现存物种,但在第二组中只识别出一个良好的现有物种,因为分类单元c不被视为代表物种a,而是代表物种b的一个新物种。
图1。

长期物种形成模型。(A) 过渡的示意图概述。早期物种和良好物种以一定速度产生早期物种b条每个阶段都有自己的灭绝率μ初生种以λ的速率变好。(B) 根据Lambert等人(2014). 实线表示良种,虚线表示初生种,圆圈表示物种形成事件,箭头表示亲本种,小写字母表示不同分类群。分类单元a是一个很好但已经灭绝的物种,它产生了分类单元b,而分类单元b反过来又产生了在第一组中经历物种形成完成的分类单元c,而在第二组中,分类单元b经历了物种形成完成。从生物学角度来看,两个面板中都有两个好的(代表性)物种:在面板I中,分类单元b代表物种a,分类单元c是不同的物种,而在面板II中,分类子c代表物种a并且分类单元b是不同的种。Lambert等人的方法(2014)是一个近似值,因为它在第一组中识别出两个良好的现存物种,而在第二组中只识别出一个良好的现有物种,因为分类单元c不被视为代表物种a,而是代表物种b的初始物种。

这里我们将重点讨论模型的时间齐次马尔可夫版本,即速率参数与时间无关,这意味着所有等待时间都呈指数分布,但我们注意到,可以很容易地考虑参数的时间依赖性(参见Lambert等人。2014). 我们使用以下符号:by我们表示物种的阶段,其中=1对于初期和=2为了好的舞台;b条是物种形成的速率,即物种处于阶段的速率产生早期物种;μ是处于阶段的物种灭绝率λ是物种形成完成率,也就是初始物种变得良好的速率。为了便于分析(见下文),我们必须假设所有物种形成速率相等:b条1=b条2=b条这一假设意味着所有拓扑的可能性都与恒速生灭模型相同(Lambert等人。2014); 如果放松这个假设,我们可以得到比恒速生灭模型中更平衡或更不平衡的树(艾蒂安和罗森德尔2012). 为了保持参数的数量可控,我们还假设早期物种和良好物种以相同的速度灭绝。μ1=μ2=μ(但这不是技术上的必要性)。我们注意到Etienne和Rosindell引入的长期物种形成模型(2012)因此涵盖了Dynesius和Jansson确定的物种形成率的三个主要控制因素(2014)(1)分裂控制,即物种形成速率;(2) 持续性控制,即早期物种的灭绝率;(3) 持续时间控制,即物种形成完成率。

有一个生物学上复杂的因素:一个以良好但已灭绝的物种为祖先的早期物种应该被视为该祖先的代表,因此也是一个良好的物种(见Etienne和Rosindell2012; Lambert等人。2014)但是,只有在物种经历了从早期物种向优良物种的转变时,才允许它们表现良好,这就忽略了这一点。Lambert等人(2014)对此进行了一级修正:它区分了早期物种和代表物种;后者要么是真正的好物种,要么是一个好(但已灭绝)物种的第一个后代(在所有现存后代的某些自然顺序中)。如果物种形成的速率不太大,我们希望这个修正是一个很好的近似值。从这里开始,我们将使用Lambert等人的这个模型(2014)并称这些具有代表性的物种为好物种。我们指的是艾蒂安和罗森德尔(2012)和Lambert等人(2014)有关持久物种形成模型的更多详细信息。

可能性

Lambert等人(2014)导出分支时间的可能性x个=(x个1,...x个n个1)-其中x个n个1=T型,一个系统发育的王冠年龄n个现存的和缺失的物种(都是好物种或已灭绝好物种的代表)-取决于王冠年龄的物种形成事件和两个王冠谱系的存活。假设缺失物种来自n个-采样(Etienne等人。2012; 兰伯特和斯塔德勒2013; Lambert等人。2014)与ρ抽样(二项式抽样)不同,似然由Lambert等人的方程给出(7):
(1)
这里我们使用了惯例,x个n个=x个n个1=T型; 阶乘(n个1)!可以在计算系统发育(定向树)的可能性而不是分支时间时删除,并替换为2n个1n个!计算标记树的可能性时(Stadler2013). 功能(f)=d日d日t吨可以通过求解四个常微分方程组,即Lambert等人的方程(10)、(11)、(25)、(26)及其最后一个未编号的方程(第页). 这些方程式读起来,去掉了兰伯特等人的上标以简化符号,
(2a)
 
(2b)
 
(2c)
 
(2天)
具有
(3)

在这里,第页1是一个物种在某个时间处于初始阶段的概率t吨(以现在之前的My来衡量)目前没有现存后代的好的下降物种(t吨=0).q个j表示物种处于阶段的概率j时间t吨目前没有现存的后代,也就是说,血统已经灭绝;q个2因此是一个物种在某一时刻处于良好状态的概率t吨目前没有现存的后代。方程(2c)(2天)类似于BiSSE模型中的方程(7a)和(7b)(Maddison等人。2007); 事实上,所有这些方程都描述了灭绝概率的动力学,这取决于谱系的状态。然而,它们之间的差别很大,因为(1)在BiSSE中,状态之间的转换是双向发生的,而在延长模型中,没有从好物种到初始物种的转换,以及(2)在BiSSE中,物种形成时,子物种继承父物种的状态,而在延拓模型中,好物种产生初始物种。

为了获得可能性,我们必须对这组方程进行数值积分,并在分支时间评估其解x个此似然可用于通过似然优化估计参数。我们提供了R包PBD来计算和最大化可能性。该软件包还允许物种形成启动、物种形成完成和物种灭绝的时间相关速率。

最大似然鲁棒性(ML)

为了评估ML方法在生成正确参数值方面的稳健性(尤其是偏差),我们在持久物种形成模型下模拟了1000棵系统发育树的各种参数集(b条=0.5,λ=0.1,0.3,1,μ1=μ2=μ=0,0.1,0.2),以及5、10或15My的固定冠龄,条件是已实现的树木保留初始根(即两个原始冠谱系的存活)。我们使用函数pbd_sim_cpp来执行这些模拟。此函数使用聚合过程有效模拟分支时间(参见Lambert等人。2014). 然后,我们使用ML估计参数。对于每一组估计参数,我们评估了物种形成的平均或预期持续时间τ(此处简称物种形成持续时间),其定义为早期物种变得良好或后代变得良好所需的时间。Etienne和Rosindell给出了预期物种形成持续时间的表达式(2012):
(4)
哪里
(5)

物种形成的持续时间不同于物种形成完成的时间,因为如果物种灭绝为零,则物种形成完成时间是指等待单个早期谱系完成物种形成过程的时间,而物种形成完成所需的时间则是指早期物种或其后代之一完成物种形成所需要的时间,条件是物种形成完成,也就是说,这是任何物种完全成功物种形成所花费的时间。

为了评估在将标准出生-死亡模型拟合到系统发育中时引入的潜在偏差,忽略长期物种形成的影响,我们还将标准的、未经处理的出生-死亡模式拟合到模拟数据中。

经验示例

为了说明我们的方法,我们将其应用于一个满足两个条件的分支:(1)有一个合理大小和抽样的系统发育,(2)从文献中已知物种形成持续时间的一些独立估计。由于这方面的文献很少,第二个条件是最严格的。符合这一条件的一项研究是Curnoe等人的一篇相对较新且深入的论文(2006)灵长类物种形成的持续时间。灵长类动物也满足第一个条件,因为Fabre等人(2009)提供灵长类的进化史,包括273个提示和103个缺失物种。我们使用的数据保存在Dryad中(datadryad.org/resource/doi:10.5061/Dryad.8492,特别是da-tadryad.org/bitstream/handle/10255/Dryad.8494/PRIMATES-C-hronogram_273_taxa.tre?sequence=1)。为了检查robus-tness,我们将结果与Springer等人提供的四个时间树进行了比较(2012),可用作支持信息,文本S2,Newick timetrees 1-4(doi:10.1371/journal.pone.0049521.s008)。这些时间树不同于所使用的放松时钟模型(具有硬边界或软边界约束的自相关或独立进化速率)。

我们使用n个-上述抽样可能性方法,并计算了物种形成的持续时间。在这里,我们不仅计算了预期的持续时间,还计算了全概率密度。可以使用与Etienne和Rosindell相同的考虑因素计算该密度(2012),并产生:
(6)
哪里
(7)
此概率密度在以下条件下达到最大值
(8)

密度、模式和任何分位数或力矩(包括平均值)可以通过CRAN和Dryad上提供的程序包PBD(datadryad.org/resource/doi:10.5061/Dryad.js88n)以及模拟数据和R代码进行计算。

利用估计的参数值,我们进行了1000次模拟,以获得物种形成平均持续时间估计误差的自举估计。它还提供了一种通过比较模拟的沿袭时间图和观察到的曲线来评估模型的良好性的方法。

结果和讨论

在我们使用已知参数值对系统发育的长期物种形成模型进行的测试中,我们发现对于小树冠年龄的模拟,ML优化通常不会收敛,这表明似然曲面非常平坦,因此数据中的信息非常有限。事实上,分支的大小通常很小,不到10个物种,通常只有两个,这是模拟产生的最小值,因为它们取决于皇冠谱系的生存。由于要估计三个参数,所以小分支的自由度太少,无法进行可靠的参数估计。因此,我们将进一步分析限制在15 My的树冠年龄,以获得所有考虑的参数组合的合理尺寸枝。我们发现,物种形成起始率和灭绝率的参数估计值往往是有偏差的,并且变化很大,特别是对于低物种形成完成率和高灭绝率(图。2A和B)。然而,对初始多样化率(物种形成起始率减去灭绝率)、物种形成完成率,特别是物种形成持续时间的估计值偏差很小,变化相对较小(图。2C–E),因此这似乎是一种估计物种形成过程时间特征的有希望的新方法。虽然分支大小对个体参数(即灭绝)的估计有很大影响,但它对物种形成持续时间的估计质量几乎没有影响(图S1)。

估计参数的分布。(A) 物种启动率,(B)灭绝率,(C)初始多样化率(物种启动率减去灭绝率),(D)物种完成率,(E)完成物种形成过程的物种的物种形成持续时间(由物种形成起始率、物种形成完成率和物种灭绝率组成,等式4)。分布表示各种模拟参数集的1000个复制模拟的估计值(红色条)、平均值(最短、蓝色、箭头)、中间值(中等、绿色、箭头)和真实模拟值(最长、黑色、箭头):物种形成初始率为0.5(所有面板),消光率μ取0、0.1和0.2(行),物种形成完成率λ取0.1、0.3和1(列)。模拟树的树冠年龄均为15 My。直方图中的最后一条包含所有模拟,其值等于或大于x轴上的相应值。
图2。

估计参数的分布。(A) 物种启动率,(B)灭绝率,(C)初始多样化率(物种启动率减去灭绝率),(D)物种完成率,(E)完成物种形成过程的物种的物种形成持续时间(由物种形成起始率、物种形成完成率和物种灭绝率组成,等式4)。分布表示各种模拟参数集的1000个复制模拟的估计值(红色条)、平均值(最短、蓝色、箭头)、中间值(中等、绿色、箭头)和真实模拟值(最长、黑色、箭头):物种形成初始率为0.5(所有面板),消光率μ取0、0.1和0.2(行),物种形成完成率λ取0.1、0.3和1(列)。模拟树的树冠年龄均为15 My。直方图中的最后一条包含所有模拟,其值等于或大于x个-轴。

当将标准的、未经处理的出生-死亡模型拟合到模拟数据时,我们发现估计的物种形成率大大低估了物种形成启动率,并且随着物种形成完成率的增加而增加(图S2A)。后者是预期的行为,因为物种数量减少。然而,在长期模型中,我们观察到估计的物种形成率与控制物种形成的参数之间没有明确的关系。因此,在物种形成旷日持久的情况下,拟合标准的出生-死亡模型可能会产生很大的误导。

当我们将我们的方法应用于Fabre等人的灵长类分支时(2009),我们发现物种形成率和灭绝率在b条–μ-平面,而形态完成率与其他参数正交(图。A) ●●●●。这让人想起了恒速出生-死亡模型的众所周知的特性,即可以可靠地估计净多样化率,但物种形成率和灭绝率的比率却无法(Paradis2004; 拉博斯基2010; Aldous等人。2011; Etienne等人。2012; Stadler公司2013)这在我们的模拟中得到了证实。根据最大似然估计值计算,物种形成的预期持续时间约为0.61 My,而中位数为0.45 My。自举值介于0.02和1.12 My之间,平均值和中位数为0.61 My(与最大似然估算值非常接近,表明没有偏差),标准偏差为0.14 My(图。B) ,可用于估计物种形成预计持续时间内的误差。允许好物种或早期物种不同的灭绝速度,会大大改变模型参数(早期物种的灭绝速度高于好物种),但不会改变物种形成的持续时间。对于Springer等人的四个时间树(2012),我们得到了物种形成的预期持续时间为0.66(具有硬边界约束的自相关速率)、0.65(具有软边界限制的自相关率)、0.51(具有硬约束的独立速率)和0.43(具有软约束的独立率)。

延长物种形成模型在灵长类分支中的应用。(A) 灵长类分支的似然最优对数似然曲面的投影;第三个参数始终保持在其最大似然(ML)值。所有低于−1000的log-likelihood值均为深蓝色(黑白版上为黑色)。(B) ML参数估计值下物种形成持续时间的概率密度分布。这提供了对整个分支变化的洞察力:尽管模式预测大多数物种形成事件将是短暂的,但在较长的持续时间内存在大量的分布尾部。(C) ML参数估计的物种形成持续时间的自举分布。这为物种形成预期持续时间的偏差和不确定性提供了洞察力:最长(黑色)箭头表示最大似然估计的预期持续时间(另见面板A),而中(绿色)和最短(蓝色)箭头分别表示引导值的中位数和平均值。
图3。

延长物种形成模型在灵长类分支中的应用。(A) 灵长类分支的似然最优对数似然曲面的投影;第三个参数始终保持在其最大似然(ML)值。所有低于−1000的log-likelihood值均为深蓝色(黑白版上为黑色)。(B) ML参数估计值下物种形成持续时间的概率密度分布。这提供了对整个分支变化的洞察力:尽管模式预测大多数物种形成事件将是短暂的,但在较长的持续时间内存在大量的分布尾部。(C) ML参数估计的物种形成持续时间的自举分布。这为物种形成预期持续时间的偏差和不确定性提供了洞察力:最长(黑色)箭头表示最大似然估计的预期持续时间(另见面板A),而中(绿色)和最短(蓝色)箭头分别表示引导值的中位数和平均值。

我们的估计与Curnoe等人的估计一致(2006)世卫组织根据姊妹物种分化时间和类群间分化时间的差异,建议物种形成的最长持续时间约为100万年。Curnoe等人(2006)他们认为,这与完全生殖隔离所需的时间不同,在他们看来,完全生殖隔离的时间可能要长得多(高达4 My)。对于我们的分析,严格遵守这种生物物种概念意味着系统发育中的许多提示仍应被视为早期物种。我们会得到一棵分枝时间更长的小树,从而导致物种形成的持续时间更长。因此,物种形成持续时间的估计总是与所使用的分类学直接相关:根据我们的物种概念,树中的物种被认为是完成物种形成过程的好物种。

物种形成完成率和物种形成持续时间的倒数值可能非常不同,因为后者也受到物种形成起始率和灭绝率的影响,如方程所示(4)显示。我们可能期望非常高的值b条λ值很低:物种形成非常频繁,只是偶尔完成物种形成过程。这个想法已经由Mayr提出(1963)和斯坦利(1978)他称这些不成功的物种为“流产物种”,因为它们确实过早地灭绝了。Rosenblum等人(2012)为这个想法提出了一个模型,即短暂物种形成模型,这是持久物种形成模型的一个特例,其中物种形成起始率很高,但物种形成完成率很低。Phillimore等人最近提供了支持(2007)他发现亚种率远高于物种形成率,来自莱文(2012)在他对开花植物中杂种不育性出现的时间过长的讨论中。

基于谱系的长期物种形成模型已在现象学上引入(艾蒂安和罗森德尔2012),但在Bateson-Dobzhansky-Muller物种形成模型家族中最简单的零模型(Gavrilets2004第131页)。这个零模型始于一个双oci、双等位基因单倍体群体,单倍型ab固定,其中假设等位基因a和B不相容。它通过从a到a的第一个等位基因的(不可逆)突变产生初始物种。这种具有单倍型Ab的初始物种被认为在空间上与母物种隔离(无迁移)。当第二个等位基因从b突变(不可逆)到b时,物种形成完成,形成单倍型AB群体。子种和父种不相容,因为其中一个携带a等位基因,另一个携带b等位基因。考虑到两个而非一个种群的分化(即不仅子物种发生突变)、迁移、局部适应和突变的可逆性,以及Gavrilets中所有两个oci双等位基因模型,这种突变和漂移的零模型有许多可能的扩展(2004)物种形成只需要一个不兼容性就可以完成,物种形成完成时间呈指数分布。这是上述持久物种形成模型中包含的关键特征。

还有BDM模型的多维版本,其中需要一定数量的不兼容性才能完成物种形成(Orr1995; 加夫里莱斯2004; Wang等人。2013). 在这种情况下,物种形成完成时间不再呈指数分布。艾蒂安和罗森德尔(2012)提出可以用具有多个初始阶段的长期物种形成模型来模拟这种模型。物种形成完成时间的概率密度是指数分布的卷积。例如,在过渡速率都相同的特殊情况下,物种形成完成时间具有Gamma分布。Lambert等人(2014)为该模型提供了一个似然公式(过渡率允许不同),因此我们的方法似乎可以很容易地扩展到BDM模型的更现实版本,通过在系统发育树上比较这些模型的性能,我们可以推断杂交不亲和性是如何随着时间的推移而建立的。然而,在这种情况下,物种形成持续时间的计算不仅变得有问题,因为Etienne和Rosindell的数学机制(2012)用于推导物种形成持续时间表达式的方法不再适用,模型本身需要重新考虑。例如,想象一下,在一个具有三个初始阶段的模型中,我们有一个处于第三初始阶段的初始物种。它产生了一个新的早期物种(按速率b条). 那么这个新的初生物种有什么初生阶段呢?就其亲本早期物种而言,它处于第1阶段,但就祖代物种而言,也处于第3阶段,因为它与祖代物种的不亲和性与亲本相同(甚至更多,取决于我们如何看待其与亲本的差异)。由于这些考虑因素,我们认为需要对不相容性的建立进行更详细的分析,以推断最有可能采用的BDM模型(参见Wang等人。2013对于有希望的方向)。在BDM框架之外,事情变得更加棘手(参见Chevin等人。2014).

尽管我们因此告诫不要过度解释和扩展基于血统的长期物种形成模式,并欢迎限制较少的新的长期物种生成模式,具有单一初始阶段的长期物种形成模型仍然是一个连贯的模型,可以作为宏观进化的适当零模型,解释物种形成需要时间的事实。每一个模型都是对现实的简化,建模的艺术在于融入关键元素。我们认为,与恒速出生-死亡模型相比,结合物种形成需要时间这一事实是一个关键因素,这导致了一个新的视角和一个重大改进,而结合一个更现实的物种形成等待时间分布显然是下一步。

长期物种形成模型中的物种形成完成率与更常见的种群获得生殖隔离的速率有关。拉博斯基和马图特(2013)发现从系统发育学中估计的宏观进化物种形成率与鸟类和果蝇属乍一看,这似乎与长期物种形成模型的基本预测相矛盾,即物种形成完成的时间越长,物种多样性越低(因为早期物种可能在物种形成完成之前灭绝),因此物种形成的总体速度越小。为了进一步探讨这个悖论,我们使用恒定出生-死亡模型(如拉博斯基和马图特)估计物种形成率2013did)和从80个鸟类分支的系统发育分支时间得出的延时物种形成模型的物种形成完成率(没有完整的系统发育可用果蝇属). 我们观察到,对于较低的物种形成完成率,两种速率之间的相关性实际上很弱(图S3)。在我们的模拟中,我们还发现估算的物种形成率只有轻微的变化,物种形成完成率有一个数量级的变化(图S2)。因此,这与拉博斯基和马图特的观点一致(2013)物种形成率和生殖隔离之间明显脱钩的发现。通过认识到如果物种形成的时间相当长,那么使用恒定出生-死亡模型估计的物种形成率是毫无意义的,因此,关于这些速率解耦的结论还为时过早,可以解决这个悖论。

长期物种形成模型可以解释世系积累随着时间的推移而减缓的现象,但它并不是唯一能做到这一点的模型(参见Morlon的评论2014Moen和Morlon2014). 时间依赖性(Nee等人。1992,1994; Morlon等人。2011; 斯塔德勒2011)和多样性依赖(瓦伦丁1973; Nee等人。1992; 拉博斯基和洛维特2008; Phillimore和Price2008; 拉博斯基2009; Etienne等人。2012)物种形成率和灭绝率有相似的影响(莫恩和莫龙2014). 长期物种形成模型的可能性的可用性现在允许在当前可用的丰富系统发育上明确比较模型性能。尽管这种元分析很有趣,但我们认为其结论仅限于物种形成的时间依赖性、多样性依赖性或持久性的精确数学公式。例如,已经提出了几种多样性依赖性的数学公式,例如物种形成率线性下降或指数下降,或灭绝率增加。类似地,在依赖时间的物种形成和灭绝中,函数的选择是无止境的,我们对BDM模型的讨论建议了许多替代的长期物种形成模型。我们预计,单是系统发育分支时间将无法包含足够的信息来挑选出任何一种模型:可能性将非常相似,或者可以通过选择不同的时间函数或多样性,或者选择不同的等待时间分布来进行物种形成。我们将此期望建立在Purvis等人的结果之上(2009)世卫组织仅在一个国家找到了对多元化依赖的决定性支持(林莺)在14个鸟类分支中,我们对Phillimore和Price的45个鸟类分支进行了初步研究(2008). 因此,在这些替代模型之间进行选择应该涉及其他类型的数据。由于依赖多样性的模型预测的历史多样性不同于时间依赖性或长期物种形成,因此化石数据对模型选择至关重要。系统发育的拓扑特征也可能提供信息:漫长的物种形成,不同的物种形成率(好的和早期的物种以不同的速度产生新的早期物种),自然允许不平衡的系统发育(艾蒂安和罗森德尔2012)然而,如果没有谱系间的速率异质性,时间依赖性和多样性依赖性就无法做到这一点(参见艾蒂安和海格曼2012对于多样性依赖模型的特定扩展,该模型确实产生了不平衡的系统发育,而没有速率异质性)。还有更多的哲学观点认为,应该选择一种模式而不是另一种模式。时间依赖性似乎是一种特殊的解释,因为它需要外部作用力,但在存在这种外部作用力的情况下,它成为最明显的解释。多样性依赖依赖于这样一种假设,即生态限制仅在今天阻碍了多样性,而不是在过去(但见Etienne和Haegeman2012为了解决这一悖论),而在长期的物种形成模型下,在没有额外假设的情况下,谱系积累在目前附近的减缓是自然发生的。这个特性有利于持久的物种形成模型,即使它的一个特定实现在数量上优于另一个模型。

我们使用一致树估计灵长类物种形成的持续时间。目前,系统发育树通常使用标准的、非计划的出生-死亡模型,甚至是简单的Yule模型作为物种树的优先模型来构建。理想情况下,在系统发育重建软件包(如BEAST(Drummond和Rambaut2007)贝叶斯先生(Huelsenbeck和Ronquist2001; 伦奎斯特和韦尔森贝克2003)或RevBayes(Höhna等人。2013),当从序列比对重建系统发育时,可以直接从这些参数的贝叶斯后验分布中获取延长的物种形成参数值。然而,这种实现并不是微不足道的,因为考虑到物种形成是长期的,不仅会影响物种树的先验,而且还会影响每个物种有多个样本时基因树的概率分布。

我们看到了应用本文中开发的方法检测沿环境梯度物种形成持续时间变化的富有成效的未来。例如,它可以研究物种形成的持续时间如何随纬度或跨生物地理领域而变化,以及它如何依赖物种的特征,例如体型。我们希望本文能激发这些研究领域,加深我们对宏观进化的理解。

致谢

我们感谢B.Haegeman的讨论和提供初始模拟代码,感谢A.Pigot准备鸟类数据集,感谢四位评论员和编辑提供的有用意见。RSE感谢荷兰科学研究组织(NWO)通过VIDI拨款提供的财政支持。HM感谢CNRS和法国国家研究机构的支持(授予ECOEVOBIO-CHEX2011)。AL由ANR通过赠款MANEGE“Modèles ALéatoires en Ecoloie,Génétique et Evolution”(09-BLAN-0215)提供财政支持。AL还感谢法国科勒日跨学科生物学研究中心的资助。

数据存档

我们数据的doi是10.5061/dryad.js88n。

引用的文献

奥尔德斯
,
D.J.博士。
,
文学硕士。
克里坤
、和
L。
波波维奇
.
2011
.
生命树的五个统计问题
.
系统。生物。
 
60
:
318
328
.

阿维斯
,
J.C.公司。
 
1999
.
系统地理学:物种的历史和形成
.
哈佛大学出版社,马萨诸塞州剑桥
.

阿维斯
,
J。
、和
D。
散步的人
.
1998
.
更新世系统地理学对鸟类种群的影响及其物种形成过程
.
程序。R.Soc.伦敦。B类
 
265
:
457
463
.

阿维斯
,
J。
,
D。
散步的人
、和
G.公司。
约翰
.
1998
.
脊椎动物的形态持续时间和更新世影响
.
程序。R.Soc.伦敦。B类
 
265
:
1707
1712
.

切文
,
长-中。
,
G.公司。
德科尔藏
、和
T。
勒诺尔芒
.
2014
.
生态位维度与生态物种形成的遗传学
.
进化
.出版中.doi:10.1111/evo.12346。

科诺
,
D。
,
答:。
索恩
、和
J。
涂层
.
2006
.
灵长类物种形成的时间和节奏
.
J.进化。生物。
 
19
:
59
65
.

德拉蒙德
,
答:。
、和
答:。
兰伯特
.
2007
.
BEAST:基于采样树的贝叶斯进化分析
.
BMC演变。生物。
 
7
:
214
.

戴尼修斯
,
M。
、和
R。
杨松
.
2014
.
种内谱系的持续性:被忽视的物种形成率控制
.
进化
 
68
:
923
934
.

艾蒂安
,
钢筋混凝土。
、和
B。
海格曼
.
2012
.
自适应辐射的概念和统计框架对多样性依赖起着关键作用
.
美国国家。
 
180
:
E75型
第89页
.

艾蒂安
,
钢筋混凝土。
,
B。
海格曼
,
T。
斯塔德勒
,
T。
阿泽
,
邮政编码:。
皮尔逊
,
答:。
普维斯
、和
答:B。
费利莫尔
.
2012
.
多样性依赖使分子系统发育更接近化石记录
.
程序。R.Soc.伦敦。B类
 
279
:
1300
1309
.

艾蒂安
,
钢筋混凝土。
、和
J。
罗森德尔
.
2012
.
延续过去抵消了现在的吸引力:长期物种形成可以解释观察到的多样化放缓
.
系统。生物。
 
61
:
204
213
.

埃扎德
,
T·H·G。
,
T。
阿泽
,
邮政编码:。
皮尔逊
、和
答:。
普维斯
.
2011
.
气候变化和物种生态之间的相互作用推动了宏观进化动力学
.
科学类
 
332
:
349
351
.

法布雷
,
P.-H.公司。
,
答:。
罗德里格斯岛
、和
E.公司。
斗牛士
.
2009
.
从线粒体和细胞核DNA的超基质推断灵长类动物的宏观进化模式
.
分子系统发育。进化。
 
53
:
808
825
.

加夫里莱斯
,
美国。
 
2004
.
健身景观与物种起源
.
普林斯顿大学出版社
,
新泽西州普林斯顿
.

霍纳
,
美国。
,
T.A.公司。
希思
,
B。
布索
,
医学博士。
兰迪斯
,
F、。
龙奎斯特
、和
J.P.公司。
韦尔森贝克
.
2013
.
系统发育学中的概率图形模型表示
.
ArXiv预印本
arXiv:1312.2386[q-bio.PE]。

韦尔森贝克
,
J.P.公司。
、和
F、。
龙奎斯特
.
2001
.
贝叶斯先生:系统发育的贝叶斯推断
.
生物信息学
 
17
:
754
755
.

兰伯特
,
答:。
 
2010
.
分裂树的轮廓是一个Lévy过程
.
Ann.Prob(年检)。
 
38
:
348
395
.

兰伯特
,
答:。
,
H。
莫龙
、和
钢筋混凝土。
艾蒂安
.
2014
.
基于谱系的持久物种形成模型中的重建树
.
数学杂志。生物。
 出版中.doi:10.1007/s00285-014-0767-x。

兰伯特
,
答:。
、和
T。
斯塔德勒
.
2013
.
出生-死亡模型和合并点过程:重建系统发育的形状和概率
.
西奥。大众。生物。
 
90
:
113
128
.

莱文
,
D.A.博士。
 
2012
.
开花植物杂种不育的漫长等待
.
新植物醇。
 
196
:
666
670
.

麦迪逊
,
水压力。
,
体育。
米德福德
、和
标准普尔。
奥托
.
2007
.
估计二进制字符对物种形成和灭绝的影响
.
系统。生物。
 
56
:
701
710
.

迈尔
,
E.公司。
 
1963
.
动物物种和进化
.
哈佛大学出版社
,
马萨诸塞州剑桥
.

麦卡锡
,
电子显微镜。
,
文学硕士。
阿斯穆森
、和
西-西。
安德森
.
1995
.
重组物种形成的理论评估
.
遗传
 
74
:
502
509
.

莫恩
,
D。
、和
H。
莫伦牌手表
.
2014
.
为什么多元化放缓?
 
经济趋势。进化。
 出版中.doi:10.1016/j.tree.2014.01.010。

莫龙
,
H。
 
2014
.
研究多样化的系统发育方法
.
经济。莱特。
 
17
:
508
525
.

莫龙
,
H。
,
T。
帕森斯
、和
H。
普洛金
.
2011
.
分子系统发育与化石记录的协调
.
程序。国家。阿卡德。科学。美国
 
108
:
16327
16332
.

奈伊
,
美国。
,
A.Ø。
摩尔人
、和
P.H.公司。
哈维
.
1992
.
分子系统学揭示的进化速度和模式
.
程序。国家。阿卡德。科学。美国
 
89
:
8322
8326
.

奈伊
,
美国。
,
风险管理。
五月
、和
P.H.公司。
哈维
.
1994
.
重建的进化过程
.
菲洛斯。事务处理。R.Soc.伦敦。B类
 
344
:
305
311
.

诺里斯
,
钢筋混凝土。
、和
下午。
船体
.
2012
.
海洋物种形成的时间维度
.
进化。经济。
 
26
:
393
415
.

奥尔
,
H。
 
1995
.
物种形成的群体遗传学:杂交不亲和性的进化
.
遗传学
 
139
:
1085
1813
.

天堂
,
E.公司。
 
2004
.
没有化石就可以估计灭绝率吗?
 
J.西奥。生物。
 
229
:
19
30
.

费利莫尔
,
答:B。
,
C.D.L.公司。
奥姆
,
R.G.公司。
戴维斯
,
J·D·。
哈德菲尔德
,
W·J。
里德
,
K·J。
加斯顿
,
钢筋混凝土。
雀斑
、和
I.P.F.公司。
欧文斯
.
2007
.
鸟类最近表型差异的生物地理学基础:亚种丰富度的全球研究
.
进化
 
61
:
942
957
.

费利莫尔
,
答:B。
、和
T.D.公司。
价格
.
2008
.
鸟类密度依赖性枝状体发生
.
《公共科学图书馆·生物》。
 
6
:
0483
0489
.

波波维奇
,
L。
 
2004
.
临界分支过程的渐近谱系
.
附录申请。普罗巴伯。
 
14
:
2120
2148
.

普维斯
,
答:。
,
C.D.L.公司。
奥姆
,
新罕布什尔州。
图米
、和
邮政编码:。
皮尔逊
.
2009
多样化率的时间模式。第十五章。第页。
278
300
 在里面 
R。
布特林
,
D。
Schluter公司
、和
J。
新娘
,编辑。
多样性的形态和模式
.
英国剑桥大学出版社
.

拉博斯基
,
D.L.公司。
 
2009
.
生态极限和多样化率:解释分支和区域之间物种丰富度变化的替代范式
.
经济。莱特。
 
12
:
735
743
.

拉博斯基
,
D.L.公司。
.
2010
.
灭绝率不应根据分子系统发育来估计
.
进化
 
64
:
1816
1824
.

拉博斯基
,
D.L.公司。
、和
国际期刊。
洛维特
.
2008
.
北美林莺密度依赖性多样性
.
程序。R.Soc.伦敦。B类
 
275
:
2363
2371
.

拉博斯基
,
D。
、和
D。
马图特
.
2013
.
果蝇和鸟类的宏观进化物种形成率与固有生殖隔离进化脱钩
.
程序。国家。阿卡德。科学。美国
 
110
:
15354
15359
.

龙奎斯特
,
F、。
、和
J。
韦尔森贝克
.
2003
.
MrBayes 3:混合模型下的Bayes系统发育推断
.
生物信息学
 
19
:
1572
1574
.

罗森布拉姆
,
欧洲银行。
,
B.A.J.博士。
萨维尔
,
J·W·。
棕色
,
S.D.公司。
罗什
,
K.M.公司。
哈德威克
,
T.D.公司。
海瑟
,
J·M·。
伊士曼
,
米宽。
彭奈尔
、和
洛杉矶。
哈蒙
.
2012
.
金发姑娘与圣罗莎莉亚相遇:一个短暂的物种形成模型解释了不同时间尺度的多样性模式
.
进化。生物。
 
39
:
255
261
.

罗森德尔
,
J。
,
S.J.公司。
康奈尔大学
,
标准普尔。
哈贝尔
、和
钢筋混凝土。
艾蒂安
.
2010
.
长期物种形成重振生物多样性中性理论
.
经济。莱特。
 
13
:
716
727
.

施普林格
,
M。
,
R。
梅雷迪斯
,
J。
盖茨
,
C。
Emering公司
,
J。
公园
,
D。
拉博斯基
,
T。
斯塔德勒
,
C。
施泰纳
,
O。
莱德牌手表
,
J。
雅克内卡
等。
2012
.
从物种超矩阵推断灵长类多样性的宏观进化动力学和历史生物地理学
.
公共科学图书馆一号
 
7
:
e49521号
.

斯塔德勒
,
T。
 
2011
.
哺乳动物系统发育揭示了最近的多样化率变化
.
程序。国家。阿卡德。科学。美国
 
108
:
6187
6192
.

Stadler公司
,
T。
.
2013
.
我们如何提高宏观进化率估计的准确性?
 
系统。生物。
 
62
:
321
329
.

赤柱
,
S.M.公司。
 
1978
.
时生植物长寿、属的起源和进化的标点模型
.
古生物学
 
4
:
26
40
.

玛丽·居里物种形成网络
.
2012
.
关于物种形成,我们需要了解什么?
 
经济趋势。进化。
 
27
:
27
39
.

情人
,
J·W·。
 
1973
.
海洋生物圈演化古生态学
.
Prentice-Hall公司
,
新泽西州鹰木悬崖
.

,
R。
,
C。
Ane公司
、和
B。
Payseur公司
.
2013
.
杂交不亲和性在系统发育中的进化
.
进化
 
67
:
2905
2922
.

木材
,
T.E.公司。
,
N。
建林
,
医学硕士。
巴克
,
一、。
梅罗斯
,
邮政信箱。
格林斯平
、和
L.H.公司。
里塞贝格
.
2009
.
维管植物多倍体物种形成的频率
.
程序。国家。阿卡德。科学。美国
 
106
:
13875
13879
.

副主编:L.Harmon

这是一篇根据知识共享署名许可条款发布的开放存取文章(https://creativecommons.org/licenses/by-nc/4.0/)它允许在任何介质中不受限制地使用、分发和复制原始作品,前提是正确引用了原始作品。指定作者的精神权利已得到维护。