新世界猴子分析数据集

保罗·巴斯蒂德

2024-01-31

数据集

数据集取自Aristide等人(2016)1,并嵌入到包裹。我们可以很容易地加载和绘制它。

图书馆(系统发生学EM)
数据(猴子)

情节(参数_BM(第页= 2),
     数据=猴子$日期,门(phylo)=猴子$物理,
     显示.tip.label= 真的,cex公司= 0.5,无保证金= 真的)

这个情节函数继承了大多数可选大众的论点plot函数(此处用于实例,可选参数显示.tip.label使用)。用户可以设置许多其他图形参数,以便控制函数的输出,请参阅手册页以了解更多详细信息。这个右边是两个特征(PC),每个特征都有自己的等级。在分析之前在树上绘制数据,这样我们就可以发现潜在错误或异常值。

推断

默认情况下,推理是在自动计算的网格上进行的10个alpha值。为了减少计算量,我们要求定制只有4个值的网格,但此数字应在实数上提升应用程序。此处考虑的最大移位次数为10,并且应根据树的大小进行调整。

物件<- PhyloEM公司(门(phylo)=猴子$物理,
               Y_数据=猴子$日期,
               过程= “scOU”,##标量OU模型
               随机.root= 真的,##根部静止
               平稳.root= 真的,
               nbrα= 4,##测试的α值数量(应提高)
               K_最大值= 10,##最大班次数
               平行_α= 真的,##这可以设置为TRUE
               N核= 2)##并行计算
物件
## |                                                                            |                                                                      |   0%|                                                                            |======                                                                |   9%|                                                                            |=============                                                         |  18%|                                                                            |===================                                                   |  27%|                                                                            |=========================                                             |  36%|                                                                            |================================                                      |  45%|                                                                            |======================================                                |  55%|                                                                            |=============================================                         |  64%|                                                                            |===================================================                   |  73%|                                                                            |=========================================================             |  82%|                                                                            |================================================================      |  91%|                                                                            |======================================================================| 100%|                                                                            |                                                                      |   0%|                                                                            |======                                                                |   9%|                                                                            |=============                                                         |  18%|                                                                            |===================                                                   |  27%|                                                                            |=========================                                             |  36%|                                                                            |================================                                      |  45%|                                                                            |======================================                                |  55%|                                                                            |=============================================                         |  64%|                                                                            |===================================================                   |  73%|                                                                            |=========================================================             |  82%|                                                                            |================================================================      |  91%|                                                                            |======================================================================| 100%|                                                                            |                                                                      |   0%|                                                                            |======                                                                |   9%|                                                                            |=============                                                         |  18%|                                                                            |===================                                                   |  27%|                                                                            |=========================                                             |  36%|                                                                            |================================                                      |  45%|                                                                            |======================================                                |  55%|                                                                            |=============================================                         |  64%|                                                                            |===================================================                   |  73%|                                                                            |=========================================================             |  82%|                                                                            |================================================================      |  91%|                                                                            |======================================================================| 100%|                                                                            |                                                                      |   0%|                                                                            |======                                                                |   9%|                                                                            |=============                                                         |  18%|                                                                            |===================                                                   |  27%|                                                                            |=========================                                             |  36%|                                                                            |================================                                      |  45%|                                                                            |======================================                                |  55%|                                                                            |=============================================                         |  64%|                                                                            |===================================================                   |  73%|                                                                            |=========================================================             |  82%|                                                                            |================================================================      |  91%|                                                                            |======================================================================| 100%
##PhyloEM算法的结果。##默认方法选择的参数:##具有随机平稳根的二维scOU过程。## ##根本期望:##第1页第2页##  0.01552091 -0.01483439 ## ##根方差:##PC1和PC2##PC1 3.630764e-04-9.029145e-05号##PC2-9.029145e-05 1.228925e-04## ##过程差异:##PC1和PC2##PC1 1.475308e-04-3.668861e-05号##PC2-3.668861e-05 4.993556e-05号## ##工艺选择强度:##第1页第2页##PC1 0.2031677 0.0000000##PC2 0.0000000 0.2031677## ##处理根最优值:##PC1和PC2##  0.01552091 -0.01483439 ## ##转移分支上的位置:4、63、46##移位值:##               4           63         46##PC1-0.01812684-0.093914264 0.08031859##PC2 0.05234025-0.008148889 0.02527294## ## ## ##请参阅帮助以查看所有绘图和处理功能。

结果存储在类的对象中PhyloEM公司,它有几个可用的提取器(参见手册)。plot函数显示了默认模型选择方法选择的解决方案,但如果需要,可以选择另一个。相同的可选参数可以如前所述,用于控制图形的外观。

情节(资源)

功能plot_标准显示默认值每个班次的型号选择标准。

plot_标准(资源)

这里,选择的解决方案有三个班次。如上所示然而,标准在其最小值附近有点平坦,值有点奇怪四班制。这个异常值实际上只是由于上的小网格阿尔法在这个玩具示例中进行了详细分析。收件人尝试并优化这个结果,一个解决方案是使用更精细的alpha网格值。当使用具有100个值的网格时,K=5的解决方案实际选择了班次。我们可以在这里进行绘图比较。

情节(资源,参数= 参数_过程(资源,K(K)= 5))

等效解决方案

绘制5班制解决方案时,弹出以下警告向上:

##params_process中出现警告。PhyloEM(res,K=5):有几个等价项##此换档位置的解决方案。

实际上,具有5个移位的解决方案具有三个等效移位对分支机构的分配。可以找到并绘制这些解决方案多亏了这个功能当量_位移.

情节(当量_位移(猴子$物理,参数_进程(资源,K(K)= 5)),
     显示移位值= 错误的,shifts_cex(班次_取消)= 0.5)

在这里,这三种解决方案非常相似,只是与出现在底部两个姊妹枝上的两个移位树。请注意,所有这些解决方案都有5个班次,并且定义相同将提示分为6组。这些配置都具有相同的可能性,因此无法从数据中区分。

旋转不变性

理论上,该方法不应受到数据集(见Adams&Collyer,20182查看此问题)。然而,由于一些数字问题,可能结果略有不同。我们可以在此基础上探索这种行为数据集。

#任意旋转
θ<-圆周率/4
腐烂<- 矩阵(c(c)(余弦(θ),-(θ),(θ),余弦(θ)),
              nrow公司= 2,ncol公司= 2)

#旋转数据
Yrot公司<- t吨(腐烂)%*%猴子$日期
行名称(伊洛特)<- 行名称(猴子$日期)

#基于旋转数据的PhyloEM
res_root(_R)<- PhyloEM公司(门(phylo)=猴子$物理,
                   Y_数据=伊洛,##旋转数据
                   过程= “scOU”,
                   随机.root= 真的,
                   平稳.root= 真的,
                   nbrα= 4,
                   K_最大值= 10,
                   平行字母= 真的,
                   N核= 2)
## |                                                                            |                                                                      |   0%|                                                                            |======                                                                |   9%|                                                                            |=============                                                         |  18%|                                                                            |===================                                                   |  27%|                                                                            |=========================                                             |  36%|                                                                            |================================                                      |  45%|                                                                            |======================================                                |  55%|                                                                            |=============================================                         |  64%|                                                                            |===================================================                   |  73%|                                                                            |=========================================================             |  82%|                                                                            |================================================================      |  91%|                                                                            |======================================================================| 100%|                                                                            |                                                                      |   0%|                                                                            |======                                                                |   9%|                                                                            |=============                                                         |  18%|                                                                            |===================                                                   |  27%|                                                                            |=========================                                             |  36%|                                                                            |================================                                      |  45%|                                                                            |======================================                                |  55%|                                                                            |=============================================                         |  64%|                                                                            |===================================================                   |  73%|                                                                            |=========================================================             |  82%|                                                                            |================================================================      |  91%|                                                                            |======================================================================| 100%|                                                                            |                                                                      |   0%|                                                                            |======                                                                |   9%|                                                                            |=============                                                         |  18%|                                                                            |===================                                                   |  27%|                                                                            |=========================                                             |  36%|                                                                            |================================                                      |  45%|                                                                            |======================================                                |  55%|                                                                            |=============================================                         |  64%|                                                                            |===================================================                   |  73%|                                                                            |=========================================================             |  82%|                                                                            |================================================================      |  91%|                                                                            |======================================================================| 100%|                                                                            |                                                                      |   0%|                                                                            |======                                                                |   9%|                                                                            |=============                                                         |  18%|                                                                            |===================                                                   |  27%|                                                                            |=========================                                             |  36%|                                                                            |================================                                      |  45%|                                                                            |======================================                                |  55%|                                                                            |=============================================                         |  64%|                                                                            |===================================================                   |  73%|                                                                            |=========================================================             |  82%|                                                                            |================================================================      |  91%|                                                                            |======================================================================| 100%
情节(res_root)

乍一看,解决方案看起来非常不同。确实,当应用于旋转数据集,PhyloEM公司为选择解决方案是7班制,而不是3班制。但是,如果我们考虑解决方案例如,获得3个班次,则它们是相同的:

情节(资源,参数= 参数_进程(资源,K(K)= ),无保证金= 真的)
情节(res_root,参数= 参数_进程(res,K(K)= ),无保证金= 真的)

仔细看一下结果,我们可以看到日志除少数地方外,可能性实际上非常相似:

plot_标准(资源,“对数可能性”)
plot_标准(res_root,“日志可能性”,多氯联苯= "+",添加= 真的)

实际情况是,由于数字原因,可能性是在某些情况下,对一个或其他数据集进行了稍微更好的优化。这对所使用的基于处罚的标准产生了影响可能性。我们可以从图中看出:

绘图文字(资源)
plot_标准(res_root,多氯联苯= "+",添加= 真的)

但是,由于这两个数据集应该是等价的,我们不需要在两次跑步中选择。对于每个班次,我们的唯一目标是找到最大似然解。因此,对于每个转变,我们可以采取两种解决方案中最好的一种,那就是这是最好的。这可以通过专用功能完成:

重新合并(_M)<- 合并旋转(_R)(res,res_root)

此函数将第一次拟合作为参考(此处,使用原始数据)。对于给定的班次数,当第二个配合具有可能性越大,则选择其解。请注意第二次拟合的参数用旋转空间表示,因此,选中后,需要将它们转换回原始空间(由函数自动完成)。最终解决方案每个K值的可能性最大,且模型选择标准可以应用于这个新的求解路径。

绘图文字(重新合并)

我们可以在这里看到,现在选择了具有3个班次的解决方案再一次。

此合并功能可以应用于两个以上的配合,如如下图所示。

#另一个旋转
θ<-圆周率/
旋转2<- 矩阵(c(c)(余弦(θ),-(θ),(θ),余弦(θ)),
              nrow公司= 2,美国国家石油公司= 2)

#旋转数据
Yrot2型<- t吨(旋转2)%*%猴子$日期
行名称(Yrot2)<- 行名称(猴子$日期)

#基于旋转数据的PhyloEM
资源_区域2<- PhyloEM公司(门(phylo)=猴子$物理,
                   Y_数据=Yrot2、,
                   过程= “scOU”,
                   随机.root= 真的,
                   平稳.root= 真的,
                   nbrα= 2,##请注意,这也可能不同
                   K_最大值= 10,
                   平行_α= 真的,
                   N核= 2)

#合并
资源合并2<- 合并旋转(_R)(res、res_rot、res_root2)
## |                                                                            |                                                                      |   0%|                                                                            |======                                                                |   9%|                                                                            |=============                                                         |  18%|                                                                            |===================                                                   |  27%|                                                                            |=========================                                             |  36%|                                                                            |================================                                      |  45%|                                                                            |======================================                                |  55%|                                                                            |=============================================                         |  64%|                                                                            |===================================================                   |  73%|                                                                            |=========================================================             |  82%|                                                                            |================================================================      |  91%|                                                                            |======================================================================| 100%|                                                                            |                                                                      |   0%|                                                                            |======                                                                |   9%|                                                                            |=============                                                         |  18%|                                                                            |===================                                                   |  27%|                                                                            |=========================                                             |  36%|                                                                            |================================                                      |  45%|                                                                            |======================================                                |  55%|                                                                            |=============================================                         |  64%|                                                                            |===================================================                   |  73%|                                                                            |=========================================================             |  82%|                                                                            |================================================================      |  91%|                                                                            |======================================================================| 100%

在这里,这不会改变结果。

plot_标准(res_merge2)

蜥蜴数据集

在之前的数据集上,引入旋转可能会出现人工钻头。然而,对于一些高度相关的数据集,例如可能需要旋转。例如,当研究Anolis蜥蜴时数据集(Mahler等人,2013),几个需要在原始数据集上使用伪有序化技术要获得K的所有值的良好最大似然解,请参见Bastide等人(2018)4有关此分析的更多详细信息。

EB模型

可以证明,早期突发模型(EB)在形式上是等价的从超度量树到α为负的非移位scOU值。通过允许函数中的“负alpha”值PhyloEM公司.

请注意,尽管没有移位的情况有明确的解释(EB模型),具有移位和负alpha的scOU可能很难解释,并不总是合适的。因此应该小心在使用和解释这种模型时首次分析时不鼓励使用功能。

资源(_N)<- PhyloEM公司(门=猴子$物理,
                   Y_数据=猴子$日期,
                   过程= “scOU”,
                   随机.root= 错误的,##根需要修复
                   K_最大值= 10,
                   平行_α= 真的,
                   N核= 2,
                   nbrα= 4,##2个阴性,2个阳性(应该更多)
                   允许负值= 真的)##允许网格中出现负alpha
## |                                                                            |                                                                      |   0%|                                                                            |======                                                                |   9%|                                                                            |=============                                                         |  18%|                                                                            |===================                                                   |  27%|                                                                            |=========================                                             |  36%|                                                                            |================================                                      |  45%|                                                                            |======================================                                |  55%|                                                                            |=============================================                         |  64%|                                                                            |===================================================                   |  73%|                                                                            |=========================================================             |  82%|                                                                            |================================================================      |  91%|                                                                            |======================================================================| 100%|                                                                            |                                                                      |   0%|                                                                            |======                                                                |   9%|                                                                            |=============                                                         |  18%|                                                                            |===================                                                   |  27%|                                                                            |=========================                                             |  36%|                                                                            |================================                                      |  45%|                                                                            |======================================                                |  55%|                                                                            |=============================================                         |  64%|                                                                            |===================================================                   |  73%|                                                                            |=========================================================             |  82%|                                                                            |================================================================      |  91%|                                                                            |======================================================================| 100%|                                                                            |                                                                      |   0%|                                                                            |======                                                                |   9%|                                                                            |=============                                                         |  18%|                                                                            |===================                                                   |  27%|                                                                            |=========================                                             |  36%|                                                                            |================================                                      |  45%|                                                                            |======================================                                |  55%|                                                                            |=============================================                         |  64%|                                                                            |===================================================                   |  73%|                                                                            |=========================================================             |  82%|                                                                            |================================================================      |  91%|                                                                            |======================================================================| 100%|                                                                            |                                                                      |   0%|                                                                            |======                                                                |   9%|                                                                            |=============                                                         |  18%|                                                                            |===================                                                   |  27%|                                                                            |=========================                                             |  36%|                                                                            |================================                                      |  45%|                                                                            |======================================                                |  55%|                                                                            |=============================================                         |  64%|                                                                            |===================================================                   |  73%|                                                                            |=========================================================             |  82%|                                                                            |================================================================      |  91%|                                                                            |======================================================================| 100%|                                                                            |                                                                      |   0%|                                                                            |======                                                                |   9%|                                                                            |=============                                                         |  18%|                                                                            |===================                                                   |  27%|                                                                            |=========================                                             |  36%|                                                                            |================================                                      |  45%|                                                                            |======================================                                |  55%|                                                                            |=============================================                         |  64%|                                                                            |===================================================                   |  73%|                                                                            |=========================================================             |  82%|                                                                            |================================================================      |  91%|                                                                            |======================================================================| 100%

我们可以提取拟合的参数,而无需偏移,即等同于EB模型:

参数_进程(资源名称,K(K)= 0)
##params_process中出现警告。PhyloEM(res_neg,K=0):“选择强度”是##消极。人们应该只看移位的非正常值。待办事项##因此,请使用“rBM=TRUE”调用此函数。
##检查选择强度警告(过程…):所有特征值##选择强度并没有严格意义上的正实部。这可能会导致##一些问题。请谨慎操作。
## ##具有固定根的二维scOU过程。## ## ##根值:##PC1和PC2##  0.006507194 -0.003532184 ## ##工艺差异:##PC1和PC2##PC1 5.367696e-05-5.648422e-06号##PC2-5.648422e-06 1.273209e-05## ##工艺选择强度:##PC1和PC2##PC1-0.01316466 0.00000000##PC2 0.00000000-0.01316466## ##处理根最优值:##PC1和PC2##  0.006507194 -0.003532184 ## ##这个过程没有变化。

“选择力量”\(\字母\)与利率挂钩\(r)EB的通过关系:\(r=2\α\).

我们还可以绘制模型选择的标准。经验上,我们发现“BGHmlraw”标准在这方面表现得更好配置。

plot_标准(资源名称,“BGHmlraw”)

这里,有7个位移(和一个正阿尔法)的相同解决方案是挑选出来的。再次,为了将计算量降到最低,我们使用了只有4个alpha值的粗网格。在更精细的网格上选择了5班制的解决方案。


  1. Aristide,L.,dos Reis,S.F.,Machado,A.C.,利马,I。,Lopes,R.T.和Perez,S.I.(2016年)。大脑形状收敛于新世界猴子的适应性辐射。国家议事录科学院,113(8),2158–2163。↩︎

  2. Adams,D.C.和Collyer,M.L.(2018年)。多变量系统发育比较方法:评估、比较和建议。系统生物学,67(1),14-31。↩︎

  3. Mahler,D.L.、Ingram,T.、Revell,L.J.和Losos,J.B.(2013)。宏观进化景观上的异常收敛岛屿蜥蜴辐射。《科学》,341(6143),292-295。↩︎

  4. Bastide,P.、Ané,C.、Robin,S.和Mariadassou,M。(2018). 多元相关性状的自适应移位推断。系统生物学,67(4),662-680。↩︎