SDM之间细微而明显的差异和营养SDM

营养与经典SDM的比较:差异与平等

这里,我们介绍了经典SDM和我们的营养SDM,从这两种方法的最简单情况开始与不符合的更现实的情况相吻合。

最简单的情况

让我们考虑一个有一个环境协变量的非常简单的例子\(x \),和两种\(y_A\)\(y_B\).我们假设物种\(y_A\)成为基础和物种\(y_B\)以吃为生\(y_A\)这将导致以下指示非循环图,恢复变量之间的依赖关系,假设自下而上的控制。

图书馆(图表)
G公司=图表_数据列表(作为矩阵(数据帧(来自= c(c)(“x”,“x”,“A”),
                                           至=  c(c)(“A”,“B”,“B”))))
情节(G)
块图的绘制
块图的绘制

我们现在假设物种分布的数据是连续的可观察的实体(如基底面积、生物量),我们可以用线性回归。我们的名字\(y_{iA}\)\(y_{iB}\)对…的观察物种\(y_A\)\(y_B\)在现场\(i),我们假设环境对这两个物种都有二次效应。因此,使用经典SDM,模型方程为:
\[\开始{对齐}y_{iA}&=\β^{SDM}_{0A}+\测试版^{SDM}_{1A}x i+\β^{SDM}_{2A}x i^2+\epsilon_{iA}、\\\\epsilon_{iA}\sim N(0,\西格玛_A^{SDM})\\y_{iB}&=\β^{SDM}_{0B}+\测试版^{SDM}_{1B}x i+\β^{SDM}_{2B}x i^2+\epsilon_{iB},\\epsilon_2{iB{sim N(0,\西格玛_B^{SDM})\结束{对齐}\]

相反,我们的营养模型包括对\(y_B\)在它的猎物上\(y_A\):
\[\开始{对齐}y_{iA}&=\β^{tSDM}_{0A}+\测试版^{tSDM}_{1A}x i+\β^{tSDM}_{2A}x i^2+\epsilon_{iA},\\epsilon_2{iA{sim N(0,\西格玛_A^{tSDM})\\y_{iB}&=\β^{tSDM}_{0B}+\测试版^{tSDM}_{1B}x i+\β^{tSDM}_{2B}x i^2+\alpha y_{iA}+\epsilon_{iB},\\\epsilon_{iB}\sim N(0,\sigma_B^{tSDM})\结束{对齐}\]

接下来,我们将重点关注模型的预期(对应于预测值),特别关注物种\(y_B\)这两个模型是不同。对于SDM:
\[E[y_{iB}|\x_i]=\beta^{SDM}_{0B}+\β^{SDM}_{1B}x_i+\beta^{SDM}_{2B}x i^2 \]对于营养SDM,我们需要以的值为条件\(y_{iA}\)。我们在这里选择条件的预期值\(y_{iA}\),其中对应于使用来自的预测\(y_A\)预测\(y_B\)在线性模型中,使用高斯数据和猎物和捕食者之间的线性相互作用\(E_A[E_B[y_B|\y_A]]=E_B[y_B|\E[y_A]]\)(在其他情况下不一定如此)。
因此,我们有:
\[E[y_{iB}|\x_i,E[y_{iA}]]=\β^{tSDM}_{0B}+\测试版^{tSDM}_{1B}x_i+\beta^{tSDM}_{2B}x_i^2 +\αE[y_{iA}]\]我们可以重写\(y_B\)仅作为环境的功能\(x\)只有。\[\开始{对齐}E[y_{iB}|\x_i,E[y_{iA}]]&=\beta^{tSDM}_{0B}+\β^{tSDM}_{1B}x_i+\beta^{tSDM}_{2B}x i^2+\阿尔法(β^{tSDM}_{0A}+\测试版^{tSDM}_{1A}x_i+\β^{tSDM}_{2A}x i^2 ) \\&=\β^{tSDM}_{0B}+\alpha\beta^{tSDM}_{0A}+(\β^{tSDM}_{1B}+\α\β^{tSDM}_{1A})x_i+(β^{tSDM}_{2B}+\α\β^{tSDM}_{2A})x_i^2\\&=\β^{SDM}_{0B}+\测试版^{SDM}_{1B}x_i+\β^{SDM}_{2B}x i^2\结束{对齐}\]

在这个非常简单的情况下,线性回归模型捕食者和猎物之间的相互作用,估计回归系数如下\[\beta版^{SDM}_{.B}=\测试版^{tSDM}_{.B}+\alpha\β^{tSDM}_{.A}\]因此,模型估计同样实现的生态位,以及来自营养和经典SDM的预测重合。
然而,我们的营养模型允许分离上的环境\(y_B\)(即潜在生态位\(y_B\))从其由于…的影响而产生的间接影响\(y_A\)\(y_B\)换句话说,使用结构方程模型,\(\β^{tSDM}_{1B}\)\(\β^{tSDM}_{2B}\)是直接影响吗环境对物种的影响\(y_B\)(即其潜在利基)、术语\(αβ^{tSDM}_{1A}\)\(αβ^{tSDM}_{2A}\)是间接的环境对物种的影响\(y_B\)这两种效应的总和,\(\β^{tSDM}_{1B}+\alpha\β^{tSDM}_{1A}\)\(\β^{tSDM}_{2B}+\α\β^{tSDM}_{2A}\)对应于上的环境\(y_B\),即实现的利基\(y_B\).在这个非常特殊情况下,SDM可以正确估计总影响(已实现的利基市场),但无法区分上的环境\(y_B\)因此他们没有正确估计潜在的利基。

模拟

下面我们给出一个简短的例子来证实分析这些结果的推导。

首先,我们根据上面给出的有向非循环图。因此,环境具有物种的二次效应\(y_A\)物种\(y_B\),具有线性效果属于\(y_A\)\(y_B\).

设置种子(1712)
#创建环境梯度
X(X)= 序列(0,5,长度.out=100)
#基本物种A的模拟数据
A类= *X(X)+ 2*X(X)^2 + rnorm公司(100,标准偏差= 5)
#捕食者物种B的模拟数据
B类= 2*X(X)-*X(X)^2 + *A类+ rnorm公司(100,标准偏差= 5)

旧款= 标准()
标准(mfrow公司=c(c)(1,))
情节(X、A、,主要= “物种A意识到\n个和潜在利基”)
情节(X、B、,主要= “物种B实现了生态位”)
情节(X,2*X(X)-*X(X)^2,主要= “物种B潜在生态位”)
块simGauss图
块simGauss图

标准(mfrow公司=旧款$mfrow)

我们现在运行经典SDM和营养SDM

#对于物种A,这两个模型是一致的
毫安= 流明(A)~X(X)+ (X)^2))

#对于物种B,这两种模型不同:

##营养模型
m营养= 勒姆(B)~X(X)+ (X)^2)+A)
##经典SDM
m_传感和诊断模块= 勒姆(B)~X(X)+ (X)^2))

我们现在可以测试SDM系数和营养SDM。

#显示系数的相等性
全部相等(系数(m_SDM),系数(m营养)[-4]+ 系数(m营养)[4]*系数(毫安)
#>[1]正确

#预测一致
前SDM=m_SDM(m_SDM)$装配值
前营养的= 预测(m营养,
                       新数据= 数据帧(X(X)=X中,A类=毫安$安装值))

全部相等(pred_SDM,pred_trophic)
#>[1]正确

物种的经典SDM系数\(y_B\)等于环境物种的营养SDM系数\(y_B\)加上环境对物种的影响\(y_B\)(给定生物项与环境系数的乘积物种\(y_A\)). 因此当物种的预测值为\(y_A\)用于预测\(y_B\)然而,与传统的SDM不同,我们的营养模型允许检索正确的潜在生态位物种\(y_B\)

#SDM推断的潜在生态位
情节(X,m_SDM)$拟合值,伊林= c(c)(-65,120),伊拉布= “B”,
     主要= “yB的潜在利基”)

(X,cbind公司(1、X、X^2)%*% 系数(m营养)[-4],科尔=“红色”)
(X,2*X(X)-*X(X)^2,科尔=“蓝色”)
传奇(-0.1,120,图例=c(c)(“SDM推断的潜在利基市场”,
                           “通过营养SDM推断的潜在生态位”,
                           “真正的基础”),多氯联苯=1,
       科尔=c(c)(“黑色”,“红色”,“蓝色”),cex公司= 0.5)
块电位图
块电位图

这一直有效吗?

我们表明,SDM和营养SDM估计了相同的实现生态位,从而在满足以下所有条件时得出相同的预测保持:

然而,只要这些条件中至少有一个不成立,实现的生态位估计值(以及so模型预测值)不同。下面我们将展示一次只释放其中一个约束足以从营养SDM中获得不同的预测,以及比经典SDM更好。因此,上述示例是非常特殊的情况有助于理解模型相似性,但这在应用中很少发生。

猎物和捕食者之间的非线性关系

我们将在下文中发布关于之间的关系\(y_B\)\(y_A\)事实上,我们现在认为该物种\(y_B\)具有二次响应\(y_A\)经典SDM没有改变,因为我们只将物种建模为环境的函数。相反,物种的营养模型\(y_B\)变为:
\[y_{iB}=\β^{tSDM}_{0B}+\β^{tSDM}_{1B}x_i+\beta^{tSDM}_{2B}x i^2+\αy_{iA}^2+\ε_{iB},\\ε__{iB}\sim N(0,\sigma_B^{tSDM})营养型SDM和SDM之间的预测现在有所不同,因为:\[\开始{对齐}E[y_{iB}|\x_i,E[y_{iA}]]&=\beta^{tSDM}_{0B}+\β^{tSDM}_{1B}x_i+\beta^{tSDM}_{2B}x i^2+\阿尔法(\β^{tSDM}_{0A}+\测试版^{tSDM}_{1A}x_i+\β^{tSDM}_{2A}x i^2 )^2\\&=\β^{tSDM}_{0B}+\alpha(\beta^{tSDM}_{0A})^2+(\β^{tSDM}_{1B}+2\α\β^{tSDM}_{0A}\测试版^{tSDM}_{1A})x_i\\&\\\\+(测试版^{tSDM}_{2B}+\α(2β^{tSDM}_{0A}\测试版^{tSDM}_{2A}+(β^{tSDM}_{1A})^2))x_i^2+2αβ^{tSDM}_{1A}\β^{tSDM}_{2A}x_i^3+\α(β^{tSDM}_{2A})^2x_i^4\\&\neq\测试^{SDM}_{0B}+\测试版^{SDM}_{1B}x i+\β^{SDM}_{2B}x i^2\结束{对齐}\]

为了正确推断实现的利基,经典SDM应该可以用4次多项式来指定。只要我们添加多个环境变量和物种之间的联系,经典的SDM应该是用极为复杂的公式指定,这对实数是不可行的应用程序。

模拟

我们提供了一个简单的示例来演示分析模拟计算。我们使用上面的相同示例,但我们现在模拟一个二次关系\(y_B\)关于\(y_A\).

B类= 2*X(X)-*X(X)^2 + *A类^2  + rnorm公司(100,标准偏差= 5)

旧款= 标准()
标准(mfrow公司=c(c)(1,))
情节(X、A、,主要= “物种A意识到\n个和潜在的利基市场”)
情节(X、B、,主要= “物种B实现了生态位”)
情节(X,2*X(X)-*X(X)^2,主要= “物种B潜在生态位”)
块simQuadr的绘图
块simQuadr的绘图
标准(mfrow公司=旧款$mfrow)

#安装营养型SDM
m营养= 勒姆(B)~X(X)+ (X)^2)+ (A)^2))

我们现在比较回归系数和两种型号

#显示系数的相等性
全部相等(系数(m_SDM),系数(m营养)[-4]+ 系数(m营养)[4]*系数(毫安)
#>[1]“平均相对差值:0.185587”

#现在预测有所不同
前SDM=m_SDM(m_SDM)$装配值
前营养的= 预测(m营养,
                       新数据= 数据帧(X(X)=X、,A类=m_A(m_A)$安装值))

全部相等(pred_SDM,pred_trophic)
#>[1]“平均相对差:53.61947”

#比较R2
cor公司(B,pred_SDM)^2
#> [1] 0.8339402
cor公司(B,前营养)^2
#> [1] 0.9605349

两个模型的系数之间的关系随着营养SDM的出现,预测也发生了变化对物种的预测精度远高于经典SDM\(y_B\)(R2为0.83和0.96分别)。

非连续可观察实体(存在-缺失,计数)

现在让我们考虑一下存在-无(即二进制)的情况数据),而不修改其他两个条件。因此,我们使用(广义)线性模型,如logistic回归,我们建模a捕食者和被捕食者之间的线性关系(在联系层面)。因此,对于SDM,我们有:
\[\开始{对齐}p(y_{iA}=1)&=\text{logit}^{-1}(β^{SDM}_{0A}+\β^{SDM}_{1A}x_i+\β^{SDM}_{2A}x i^2) \\p(y_{iB}=1)&=\text{logit}^{-1}(\beta^{SDM}_{0B}+\β^{SDM}_{1B}x_i+\beta^{SDM}_{2B}x i^2)\结束{对齐}\]
相反,我们的营养模型包括对\(y_B\)在它的猎物上\(y_A\):
\[p(y_{iB}=1)=\text{logit}^{-1}(\β^{tSDM}_{0B}+\测试版^{tSDM}_{1B}x_i+\beta^{tSDM}_{2B}x i^2 +\αy_A)\]模型之间的相等性不成立由于logit函数的非线性。的确:\[\开始{对齐}E[y_{iB}|\x_i,E[y_{iA}]]&=p(y_{iB}=1|\x_ i,p(y_{iA}=1)) \\&=\text{logit}^{-1}(β^{tSDM}_{0B}+\测试版^{tSDM}_{1B}x i+\β^{tSDM}_{2B}x i^2+\alpha\text{logit}^{-1}(\beta^{tSDM}_{0A}+\β^{tSDM}_{1A}x_i+\β^{tSDM}_{2A}x i^2))\\&\neq\text{logit}^{-1}(\beta^{SDM}_{0B}+\测试版^{SDM}_{1B}x i+\β^{SDM}_{2B}x i^2)\结束{对齐}\]

仿真

我们现在用一个简单的例子来证实这个分析推导。这个代码与前一个非常相似,但我们现在生成二进制来自logistic模型的数据。

#生成链接层基本物种
V_A型= *X(X)- 2*X(X)^2
#转换为概率
问题A= 1/(1 + 经验(-V_A))
#二进制数据采样
A类= 红细胞瘤(n个= 100,尺寸= 1,问题=问题_A)
#B类相同
V(_B)= -*X(X)+1*X(X)^2 + *A类
问题_B= 1/(1 + 经验(-V_B))
B类= 红细胞瘤(n个= 100,尺寸= 1,问题=prob_B)

旧款= 标准()
标准(mfrow公司=c(c)(1,))
情节(X、prob_A、,主要= “物种A意识到\n个和潜在利基”)
情节(X,prob_B,主要= “物种B实现了生态位”)
情节(X,1/(1+经验(-(-*X(X)+1*X(X)^2))),主要= “物种B潜在生态位”)
块simlogi图
块simlogi图

标准(mfrow公司=旧款$mfrow)

然后,我们拟合一个经典SDM和一个营养SDM

#对于物种A,这两个模型是一致的
毫安= glm公司(A)~X(X)+ (X)^2),家庭= 二项式(链接= “逻辑”))

#对于物种B,这两种模型不同:
m_SDM(m_SDM)= glm公司(B)~X(X)+ (X)^2),家庭= 二项式(链接= “逻辑”))
m营养= glm公司(B)~X(X)+ (X)^2)+A、,家庭= 二项式(链接= “逻辑”))

我们现在测试模型系数与模型预测的一致性仍然成立

#系数的相等不再成立
全部相等(系数(m_SDM),系数(m营养)[-4]+ 系数(m营养)[4]*系数(毫安)
#>[1]“平均相对差:2.305022”

#预测不再一致
前SDM=m_SDM(m_SDM)$装配值
前营养的= 预测(m营养,
                       新数据= 数据帧(X(X)=X、,A类=毫安$安装值))

全部相等(pred_SDM,pred_trophic)
#>[1]“平均相对差:2.915665”

#营养SDM改善了预测

##SDM的B类AUC
肢解::评价(第页=预处理数据管理[哪一个(B)==1)],
                一个=前SDM[哪一个(B)==0)] )@auc公司
#> [1] 0.8408333

##营养SDM的B种AUC
肢解::评价(第页=前营养的[哪一个(B)==1)],
                一个=前营养的[哪一个(B)==0)] )@auc公司
#> [1] 0.8529167

两个模型的系数之间的关系随着营养SDM的出现,预测也发生了变化略微改善了经典SDM(物种AUC\(y_B\)从0.84降至0.85)。

非线性统计模型

我们最后展示了使用非线性统计模型如何导致经典SDM和营养SDM之间的不同预测一个随机森林的例子。因为我们无法提供任何分析对于随机森林的推导,我们只提供了一个示例。数据包括与第一个示例中完全相同的模拟(连续可观测实体)。

#基本物种A的模拟数据
A类= *X(X)+ 2*X(X)^2 + rnorm公司(100,标准偏差= 5)
#捕食者物种B的模拟数据
B类= 2*X(X)-*X(X)^2 + *A类+ rnorm公司(100,标准偏差= 5)

旧款= 标准()
标准(mfrow公司=c(c)(1,))
情节(X,主要= “物种A意识到\n个和潜在利基”)
情节(X、B、,主要的= “物种B实现了生态位”)
情节(X,2*X(X)-*X(X)^2,主要= “物种B潜在生态位”)
区块simRF图
区块simRF图

标准(mfrow公司=旧款$mfrow)

我们用随机森林推断统计模型

图书馆(randomForest)
#>随机森林4.7-1.1
#>键入rfNews()查看新功能/更改/错误修复。

#物种A
毫安= 随机森林(A)~X(X)+ (X)^2))

#B类营养性SDM
m营养= 随机森林(B)~X(X)+ (X)^2)+A)
#B类经典SDM
m_SDM(m_SDM)<- 随机森林(B)~X(X)+ (X)^2))

我们现在比较两个模型的预测。

#现在预测有所不同
前SDM=m_SDM(m_SDM)$预测
前营养的= 预测(m营养,
                       新数据= 数据帧(X(X)=X中,A类=毫安$预测))

全部相等(pred_SDM,pred_trophic)
#>[1]“平均相对差:0.08021014”

#比较R2
cor公司(B,pred_SDM)^2
#> [1] 0.8075415
cor公司(B,前营养)^2
#> [1] 0.8670482

模型的预测是不同的,营养SDM具有R2大于经典SDM(0.86比0.80)。