模型定义
与probit模型相同,logit模型可以是通过潜在变量定义:\(Z_{ij}=\alpha_i+X_i\beta_j+W_i\lambda_j+\ε{ij}\)对于\(i=1,\ldots,i)et(等)\(j=1,\ldot,j),使用\(\epsilon_{ij}\sim\mathrm{logistique}(0,1)\) iid公司例如:\[y{ij}=\开始{cases}1&\text{if}Z_{ij}>0\\0&\text{else}\结束{cases}\]然而,在这种情况下先验的潜在变量和参数的分布不是共轭的,我们不能使用共轭的性质因此,使用潜在变量建模是不相关的。
在这种情况下,假设\[y_{ij}\|\θ{ij}\sim\mathcal{B} 诺米亚的(n_i,θ{ij}),使用\(\mathrm{probit(\theta{ij})}=\alpha_i+X_i\beta_j+W_i\lambda_j)和\(n_i\)现场访问次数\(i).
因此,该模型的参数将通过估计进行采样他们的条件后部使用自适应分布大都市算法。
使用的优先级
安先验的为的每个参数确定分布模型:
\[\开始{数组}{lll}V_{\alpha}&\sim&\mathcal{IG}(\text{shape}=0.5,\text{rate}=0.005)\text{with}\mathrm{rate{=\frac{1}{\mathrm{scale}},\\\beta{jk}&\sim&\begin{cases}\mathcal{N}(\mu_{\beta_{jk}},V_{\beta_{k}})\text{表示}j=1,\ldots,j\如果物种特征数据为提供}\\\文本{where}\mu{\beta{jk}}=\sum{r=0}^{nt}t{jr}。\伽玛{rk}\文本{和}\gamma{rk}\sim\数学{N}(\mu_{\gamma_{rk}},V_{\gamma_{ker}})&\\\文本{表示}r=0、\ldots、nt\text{和}k=0、\ ldots,p.&\\\mathcal{N}(\mu_{\beta_{k}},V_{\beta_{k}})\text{表示}j=1,\ldots,j\text{和}k=0,\ldot,p,&\text{如果物种特征数据不是提供}\\\结束{cases}\\\lambda{jl}&\sim&\begin{cases}\数学{N}(\mu_{\lambda_{l}},V_{\lambda_}})&\text{if}l<j\\\mathcal{N}(\mu_{\lambda_{l}},V_{\lambda_}})\text{左截断}0&\text{if}l=j\\P\text{例如}\mathbb{P}(\lambda_{jl}=0)=1&\text{if}l> j个\结束{cases}\\\quad&\quad&\text{for}j=1,\ldots,j\text{and}l=1,\ldot,q。\结束{数组}\]
使用自适应Metropolis算法的Gibbs采样器
使用自适应Metropolis算法对模型进行采样根据其条件的参数后部估计在一个乘法常数内的分布。
首先,我们定义\(f)功能其将模型的可能性计算为估计参数:
\[f:\lambda_j,\beta_j,\alpha_i,W_i,X_i,y_{ij},n_i\右箭头f(\lambda_j,\beta_j,\ alpha_i,W_i,X_i,y_{ij},n_i)=\mathrm{L}(\theta_{ij})\]-计算\(\mathrm{logit}(\theta_{ij})=\alpha_i+X_i\beta_j+W_i\lambda_j\).
我们重复这些步骤\(i=1,\ldots,i)et(等)\(j=1,\ldot,j),然后我们定义\(θ=\左(θ{ij}\右){i=1,\ldots一} ^{j=1,\ldots,j}).
这使我们能够计算模型的可能性:\(\mathrm{L}(\theta)=\prod\limits_{\substack{1\leqi\leqI\\1\leqj\leqI}}\mathrm{L}(theta_{ij}).
根据贝叶斯公式,我们有\[\mathrm{p}(\theta\|\Y)\propto\Pi(\ttheta)\矩阵{L}(θ)因此,我们使用以下关系来接近条件后部每个参数\(\Pi(.)\)这个与其对应的密度先验的法律。\[\开始{对齐}&p(\beta{jk}\\beta{j0}、\beta{j1}、\ ldots、\beta{jk-1},\ beta{jk+1}、\t、\ beta,\lambda_j,\alpha_1,\ldot,\alfa_I,W_1,\ ldot,W_I,Y)\propto\Pi(\beta_{jk})\prod\limits_{1\leqi\leqI}\mathrm{L}(\theta_{ij})\\&p(\lambda_{jl}\|\\lambda_{j1},\ldots,\lambda_{jl-1},\lambda_{jl+1},\ldots,\lambda_{jq},\beta_j、\alpha_1、\ldots、\alfa_I、W_1、\ ldots,W_I、Y)\propto\Pi(\lambda_{jl})\prod\limits_{1\leqi\leq一} \mathrm{L}(\theta_{ij})\\&p(W_{il}\|\W_{i1},\ldot,W_{il-1},\λ_J,Y)\propto\Pi(W_{il})\prod\limits_{1\leq J\leqJ} \mathrm{L}(\theta_{ij})\\&p(\alpha_i\|\W_i,\beta_1,\ldots,\beta _J,\lambda_1,\ ldots,\lambda_j,V_{\alpha},Y)\propto\Pi(\alpha_i\|\V_{\ alpha})\prod\limits_{1\leq-j\leq-j}\mathrm{L}(\theta_{ij})\\&\text{,对于$i=1、\ldot、i$、$j=1、\ ldot、j$、$k=1、\t、p$和$l=1,\ldots,q$。}\结束{对齐}\]
算法在中实现jSDM_二项式逻辑()
在的基础罗森塔尔(2009)和罗伯茨和罗森塔尔(2001)文章,以估计logit模型的参数如下:
常数的定义\(N_{Gibbs}\),\(N_{burn}\),\(N_{薄}\)和\(R_{opt}\)这样的话\(N_{Gibbs}\)对应于算法执行的迭代,\(N_{burn}\)迭代次数老化或预热时间所需,
\(N_{samp}=\dfrac{否_{吉布斯}-N_{burn}}{N_{thin}}\)对应于为每个参数保留的估计值的数量。事实上,我们记录了为了获得\(N_{samp}\)价值观,让我们能够代表一\(后验)分配每个参数。
我们设置了\(R_{opt}\)最优的实现的自适应Metropolis算法中使用的接受率模型的每个参数。
将所有参数初始化为\(0\)例如,除了对角线值属于\(\Lambda\)在初始化\(1\)和\(V_{\alpha}^{(0)}=1\).验收编号每个参数的\(0\)以及它们的条件方差仪器密度取值\(1\).
吉布斯采样器每次迭代时\(t\)对于\(t=1,\ldots,N_{Gibbs}\)我们重复每个这些步骤:
生成随机场地效应 \(\字母_i^{(t)}\)对于\(i=1,\ldots,i)根据自适应模拟的Metropolis算法\(\alpha_i^\star\sim\数学{N}(\alpha_i^{(t-1)},\sigma_{\alpha_i}^2)\)然后如下计算接受率:
\[\gamma=最小\left(1\\dfrac{\Pi\left(\alpha_i^\star\|\V_{\alpha}^{(t-1)}\right)\prod\limits_{1\leqj\leqJ} \左(\alpha_i^\星,W_i^{(t-1)},\beta_J^{,X_i,y_{ij},n_i\right)}{\Pi\left(\alpha_i^{(t-1)}\|\V_{\alpha}^{(t-1)}\right)\prod\limits_{1\leq-j\leqJ} f\左(\alpha_i^{(t-1)},W_i^},\lambda_j^{(t-1)},X_i,y_{ij},n_i\右)}\右)
生成随机场地效应方差
\(V_\alpha^{(t)}\)根据:\[V_\alpha^{(t)}\|\\alpha_1^{(t)},\ldot,\alpha_I^{(\text{shape}=0.5+\frac{I}{2},\text{rate}=0.005+\裂缝{1}{2}\sum\limits_{i=1}^i\左(\alpha_i^{(t)}\right)^2\right)\]
生成潜在变量(或未测量预测因素)\(W_{il}^{(t)}\)对于\(i=1,\ldots,i)和\(l=1,\ldot,q)根据自适应模拟的Metropolis算法\(W_{il}^\星\sim\mathcal{N}(W_}il}^{(t-1)},\西格玛{W{il}}^2)然后计算验收率为跟随:
\[\gamma=min\left(1\\dfrac{\Pi\left(W_{il}^\star\right)\prod\limits_{1\leq j\leqJ} f\左(W_{il}^\星,\alpha_i^{(t)},\beta_J^{,\λ_j^{(t-1)},X_i,y_{ij},n_i\右)}{\Pi\左(W_{il}^{(t-1)}\右)\prod\limits_{1\leqj\leqJ} f\左(W_{il}^{(t-1)},\alpha_i^{,\lambda_j^{(t-1)},X_i,y_{ij},n_i\右)}\右)*如果物种提供特性数据,生成的影响物种反应的物种特异性特征 \(\gamma^{(t)}=\left(\gamma_{rk}^{(t)}\right)^{r=0,\ldots,nt}_{k=0,\ldots,p}\)例如:\[\gamma_{rk}^{(t)}\|\beta{1k}^{(t-1)},\ldots,\beta{Jk}^}{(t1)}\sim\mathcal{N}(m^\星,V^\星)\text{,with}\] \[m^\star=(V_{gamma_{rk}}^{-1}+T_r'T_r)^{-1}(V_{\gamma_{rk}}^{-1{\mu_{\gamma_{rc}}+T_r\left(\beta_k^{(T-1)}-\sum\limits_{r'\neq-r}T_{r'}\gamma_{r'k}^{(t-1)}\右)\text{和}V^\星=\左(V_{\gamma_{rk}}^{-1}+T_r'T_r\right)^{-1{
- 生成固定物种效应 \(\贝塔{jk}^{(t)}\)对于\(j=1,\ldot,j)和\(k=0,\ldots,p\)使用自适应大都市模拟的算法\(\beta_{jk}^\星\sim\mathcal{N}(\beta_{jk}^{(t-1)},\sigma_{\beta_2k}}^2)和然后计算验收率如下:
\[\伽马射线=min\左(1,\dfrac{\Pi\左(\beta_{jk}^\star\right)\prod\limits_{1\leqi\leq公司一} f \左(\beta{j0}^{(t)},\小{\ldots},\beta_{jk-1}^{(t){,\beta_{jk}^\星,\beta _{jk+1}^}(t-1)},\β{jp}^{(t-1)},\lambda_j^{,\alpha_1^{(t)},W_1^{(t){,\小{\ldots},\ alpha_I^{{\Pi\左(\beta_{jk}^{(t-1)}\右)\prod\limits_{1\leqi\leq一} f \左(\beta{j0}^{(t)},\小{\ldots},\beta_{jk-1}^{(t){,\beta_{jk}^{[t-1)},\β{jp}^{(t-1)},λ,\小{\ldots},\alpha_I^{(t)},W_I^{(t){,X_I,y_{ij},n_I\右)}\右)
- 生成与潜势有关的载荷系数变量 \(\lambda_{jl}^{(t)}\)对于\(j=1,\ldot,j)和\(l=1,\ldot,q)根据自适应的Metropolis算法\(l \leq j),模拟\(\lambda_{jl}^\star\sim\数学{N}(\lambda_{jl}^{(t-1)},\sigma\{\lambda_{jl}^ 2)\)和则如下计算接受率:\[\伽马射线=min\left(1,\dfrac{\Pi\left(\lambda_{jl}^\star\right)\prod\limits_{1\leqi\leq公司一} f \左(\lambda_{j1}^{(t)},\小{\ldots},\lambda _{jl-1}^}(t,\λ{jq}^{(t-1)},\alpha_1^{(t)},W_1^{(t){,\小{\ldots},\ alpha_I^{{\Pi\左(\lambda_{jl}^{(t-1)}\右)\prod\limits_{1\leqi\leq一} f \左(\lambda_{j1}^{(t)},\小{\ldots},\lambda _{jl-1}^}(t,\λ{jq}^{(t-1)},\alpha_1^{(t)},W_1^{(t){,\小{\ldots},\ alpha_I^{在以下情况下\(l>j),我们把\(\lambda{jl}^{(t)}=0\).