总结

在本文中,我们使用捕获-再捕获数据将自回归时间序列框架纳入动物生存模型。研究人员将动物的生存概率建模为随机过程的实现,通常认为动物的生存与下一个时间段无关。对于某些人群来说,这可能不现实。使用吉布斯抽样方法,我们可以估计生存模型的协变量系数和自回归参数。这一过程以北部长尾雉水禽带恢复数据集为例进行了说明(針尾鴨). 分析表明,第二滞后自回归系数显著小于0,表明生存概率之间存在三年一次的关系,并强调将生存率建模为独立随机变量在某些情况下可能不现实。实施该方法的软件在互联网上免费提供。

Résumé

Dans cet文章,nous incorporons une containte de modélisation auto-régressive sur série chronologique Dans les modèles d’estimation de la survie animale pour des donnes de capture-recapture-recepture。《联合国进程监管的永久性概率模型》包括《联合国环境保护法》。Ceci n’est probability paséaliste pour the certains populations.最有可能的是某些人群。无利用吉布斯汤估计协变系数和参数。鸭式飞机失窃事件的真相(針尾鴨). Cette分析蒙特勒系数d'autorégression de deuxieme ordre est有意义非零,ce qui implique une dépendance surtois and des probabilityés de survie;cela确认了年度调查的概率模型连续变量委员会(comme des variables indépendantes est irréaliste dans certains cas)。Les logiciels permentant d’useler cette méthodologie sont disponsible redentment sur Internet上的酬金。

1.简介

研究影响动物生存的因素已成为生态学研究的一个日益重要的方面(Lebreton等人,1992年). 用年龄、时间或天气因素等协变量解释存活率通常很有趣(Buckland、Goudie和Borchers,2000年). 研究人员最近开始探索这样一种观点,即生存概率是随机过程的实现,而不是固定常数(伯纳姆,2000,未发表的手稿;Barry等人,2003年;伯纳姆和怀特出版社,2002年). 通过随机效应建模生存概率可以解释过度分散(Barry等人,2003年)和未观察到的(或随机的)环境因素(伯纳姆,2000). 然而,到目前为止,生存过程的实现被认为是从一个时期到下一个时期的独立过程。在某些情况下,这可能是一个不切实际的假设。例如,在一个季节中,每周间隔的存活率可能是相关的,或者一个时期的高存活率可能会导致由于缺乏资源而导致随后时期的低存活率。因此,在生存被视为随机过程的模型中,合理地考虑时间序列相关结构,例如自回归结构(AR)。

Vounatsou和Smith(1995)布鲁克斯、卡特波尔和摩根(2000)Brooks、Catchpole、Morgan和Barry(2000年)、和Poole和Zeh(2002)使用贝叶斯方法估计年存活率。最近,Brooks、Catchpole和Morgan(2002年)Barry等人(2003年)已使用贝叶斯方法估计具有独立随机效应的生存模型,作为模型过度分散的一种方式。伯纳姆(2000)伯纳姆和怀特(2002)在非贝叶斯框架中考虑了随机效应。在随机效应模型的背景下,通过最大似然进行估计是困难的。通过对随机效应进行积分来构建可能性,因此必须对优化算法每次迭代的模型中包含的所有随机效应进行集成。在广义线性模型中也遇到了同样的困难(Zeger和Karim,1991年).

随机效应的使用允许通过AR过程在捕获-再捕获模型中建模生存。贝叶斯范式提供了比最大似然估计更好的几个优点。使用马尔可夫链蒙特卡罗(MCMC)程序(罗伯特和卡塞拉,1999年)点估计可以通过从参数的后验分布中抽样来生成。此外,贝叶斯方法还允许估计未观察到的随机效应。例如,可以估计每个时间段的生存概率。当包含随机效应时,这对于最大似然估计程序是不可行的。

我们考虑了两种常见捕获再捕获数据的模型:开放种群标记捕获(MR),即动物被捕获并活活释放;带返回(BR),即在每个狩猎季节后动物被捕获死亡。对于每种数据类型,我们都为阶自回归(),使用贝叶斯方法的随机效应模型。贝叶斯分析是使用北部长尾雉的长期水禽带恢复数据集进行说明的(針尾鴨).

2.捕获-恢复数据的可能性

开放人群标记重捕获数据和波段恢复数据的可能性在结构上是相同的,唯一的主要区别是参数略有修改。捕获再捕获数据的可能性的完整描述见Brownie等人(1985)Lebreton等人(1992年)。我们在这里简要介绍下一节中介绍的贝叶斯方法。

数据通常被观察为上三角阵列,,其中(j个)第个元素,ij公司,是当时释放的动物数量t吨然后在当时重新捕获(或报告,对于BR模型)t吨j个(参见表1例如)。价值观表示进行标记或捆扎的捕获次数,以及J型是发生记录重新捕获或恢复的次数。在MR研究中,通常,J型=而对于BR研究,J型可能大于由于标记动物可能会在标记停止后收获和报告。数据的另一个组成部分是×1矢量R(右)= [R(右)],包含每次捕获时释放的带标记或带状动物的数量。每行然后建模为多项式随机变量R(右)试验和细胞概率由存活概率和再捕获或恢复概率决定。使用汇总到足够统计信息中的捕获历史时R(右)假设个体具有相同的生存概率和再捕获/恢复率。

表1

1955年至1983年北部细尾辫带的恢复数据。这个R(右)代表每年释放的带状鸭数量。鸟类在每一年的1月被环志环志。

捆扎年份R(右)恢复年份
55565758596061626364656667686970717273747576777879808182
55270762000000000000000000000000
566932110420000010010000000000000
5716123220851202110000000000000000
58858261256410000000000000000000
59147121186500101100000000000000
601051184641201100100000000000
61796246400001000000000000
622771096641242000000000000
63903158184021110000000000
646216416110000000000000
6558410471210000000000
668222561044200200100000
671344282781114120010000
6856610136221111000000
694819720100000000
70695111152211011000
7163222102401200000
72111421118521000
7363991010202000
749261699251210
75858141251110
7636913244110
7745084121
7821260010
791680182884
804211412
8111820
82601
捆扎年份R(右)恢复年份
55565758596061626364656667686970717273747576777879808182
55270762000000000000000000000000
566932110420000010010000000000000
5716123220851202110000000000000000
58858261256410000000000000000000
59147121186500101100000000000000
601051184641201100100000000000
61796246400001000000000000
622771096641242000000000000
63903158184021110000000000
646216416110000000000000
6558410471210000000000
668222561044200200100000
671344282781114120010000
6856610136221111000000
694819720100000000
70695111152211011000
7163222102401200000
72111421118521000
7363991010202000
749261699251210
75858141251110
7636913244110
7745084121
7821260010
791680182884
804211412
8111820
82601
表1

1955年至1983年北部细尾辫带的恢复数据。这个R(右)代表每年释放的带状鸭数量。鸟类在每年的一月进行环带。

捆扎年份R(右)恢复年份
55565758596061626364656667686970717273747576777879808182
55270762000000000000000000000000
566932110420000010010000000000000
5716123220851202110000000000000000
58858261256410000000000000000000
59147121186500101100000000000000
601051184641201100100000000000
61796246400001000000000000
622771096641242000000000000
63903158184021110000000000
646216416110000000000000
6558410471210000000000
668222561044200200100000
671344282781114120010000
6856610136221111000000
694819720100000000
70695111152211011000
7163222102401200000
72111421118521000
7363991010202000
749261699251210
75858141251110
7636913244110
7745084121
7821260010
791680182884
804211412
8111820
82601
捆扎年份R(右)恢复年份
55565758596061626364656667686970717273747576777879808182
55270762000000000000000000000000
566932110420000010010000000000000
5716123220851202110000000000000000
58858261256410000000000000000000
59147121186500101100000000000000
601051184641201100100000000000
61796246400001000000000000
622771096641242000000000000
63903158184021110000000000
646216416110000000000000
6558410471210000000000
668222561044200200100000
671344282781114120010000
6856610136221111000000
694819720100000000
70695111152211011000
7163222102401200000
72111421118521000
7363991010202000
749261699251210
75858141251110
7636913244110
7745084121
7821260010
791680182884
804211412
8111820
82601

2.1. 开放人口标记恢复可能性

生存估计的MR模型也称为Cormack-Jolly-Seber模型(科马克,1964年). 这一模型是为捕获的动物贴上独特标记并放回野生种群的研究而设计的。在未来的某个时候,有标记的动物可能会被重新捕获、记录并再次释放到种群中。在磁共振研究中,第一次可能捕获标记为t吨t吨+1; 因此,对于这些模型,= 1, …,j个=+ 1, …,J型+ 1. 在假设个体是独立的且捕获不影响生存或再捕获概率的前提下,得到的乘积多项式似然为

(1)

其中φ是动物从捕获事件中幸存下来的概率t吨t吨+1= 1, …,考虑到它在t吨、和第页j个是动物存活的概率t吨j个j个= 2, …,J型+1,在捕获t吨j个.动物在释放后再也没有被捕获的可能性t吨由提供

论坛是捕获的动物数量t吨并且在研究期间从未被再次捕获。在本节和本文的其余部分中,将一个逆序乘积设置为等于1。例如,如果j个=+1,然后∏j个−1k个=+1φk个(1 −第页k个) = 1.

2.2. 频带恢复可能性

带恢复模型是为捕获、标记和释放动物的研究设计的。猎人在收获动物后,将其报告给环志机构。因此,在“重新捕获”的情况下,标记的动物会从种群中移除。数据结构保留在R(右)格式,因此,似然的形式与(1)相同,唯一的修改是多项式分布的单元格概率和范围的变化j个指数。由于动物可以在结带的同一时间段内收获和报告,因此指数范围设定为= 1, …,j个=…,J型。产生的可能性为

(2)

其中λj个是有标记的动物存活的概率t吨j个,在时间间隔内收获t吨j个t吨j个+1并向捆扎机构报告。在频带恢复模型中,论坛论坛注意,在BR模型中,由于可以在标记的同一时间段内报告动物细胞概率仅涉及λ参数。因此,只有J型-1生存概率,即使存在J型多年的数据。

3.AR的贝叶斯方法()生存模型

3.1. 型号规格

我们考虑了动物从时间中生存的概率的广义线性模型t吨j个到时间t吨j个+1表单的

(3)

哪里是一个适当的链接函数,用于限制0和1之间的生存,X(X)j个是一个P(P)捕获时收集的协变量×1矩阵j个β是一个P(P)×1回归系数向量,以及论坛协方差矩阵,Σ,可以是任何一般形式。这里我们考虑AR()模型表明εj个误差项是随机过程的实现

(4)

哪里zj个至腹腔注射。N个(0,σ2)、和ρ= (ρ1, …, ρ)是一组参数。

我们假设(4)表示的过程是平稳的。对于这个模型,平稳性意味着两个生存概率之间的协方差是两个时间点之间距离的递减函数,并且与任何一个时间点无关。误差过程的平稳性假设对ρ使得特征方程的根,

绝对值必须小于1(哈维,1993年,第20页)。就参数而言,当|ρ|<1时,AR(1)过程是平稳的,而如果|ρ1|<2和−1<ρ2< 1 −|ρ1|.

通过在(3)中包含随机误差项,我们考虑了可能影响生存概率的未知环境影响。在不添加误差项的情况下,假设协变量完全决定存活率。考虑到(4)中随机误差项之间的相关性,增加了复杂性,即在时间相近的捕获期内,未知环境条件可能相似,因此生存概率也应相关。的某些元素的负值ρ可能暗示人口中存在一些密度依赖性效应。由于缺乏资源,存活率高于平均水平的一年可能会导致随后几年的存活率低于平均水平。

固定AR()该模型提供了生存概率之间的正相关或负相关,生存概率随着时间间隔的增加而降低。那么,AR()模型提供了所需生存概率之间的关系类型。此外,该模型相对简单。林赛(1999年,第106页)指出,对于短期重复测量研究,精细的时间序列建模是不必要或不可能的,简单的AR过程通常就足够了。绝大多数捕获再捕获数据集的长度不超过50年(富兰克林、安德森和伯纳姆,2002年). 因此,捕获再捕获数据当然属于短时间序列数据的范畴。

(3)中指定的模型是时间序列组件出现在错误项中的模型。在其他AR模型公式中,时间序列分量与平均项一起出现(林赛,1999). 然而,为了便于生物学解释,我们更喜欢模型(3)。通常,目标是确定哪些协变量是最佳模型生存概率。如果生存概率的所有变化都没有用取样的协变量来解释,那么只有这样,才有可能确定生存概率和不同时间段之间存在什么关联。

3.2. 贝叶斯参数估计

我们采用贝叶斯方法来估计AR的参数()中指定的捕获-重新捕获模型第3.1节该方法的目的是估计参数的后验分布,从而推断参数和生态假设。与最大似然估计(MLE)相比,这种方法相对简单。为了通过MLE估计参数,有必要评估形式的综合可能性

哪里论坛由(1)或(2)给出,并且N个(·)在(3)和(4)之后。因此,对于优化算法中的每个步骤,都必须进行高维积分。另一种方法,准似然(麦库拉,1983年),已开发用于广义线性模型设置中的随机效应模型。这种方法涉及到估计方程的开发,这些方程表现为似然函数,因此通常具有相同的属性。然而,在捕获-再捕获设置中,细胞概率是生存概率的函数,这一事实也使得准似然估计变得困难。在贝叶斯范式中,未观察到的随机效应与参数一起被视为随机变量,通过从参数的联合条件分布和给定数据的随机效应中抽样的马尔可夫链随机进行积分。从这个联合条件分布中,我们可以得到模型参数的点估计和置信区间。

在下文中,我们给出了标记重捕获和频带恢复数据的一般估计过程。为了简化符号,我们将使用符号表示捕获概率向量,第页或波段回报率,λ,取决于所考虑的数据类型。我们还将使用j个索引范围1…,J型因为这不会改变估算程序。观测数据,R(右)以及协变量,X(X),统称为D类.

我们假设参数β, σ2ρ、和是独立的先验的。然后通过以下公式给出参数和随机效应的后验分布

(5)

为了从这个分布中提取样本,我们将使用吉布斯采样器(例如。,第2.1节属于陈、邵和易卜拉欣(2000)),这需要每个参数的完整条件分布。通过从每个参数的完整条件后验分布中连续提取,可以从联合后验分布提取样本。

对完全条件分布的简化是因为似然函数可以分为三部分。此外,由于后验函数仅定义为乘法常数,因此我们可以忽略多项式系数。因此,这种可能性可以改写为

其中对于MR和BR数据两者,论坛.对于MR数据

和用于BR数据

现在,利用似然的分区形式,我们可以简化每个参数的完整条件分布。由于除一个参数外,所有参数都具有非标准分布,因此我们只给出比例常数的条件分布。

如果协变量的回归参数,β,in(3)是独立的先验,则对于th协变量,β由提供

同样,MR数据的捕获概率向量或BR数据的频带返回率,给出

推导ε的完整条件分布时,我们首先注意到,鉴于我们假设平稳性,我们可以将(3)中误差项的联合分布改写为以下形式

(6)

其中ν=E类1, …, ε−1],= 2, …,K(K)是的函数ρ(哈维,1993年第53页)。在静止AR中()过程ν1=0和论坛对于=+ 1, …,J型为了找到剩余的ν’s和K(K)我们可以利用Durbin-Levinson算法(布罗克韦尔和戴维斯,1996年第67页)。例如,在AR(2)过程中,

(7)

对于AR(1)过程,只需设置ρ2=0英寸(7)。

很明显,由于AR()这个过程是一个马尔可夫过程,它的每个组成部分ε仅依赖于其最近的邻居。利用这个事实,ε的完全条件分布对于吉布斯采样器,可以写成ε的条件正态分布的函数鉴于其最近的邻居。因此,ε的完全条件分布=1…,J型,是

对于每个ε,可以浓缩为以下形式,

通过完成正方形。对于AR(2)错误过程

再次,为了获得AR(1)模型的全部条件,只需设置ρ2= 0.

由于自相关参数的平稳性约束,ρ,我们必须考虑ρ而不是假设ρ.使用分解(f)(ε2ρ)在(6)中,我们可以写出ρ作为

σ的完全条件分布2几乎与ρ.使用分解(f)(ε2ρ),σ的完整条件2

它是具有形状和比例参数的逆伽马分布的形式J型/2+1和论坛分别是。因此,如果π(σ2)是带参数的逆伽马分布0b条0即Γ−1(0b条0),则得到的条件是具有参数的逆伽马分布J型/2 +0+1和C类(ερ)/2 +b条0.σ的完整条件2是唯一的标准密度。

在实施贝叶斯方法时,有必要为参数选择先验值。在具有随机效应的广义线性模型中,指定模糊先验π(β) =N个(0,1/τ),用于= 1, …,P(P)和π(σ2) =Γ−1(ɛ,\603;),其中τ和\603(Dey、Ghosh和Mallick,2000年第400页)。在过去的贝叶斯捕获-再捕获分析中,π()已被选为beta发行版=1…,J型(布鲁克斯、Catchpole和摩根,2000年)其中均匀分布,u个(0,1)是模糊先验信息的特例。所有这些先验信息都可以很容易地进行修改,以根据需要生成信息丰富的先验信息。

当关于参数的事先信息很少或没有时ρ对于非信息先验分布,平稳区域上的均匀分布是显而易见的选择。然而,这种均匀分布可能会产生边际先验值,而这些先验值并不像研究人员希望的那样模糊。例如,在AR(2)的情况下,AR参数的均匀分布ρ1和ρ2在平稳性区域上产生的边际分布是不均匀的。此外,大部分质量为ρ的边际分布2将位于负值之上,产生一个负值的先验平均值。在约束空间上构建参数向量的先验时,经常会出现此问题。Barnard、McCulloch和Meng(2000年)说明了为正定协方差矩阵构造先验时的相同困境。

在以前使用AR过程的分析中,AR参数的先验被视为在参数的平稳空间上是一致的,或者如果平稳性不是问题或可能性,则为正态分布(韦尔塔和韦斯特,1999年). 信息先验也可以通过使用被截断的多元正态分布来构造,使得其仅在自回归参数的平稳空间上具有正质量。还有另一种方法,由Sun和Berger(1998),这对于受约束的参数空间很有用。如果我们关心参数向量(θ1,θ2),则先验值可以构建为π(θ1) π(θ21). 使用这种方法,我们通常可以建立一个足够无信息的先验,它具有更好的边际性质。例如,在AR(2)模型中,如果我们取π(ρ2) =U型(-1,1)和π(ρ12) =U型{− (1 −ρ2), 1 −ρ2},我们得到了一个先验值,它用以0为中心的边际分布来近似联合均匀分布。部分信息方法还可用于指定某些AR参数的信息先验,而其他参数则不明确。

AR贝叶斯分析的另一个实用方面()捕获-再捕获模型是由于非标准条件分布,必须使用改进的吉布斯采样器。在下面的示例中,Gibbs采样器中的Metropolis(盖尔曼和鲁宾,1993年)被使用。不是从全条件分布中连续采样以从联合后验中获得样本,而是首先从提议分布中提取观察结果,然后以给定的概率接受或拒绝。

4.示例:Northern Pintails

为了说明AR的拟合()为了捕获再捕获数据,我们将吉布斯采样器方法应用于加利福尼亚州女性的北尾带恢复数据集。这些数据(表1)首先由以下人员进行分析Franklin等人(2002年)作为对许多北美鸟类长期生存趋势的荟萃分析的一部分。之前的分析是使用线性趋势模型、同一链接函数和独立的年度随机效应进行的。趋势参数和方差分量使用以下收缩估计方法进行估计伯纳姆(2000)先前分析得出的斜率估计值为0.0023,估计标准误差为0.0051。方差分量估计为0.212。

之前的分析没有发现生存概率随时间的变化趋势。然而,我们将在本例中包括一个斜率参数,以说明在我们的估计过程中使用协变量。因此,我们将使用该模型

(8)

说明AR的应用()模型。在这个例子中,协变量向量X(X)j个(3)由(1)给出,j个− 14). 时间指数居中以减少β的相关性1带β的样品0这样可以更好地探索每个变量的后验密度。此外,由于根据之前的分析似乎没有明显的趋势,我们也分析了没有斜率参数的数据。

我们选择估计单独的报告概率λj个每年的。Barry等人(2003年)注意分隔λj个在(2)中,我们往往混淆了随机生存过程的影响,这也是我们的经验。然而,我们采用了一种保守的策略,通过允许报告率波动来推断随机生存过程。

对于这个示例,我们选择了将AR(2)模型拟合到数据中。这意味着(8)中的误差项遵循随机过程

二阶AR模型是根据MARK计划中使用(2)的年生存概率的最大似然估计的相关图选择的(怀特和伯纳姆,1999年). 通过检查相关图,我们将MLE生存估计值视为时间序列数据,而不是时间序列数据的估计值。因此,如果在某些滞后时间内相关性不显著,那么当与协变量参数同时进行估计时,相应的AR系数也可能不显著。

选择logit-link函数是因为它是捕获-再捕获模型中最常用的链接。捕获-再捕获数据通常不够详细,无法检测用于将生存概率约束为(0,1)的链路形状的细微差异。即使在逻辑回归的情况下,也很难区分不同的链接函数。对于0.1至0.9范围内的概率,McCullagh和Nelder(1989年,第109页)注意到,基于fit测试的良好性很难区分probit和logit链接;对于概率接近0.5的情况,二进制数据的所有四个公共链接彼此接近。北美鸭种的存活概率通常不接近0或1的极值,因此对这些数据使用logit链接函数是合理的。

贝叶斯软件WinBUGS(Spiegelholter,Thomas和Best,2000年)用于从(β0, ρ1, ρ2, σ,ε). 如前所述,只有一个参数中的完整条件是标准密度;因此,必须使用混合吉布斯采样器。为此,WinBUGS使用Metropolis within Gibbs采样器,其中建议分布是正态分布,其中方差在前4000次迭代中进行调整,以获得20%到40%之间的接受率。

为参数选择的优先级如下:

这些值被选择得足够模糊,以减少先验知识。ρ的联合分布1和ρ2被构造为平稳区域上的模糊密度,平均值为(0,0)。σ选择了模糊伽马分布−2为了利用σ的标准全条件分布2.

为了选择样本,在5000次迭代的老化期之后运行两个独立的链,每个链包含15000次迭代,以允许正常的提案分布完成调整。链条似乎在老化期结束之前就已经聚合。图1显示了每个参数的边际后验分布的高斯核密度估计。

图1

边缘后部密度(): β0, (b条) β1, (c(c)): ρ1, (d日): ρ2、和(e(电子)):来自Pintail数据的σ。实线表示时间趋势模型的后验密度,而虚线表示趋势参数缺失时的后验浓度。

这些结果表明,尽管ρ1似乎直接居中于0之上,ρ的大部分后部质量2似乎位于负值之上,这表明在第二个滞后时间对误差项似乎有显著影响。这表明,如果存活率在一年内很高,那么在两年内就会很低(滞后2)。此外,σ的后部质量似乎远离0,这表明每年也有大量的随机变化。截距参数β0也显著大于0,这将使平均生存率提高到约0.5。斜率参数β的后验分布1,似乎在0附近高度集中。虽然不能直接比较,但趋势参数和方差分量与之前的分析在定性上是一致的。图1还说明了边缘参数对斜率参数的存在或不存在的鲁棒性。边际密度估计值几乎保持不变。后验平均值、标准偏差和90%的最高概率密度(HPD)区间估计值如下所示表2.

表2

AR(2)模型参数的后验均值、标准偏差和90%HPD间隔

模型参数平均值90%高倍视野间隔
截距和坡度β00.6000.159(0.390, 0.850)
β1−0.0070.026(−0.046, 0.033)
ρ10.0140.288(−0.458, 0.485)
ρ2−0.4520.307(−0.928, 0.004)
σ0.6880.222(0.336, 1.015)
仅拦截β00.6120.140(0.409, 0.857)
ρ1−0.0030.286(−0.483, 0.456)
ρ2−0.5030.263(−0.918, −0.109)
σ0.6440.201(0.330, 0.950)
模型参数平均值90%高倍视野间隔
截水沟和边坡β00.6000.159(0.390, 0.850)
β1−0.0070.026(−0.046, 0.033)
ρ10.0140.288(−0.458, 0.485)
ρ2−0.4520.307(−0.928, 0.004)
σ0.6880.222(0.336, 1.015)
仅拦截β00.6120.140(0.409, 0.857)
ρ1−0.0030.286(−0.483, 0.456)
ρ2−0.5030.263(−0.918, −0.109)
σ0.6440.201(0.330,0.950)
表2

AR(2)模型参数的后验均值、标准偏差和90%HPD间隔

模型参数平均值90%高倍视野间隔
截距和坡度β00.6000.159(0.390, 0.850)
β1−0.0070.026(−0.046, 0.033)
ρ10.0140.288(−0.458, 0.485)
ρ2−0.4520.307(−0.928, 0.004)
σ0.6880.222(0.336, 1.015)
仅拦截β00.6120.140(0.409, 0.857)
ρ1−0.0030.286(−0.483, 0.456)
ρ2−0.5030.263(−0.918, −0.109)
σ0.6440.201(0.330,0.950)
模型参数平均值90%高倍视野间隔
截距和坡度β00.6000.159(0.390, 0.850)
β1−0.0070.026(−0.046, 0.033)
ρ10.0140.288(−0.458, 0.485)
ρ2−0.4520.307(−0.928, 0.004)
σ0.6880.222(0.336, 1.015)
仅拦截β00.6120.140(0.409, 0.857)
ρ1−0.0030.286(−0.483, 0.456)
ρ2−0.5030.263(−0.918, −0.109)
σ0.6440.201(0.330, 0.950)

置信区间和近似期望值支持这样的结论,即存在大量的变化,而线性趋势无法解释这些变化。还存在斜率参数近似为0并且第二AR参数小于0的高后验概率。此外,由于我们已经模拟了ε我们也可以估计每年的存活率。图2图中显示了仅截获模型的年生存率曲线,其HPD置信区间为90%。

图2

年存活率估算图φ(t吨)对于没有线性时间趋势的北方平尾数据集。实线表示估计的后部平均存活率,虚线表示90%的HPD间隔。

当AR参数的先验值由ρ给出时,后验密度几乎保持不变1U型(−2,2)和ρ21U型(− 1, 1 −|ρ1|)与之前使用的优先级相反。对于这些先验值,仅拦截模型的参数估计值和相应的90%HPD间隔为β0: 0.606 (0.395, 0.811), ρ1: 0.018 (−0.505, 0.516), ρ2:-0.544(-0.915,-0.185),σ:0.617(0.299,0.921)。AR参数的后验分布似乎对不同的非信息先验具有鲁棒性。

5.讨论

用于实现AR(2)频带恢复模型的方法的软件免费提供www.stat.colostate.edu/~jah/。针对特定问题修改和实施此软件相对简单。该软件是用WinBUGS编写的,该软件用于使用马尔可夫链蒙特卡罗方法对统计模型进行贝叶斯分析,该软件在www.mrc-bsu.cam.ac.uk/bugs网站.

贝叶斯方法允许对之前不可用的捕获-再捕获数据进行时间序列建模。除了这里考虑的单变量时间序列模型外,随机效应模型也可以扩展,以考虑其他形式的相关性。例如,利用AR随机效应对重新捕获或回收率进行建模可能很有意义。在这种情况下,恢复或再捕获参数的处理与所述生存程序相同。另一个例子是生存模型中对性别的考虑。通常的做法是将性别作为协变量。在AR模型中,这意味着未知的环境因素对男性和女性每年的生存率具有相同的影响,并且男性和女性之间的生存率随时间的关联水平也保持不变。这可能是一个不切实际的假设,因此为男性和女性分别建模AR错误可能是明智的。为了解释性别之间的相关误差,可以使用多变量AR过程,对这里提出的模型几乎没有修改。

尽管AR模型可以为生存过程提供额外的见解,但在某些情况下,AR参数的估计可能会被证明是困难的。首先,如果数据中的捕获次数少于20次,则可能没有足够的数据来大大改变AR参数的先验分布。这是时间序列分析中经常遇到的问题。其次,如果回收/再捕获率很小,可能没有足够的数据来估计AR参数以及协变量参数。第二个问题是所有捕获-再捕获数据分析中常见的问题。最后,如果误差变化非常小,则AR模型不太可能提供任何附加信息。不过,最后一种情况确实不是问题,因为生物学家的目标通常是用协变量来模拟生存。如果把生存过程中的所有错误都考虑在内,我们可以确信对生存过程有一个很好的描述。AR模型用于解释未观察到的环境变化。

将AR模型与捕获再捕获数据结合使用的一个含义是,任何时间段的存活率估计值都将比简单的协变量模型具有更大的不确定性。这种可变性由(4)中白噪声项的可变性和AR参数控制。例如,对于AR(1)模型,每个随机效应的方差为σ2/(1-ρ2). 对于σ保持不变,随机效应的方差可以变大为|ρ|1.我们还可以观察到,对于固定的噪声方差,AR模型将比独立的随机效应模型具有更大的方差。

这里描述的方法的一个扩展是模型选择。一般来说,在贝叶斯框架中,模型选择对于捕获再捕获数据来说不是一件容易的任务,金和布鲁克斯(2002ab)已探索使用反向跳跃MCMC程序(格林,1995年)适用于具有多层和综合回收/再捕获模型的捕获-再捕获模型。这提供了最有希望的解决方案,但这些程序不容易用于定期分析。贝叶斯模型选择的另一种解决方案是偏差信息准则(DIC)(Spiegelhalter等人,2002年). DIC的一个很好的特点是,为参数估计选择的MCMC样本可以用于构建DIC分数。然而,DIC的当前公式不允许区分此处描述的捕获-再捕获模型的不同阶AR过程。如果希望拟合AR模型以捕获再捕获数据,为AR模型选择适当顺序的初始步骤是拟合独立的随机效应模型,然后绘制随机效应点估计的相关图,并根据图选择顺序。这将为模型提供保守的顺序。

总的来说,这些模型有潜力为野生生物学家提供新的见解,以了解通过捕获-再捕获研究影响动物生存的因素。

致谢

作者感谢David Anderson博士和Kenneth Burnham博士的建议和建议。这项工作的部分资金来自美国环境保护署(EPA)授予科罗拉多州立大学的STAR研究援助协议CR-829095。环保局尚未对其进行正式审查;这里表达的观点仅是作者的观点。EPA不认可此处提及的任何产品或商业服务。此外,这项研究的部分资金来自NSF拨款DUE-0094514。

工具书类

巴纳德
J。
麦卡洛赫
对。
、和
十、L
(
2000
).
根据标准偏差和相关性对协方差矩阵建模,并应用于收缩
.
中国统计局
 
10
1281
1311
.

巴里
南卡罗来纳州。
布鲁克斯
第页。
接力棒
欧洲航空公司。
、和
摩根
B.J.T.公司。
(
2003
).
利用随机效应分析环恢复数据
.
生物识别
 
59
54
65
.

布罗克韦尔
第J页
.和
戴维斯
注册会计师
(
1996
).
时间序列和预测简介
.
纽约
:
Springer-Verlag公司
.

布鲁克斯
第页。
接力棒
欧洲航空公司。
、和
摩根
B.J.T.公司。
(
2000
).
贝叶斯动物生存估计
.
统计科学
 
15
357
376
.

布鲁克斯
第页。
接力棒
E.A。
、和
摩根
B.J.T.公司。
(
2002
). 分析振铃数据的贝叶斯方法。
应用统计学杂志,专刊:标记鸟类种群数据的统计分析
 
29
B.J.T.公司。
 
摩根
D.L.公司。
 
汤姆森
(
编辑
),
187
206
.

布鲁克斯
第页。
接力棒
欧洲航空公司。
摩根
B.J.T.公司。
、和
巴里
南卡罗来纳州。
(
2000
).
环恢复数据的贝叶斯分析
.
生物识别
 
56
951
956
.

布朗尼
C、。
安德森
D.R.公司。
伯纳姆
K.P.公司。
、和
罗布森
D.S.公司
(
1985
).
波段恢复数据的统计推断-手册.资源出版物156,美国内政部鱼类和野生动物局
.

巴克兰
S.T.公司。
古迪
I.B.J.(国际商业期刊)。
、和
博切尔
D.L公司
(
2000
).
野生动物种群评估:过去的发展和未来的方向
.
生物识别
 
56
1
12
.

伯纳姆
英国石油公司
(
2000
).
关于捕获再捕获的随机效应模型。作者提供预打印
科罗拉多州大学
.

伯纳姆
英国石油公司
.和
白色
总承包商
(
2002
). 评估适用于振铃数据的一些随机效应方法。
应用统计学杂志
29
(特别版:标记鸟类种群数据的统计分析
B.J.T.公司。
 
摩根
D.L.公司。
 
汤姆森
(
编辑
)),
245
262
.

男-女。
问-米。
、和
易卜拉欣
J·G
(
2000
).
贝叶斯统计中的蒙特卡罗方法
.
纽约
:
Springer-Verlag公司
.

科马克
瑞米
(
1964
).
看到有标记动物的存活率估计
.
生物特征
 
51
429
438
.

戴伊
D.K.博士。
高希
韩国。
、和
马利克
B、K
(
2000
).
广义线性模型:贝叶斯观点
.
纽约
:
马塞尔·德克尔。

富兰克林
答:B。
安德森
D.R.公司。
、和
伯纳姆
英国石油公司
(
2002
). 使用随机效应模型估计鸟类生存概率的长期趋势和变化。
应用统计学杂志
29
(特别版:标记鸟类种群数据的统计分析
B.J.T.公司。
 
摩根
D.L.公司。
 
汤姆森
 
(编辑)
267
289
.

盖尔曼
A类
.和
鲁宾
D.B公司
(
1993
).
关于吉布斯采样器和其他MCMC方法会议的讨论
.
英国皇家统计学会杂志B辑
 
55
73
.

绿色
P.J公司
(
1995
).
可逆跳跃马尔可夫链蒙特卡罗计算与贝叶斯模型选择
.
生物特征
 
82
711
732
.

哈维
交流
(
1993
).
时间序列模型
,第2版。
剑桥
马萨诸塞州:麻省理工学院出版社
.

韦尔塔
G公司
.和
西部
M(M)
(
1999
).
自回归时间序列模型中的先验和成分结构
.
英国皇家统计学会杂志B辑
 
61
881
899
.

国王
对。
布鲁克斯
第页。
(
2002年a
).
多层捕获再捕获的贝叶斯模型判别
.
生物特征
 
89
785
806
.

国王
对。
布鲁克斯
第页。
(
2002年b
).
集成恢复/重新捕获数据的模型选择
.
生物识别
 
58
841
851
.

勒布雷顿
J。
伯纳姆
K.P.公司。
克洛伯特
J。
、和
安德森
D.R公司
(
1992
).
使用标记动物建模生存和测试生物假设:与案例研究的统一方法
.
生态学专论
 
62
67
118
.

林赛
J·K
(
1999
).
重复测量模型
.
纽约
:
牛津大学出版社
.

麦卡拉
P(P)
(
1983
).
拟似然函数
.
统计年刊
 
11
59
67
.

麦卡拉
P(P)
.和
内尔德
J型
(
1989
).
广义线性模型,第2版统计学和应用概率专著37
 
纽约
:
Chapman和Hall/CRC
.

普尔
D类
.和
Zeh公司
J.E公司
(
2002
).
用马尔可夫链蒙特卡罗方法估计成年露脊鲸的存活率
.
农业、生物和环境统计杂志
 
7
1
13
.

罗伯特
C.P公司
.和
卡塞拉
G公司
(
1999
).
蒙特卡罗统计方法
.
纽约
:
Springer-Verlag公司
.

Spiegelhalter公司
D。
托马斯
答:。
、和
最佳
N个
(
2000
).
WinBUGS用户手册,版本1.3
.
英国剑桥
. :
公共卫生研究所MRC生物统计组
.

Spiegelhalter公司
D.J.博士。
最佳
N.G.公司。
卡林
B.第页。
、和
范德林德
A类
(
2002
).
复杂度和拟合度的贝叶斯度量
.
英国皇家统计学会杂志B辑
 
64
583
639
.

太阳
D类
.和
伯杰
J.O公司
(
1998
).
包含部分信息的参考先验信息
.
生物特征
 
85
55
71
.

Vounatsou公司
F类
.和
史密斯
A.F.M公司
(
1995
).
基于马尔可夫链蒙特卡罗模拟的环恢复数据贝叶斯分析
.
生物识别
 
51
687
708
.

白色
总承包商
.和
伯纳姆
英国石油公司
(
1999
).
项目MARK:根据标记动物的种群进行生存估计
.
鸟类研究
 
46
(
供应商。
),
120
139
.

Zeger公司
S.L公司
卡里姆
M.R公司
(
1991
).
具有随机效应的广义线性模型:吉布斯抽样方法
.
美国统计协会杂志
 
86
79
86
.

本文根据牛津大学出版社标准期刊出版模式的条款出版和发行(https://academic.oup.com/journals/pages/open_access/funder_policies/chorus/standard_publication_model)