总结
当后验分布通过数据积累随时间演化时,解决贝叶斯估计问题在动态模型中有许多应用。为了解决这些问题,最近提出了大量基于粒子滤波方法的算法,也称为序列蒙特卡罗算法。我们提出了一种特殊的粒子滤波方法,该方法使用正态分布的随机混合来表示部分观测到的高斯状态空间模型的后验分布。该算法基于边缘化思想来提高效率,与标准算法相比,可以带来显著的收益。它不同于以往仅适用于条件线性高斯状态空间模型的算法。对动态tobit和probit模型进行了计算机仿真,以评估所提算法的性能。
1.简介
1.1. 背景
许多数据分析任务涉及在只有部分或不准确观测数据可用时估计动态模型的状态(West和Harrison,1997). 除了在一些特殊情况下,包括线性高斯状态空间模型,在线状态估计是一个不允许闭式解的问题。由于大多数现实世界模型都是非线性和非高斯的,因此开发有效的计算方法来数值求解这一所谓的贝叶斯滤波问题是非常有意义的。
为了克服这个问题,人们提出了许多近似方案,如扩展卡尔曼滤波器。然而,在许多实际场景中,这些近似方法是不可靠的,并且很难在线诊断故障。最近,对于非线性或非高斯时间序列分析的序贯蒙特卡罗(SMC)方法(Doucet等。,2001). 这些方法始于戈登等。(1993),使用基于随机样本(或粒子)的后验概率分布表示。
1.2. 一般问题
对于任何序列我t吨,我们定义
在本文中,我们将集中讨论以下一类状态空间模型。让t吨=1,2,…表示离散时间:则
(1)
(2)
(3)
哪里u个t吨∈ℝn个u个是一个外生过程x个t吨∈ℝn个x个和年t吨∈ℝn个年是未观察到的过程。序列
和
是独立同分布(IID)高斯。我们假设P(P)0>0;x个0,v(v)t吨和w个t吨都是相互独立的t吨、和模型参数
已知。过程(x个t吨)和(年t吨)定义一个标准的线性高斯状态空间模型。我们没有观察到(年t吨)就我们而言,但是(z(z)t吨). 这个观察(z(z)t吨)在给定过程的条件下是独立的(x个t吨)和(年t吨)并根据对(z(z)t吨|年t吨); 假设对(z(z)t吨|年t吨)可以按点计算,直到得到一个规范化常数。通常情况下对(z(z)t吨|年t吨)属于指数族。或者z(z)t吨可以是的审查或量化版本年t吨。这类部分观测高斯状态空间模型有许多应用;许多例子都被讨论过,例如在德容(1997)、曼里克和谢泼德(1998)West和Harrison(1997).
我们想估算一下按时间顺序后验分布的一些特征对(x个0:t吨|z(z)1:t吨). 通常,我们对计算感兴趣E类(x个t吨|z(z)1:t吨)(过滤),E类(x个t吨+L(左)|z(z)1:t吨)(预测)和E类(x个t吨−L(左)|z(z)1:t吨)(固定滞后平滑),其中L(左)是一个正整数。这些估计一般不允许使用解析表达式,我们必须采用数值方法。
1.3. 分辨率
SMC方法松散地说,是重要采样和重采样方法的组合,它使我们能够随着时间的推移有效地传播一组大致按照对(x个0:t吨|z(z)1:t吨). 我们可以应用标准的SMC方法,如引导过滤器(Gordon等。,1993)估计对(x个0:t吨,年1:t吨|z(z)1:t吨)因此对(x个0:t吨|z(z)1:t吨). 然而,在其标准形式中,该算法并没有使用模型的所有显著结构。我们的算法基于边缘化技术,通常称为Rao–Blackwellization方法(Gelfand and Smith,1990),这提高了程序的效率。它侧重于对对(年1:t吨|z(z)1:t吨)而不是接缝密度对(x个0:t吨,年1:t吨|z(z)1:t吨). 这个过程(x个t吨)通过分析进行整合。一次对(年1:t吨|z(z)1:t吨)我们可以得到E类(x个t吨|z(z)1:t吨),E类(x个t吨+L(左)|z(z)1:t吨)和E类(x个t吨−L(左)|z(z)1:t吨)通过进一步讨论的卡尔曼滤波器。在马尔可夫链蒙特卡罗框架中,德容(1997)提出了所谓的扫描取样器对(年1:t吨|z(z)1:t吨)在类似类别的状态空间模型中;参见Manrique和Shephard(1998)对于某些应用程序。
1.4. 计划
论文的其余部分组织如下。章节2展示了如何限制我们自己进行估计对(年1:t吨|z(z)1:t吨)而不是对(x个0:t吨,年1:t吨|z(z)1:t吨)从而提高了蒙特卡罗效率。然后详细描述了粒子滤波算法。章节三通过对动态tobit和probit模型的计算机仿真,验证了该算法的性能。
2.Rao–Blackwellized粒子过滤
2.1. 边缘化
考虑由方程定义的状态空间模型(1)–(三). 我们有
因此,如果我们(通过进一步描述的SMC方法)获得与密度相关的概率分布的近似值对(年1:t吨|z(z)1:t吨)表单的
然后对(x个0:t吨|z(z)1:t吨)可以通过使用
即高斯密度的混合。根据这样的近似值,我们可以估计E类(x个t吨|z(z)1:t吨)和E类(x个t吨−L(左)|z(z)1:t吨). 例如,估计E类(x个t吨|z(z)1:t吨)由提供
哪里通过与方程定义的线性高斯状态空间模型相关联的卡尔曼滤波器进行计算(1)和(2). 使用方差分解公式,很明显,对于任何函数小时(·)
这表明估计对(年1:t吨|z(z)1:t吨)只有这样才能更有效率。
获得边缘后部密度的SMC近似值对(年1:t吨|z(z)1:t吨),我们需要能够逐点估计这个“目标”密度,直到一个规范化常数。我们有
(4)
哪里
作为对(z(z)k个|年k个)假设已知到标准化常数,则只需估计对(年k个|年1:k个−1)达到规范化常数。可以使用卡尔曼滤波器计算预测密度。
卡尔曼滤波方程如下。设置和P(P)0|0=P(P)0; 然后针对t吨=1,2,…计算
(5)
哪里
和
我们获得对(年k个|年1:k个−1)=𝒩(年k个;年k个|k个−1,S公司k个),其中𝒩(年k个;年k个|k个−1,S公司k个)是参数的高斯分布年k个,平均值年k个|k个−1和协方差S公司k个.
2.2. 粒子过滤
2.2.1. 顺序重要性抽样和重抽样
我们在这里简要描述了如何应用顺序重要性抽样-重抽样(SISR)方法从对(年1:t吨|z(z)1:t吨); 参见Doucet等。(2001)了解更多详细信息。
时间t吨−1,假设我们已经说过N个粒子大致按照对(年1:t吨−1|z(z)1:t吨−1)我们想获得N个粒子分配依据对(年1:t吨|z(z)1:t吨). 时间t吨,我们“延伸”每个粒子通过采样根据条件密度因此,每个粒子根据对(年1:t吨−1|z(z)1:t吨−1)q个t吨(年t吨|年1:t吨−1,z(z)1:t吨). 更正以下内容之间的差异对(年1:t吨−1|z(z)1:t吨−1)×q个t吨(年t吨|年1:t吨−1,z(z)1:t吨)和对(年1:t吨|z(z)1:t吨),我们使用重要性抽样,以便与密度相关的分布对(年1:t吨|z(z)1:t吨)近似值为
(6)
其中,使用公式(4),我们有重要的权重
算法的性能取决于重要性密度q个t吨(年t吨|年1:t吨−1,z(z)1:t吨). 我们可以选择对(年t吨|年1:t吨−1)因为它是高斯密度。在这种情况下,相关的重要性权重等于w个(年1:t吨)∝对(z(z)t吨|年t吨). 请注意,“最佳”重要性密度,即最小化权重条件方差的密度年1:t吨−1(Doucet等。,2000),是
关联的重要性权重为
(7)
根据以下条件,可能计算或不计算该重量对(z(z)t吨|年t吨).
最后,我们得到N个粒子近似分布依据对(年1:t吨|z(z)1:t吨)通过从等式中给出的加权经验分布重采样(6). 文献中提供了几种重采样程序。我们在这里采用了Kitagawa中描述的分层抽样方案(1996).
替代SMC方法可用于估算对(年1:t吨|z(z)1:t吨). 特别是Pitt和Shephard的辅助粒子滤波(APF)技术(1999)可以使用。APF背后的理念是扩展现有粒子从预测可能性的意义上来说,这是最有希望的很大。何时APF提出了一个分析近似值。在这种情况下,APF和SISR有显著差异。然而,当可以解析计算,然后APF使用最佳重要性密度。这被称为“完美适应”(皮特和谢泼德,1999). 在这种特殊情况下,APF和SISR基本上相似,不同之处在于APF颠倒了采样和重采样步骤的顺序;这是可能的,因为重要性权重与年t吨这显然效率更高。
2.2.2. 算法
我们的演示仅限于重要密度的标准选择,其中q个t吨(年t吨|年1:t吨−1,z(z)1:t吨)取决于(年1:t吨−1,z(z)1:t吨)仅通过z(z)t吨和低维充分统计集x个t吨|t吨−1和P(P)t吨|t吨−1.我们将写信
这类密度包括
哪里年t吨|t吨−1和S公司t吨是的确定函数x个t吨|t吨−1和P(P)t吨|t吨−1作为一个典型的关注边缘特征的人对(年t吨|z(z)1:t吨),只需要存储在内存中和P(P)t吨|t吨−1而不是与Chen和Liu提出的算法相反(2000)和Doucet等。(2000),我们指出我们不必计算N个“完整”卡尔曼滤波递归,因为大多数计算只需进行一次。更准确地说,我们注意到和对于任何我∈ {1, … ,N个}.
鉴于N个粒子时间t吨−1大约根据对(年t吨−1|z(z)1:t吨−1)以及相关的足够统计数据和P(P)t吨|t吨−1,粒子过滤器在以下时间进行t吨。在顺序重要性抽样步骤:
- (a)
- (b)
对于我=1, … ,N个、评估并规范重要性权重(8)
在重采样步骤:繁殖或丢弃粒子关于高或低重要性权重以获得N个粒子.
在更新步骤:
- (a)
计算P(P)t吨+1|t吨鉴于P(P)t吨|t吨−1使用卡尔曼递归的一步(5);
- (b)
对于我=1, … ,N个,使用卡尔曼递归(5)的一个步骤计算鉴于和P(P)t吨|t吨−1.
该算法在每个时间步长的计算复杂度为𝒪(N个). 如果方程给出的(未规范化的)重要性权重(8)是上界的,则渐近收敛(N个→ ∞ ) 可以确保蒙特卡罗估计接近其真实值(Crisan,2001).
2.3. 扩展
模型和算法都有许多潜在的扩展。
2.3.1. 模型
对于线性高斯模型(1)–(2),我们可以很容易地考虑以下情况v(v)t吨和w个t吨相关和/或添加非线性项ϕ(年1:t吨−1)到等式的右边(2). 也可以应用上述边缘化方法进行分析整合(x个t吨)当模型(1)–(2)不是线性高斯,而是Shephard中描述的条件线性高斯时(1994); 这种扩展允许我们考虑高斯分布的有限或连续混合。
另一个有趣的扩展包括部分观察到的隐马尔可夫模型:(x个t吨)被建模为有限状态空间马尔可夫链
我们可以整合(x个t吨)并计算对(年k个|年1:k个−1)使用隐马尔可夫模型滤波器代替卡尔曼滤波器,作为上一节中开发的方法的一部分。
2.3.2. 算法
当重要性权重的分布倾斜,粒子多次选择重要性较高的权重;这将导致样品“耗尽”为大量颗粒实际上等于我≠j个为了执行样本“再生”,可以使用最近提出的基于马尔可夫链蒙特卡罗步骤的方法(Gilks和Berzuini,2001). 它包括应用于每个粒子一个(可能是非遍历的)转换核密度不变对(年1:t吨|z(z)1:t吨). 这个内核有无数种可能的选择。一种可能是及时更新t吨价值观年t吨−M(M)+1:t吨(M(M)>0)使用高效扫描取样器(de Jong,1997),其计算复杂度为𝒪(M(M)). 虽然这一步对于确保算法的理论收敛性来说不是必需的,但它可以改善结果。
3.模拟
3.1. 动态tobit模型
让我们考虑以下tobit模型(Manrique和Shephard,1998):
很明显,该模型的形式为(1)-(3)。我们选择“最佳”密度作为重要性密度对(年t吨|年1:t吨−1,z(z)t吨). (我们无法使用对(年t吨|年1:t吨−1)对于重要性密度,当z(z)t吨=0.在这种情况下,重要性权重不存在。)如果z(z)t吨>0,那么年t吨=z(z)t吨如果z(z)t吨=0,则
对于重要性权重,我们使用以下公式获得(7)
其中Φ(·)是标准正态分布的累积函数。
我们模拟了T型=200个具有已知超参数的观测值φ=0.99,和.对于不同数量的颗粒N个,我们生成了K(K)=100种不同的Rao–Blackwellized(RB)滤波器实现和标准算法估计对(x个0:t吨,年1:t吨|z(z)1:t吨)使用重要性密度对(x个t吨,年t吨|x个t吨−1,年t吨−1,z(z)t吨)作为对(x个t吨,年t吨|x个t吨−1,年t吨−1)无法使用。我们的比较是根据平方误差SE的平均值和方差进行的,计算如下:
哪里使用我粒子滤波的实现。我们在表格中列出1和2标准和RB滤波器的性能。对于固定数量的粒子,RB过滤器的计算强度不比标准过滤器高,并且性能显著更好。
算法. | 以下N值的结果:. |
---|
. | 100. | 250. | 500. | 1000. | 2500. | 5000. | 10000. | 25000. |
---|
标准过滤器 | 33.70 | 33.64 | 33.90 | 33.41 | 33.45 | 33.55 | 33.54 | 33.52 |
RB过滤器 | 33.52 | 33.49 | 33.51 | 33.50 | 33.50 | 33.49 | 33.51 | 33.50 |
算法. | 以下N值的结果:. |
---|
. | 100. | 250. | 500. | 1000. | 2500. | 5000. | 10000. | 25000. |
---|
标准过滤器 | 33.70 | 33.64 | 33.90 | 33.41 | 33.45 | 33.55 | 33.54 | 33.52 |
RB过滤器 | 33.52 | 33.49 | 33.51 | 33.50 | 33.50 | 33.49 | 33.51 | 33.50 |
算法. | 以下N值的结果:. |
---|
. | 100. | 250. | 500. | 1000. | 2500. | 5000. | 10000. | 25000. |
---|
标准过滤器 | 33.70 | 33.64 | 33.90 | 33.41 | 33.45 | 33.55 | 33.54 | 33.52 |
RB过滤器 | 33.52 | 33.49 | 33.51 | 33.50 | 33.50 | 33.49 | 33.51 | 33.50 |
算法. | 以下N值的结果:. |
---|
. | 100. | 250. | 500. | 1000. | 2500. | 5000. | 10000. | 25000. |
---|
标准过滤器 | 33.70 | 33.64 | 33.90 | 33.41 | 33.45 | 33.55 | 33.54 | 33.52 |
RB过滤器 | 33.52 | 33.49 | 33.51 | 33.50 | 33.50 | 33.49 | 33.51 | 33.50 |
算法. | 以下N值的结果:. |
---|
. | 100. | 250. | 500. | 1000. | 2500. | 5000. | 10000. | 25000. |
---|
标准过滤器 | 3.76 | 2.19 | 1.61 | 1.20 | 0.83 | 0.62 | 0.37 | 0.26 |
RB滤波器 | 2.50 | 1.30 | 1.21 | 0.99 | 0.51 | 0.38 | 0.29 | 0.14 |
算法. | 以下N值的结果:. |
---|
. | 100. | 250. | 500. | 1000. | 2500. | 5000. | 10000. | 25000. |
---|
标准过滤器 | 3.76 | 2.19 | 1.61 | 1.20 | 0.83 | 0.62 | 0.37 | 0.26 |
RB过滤器 | 2.50 | 1.30 | 1.21 | 0.99 | 0.51 | 0.38 | 0.29 | 0.14 |
算法. | 以下N值的结果:. |
---|
. | 100. | 250. | 500. | 1000. | 2500. | 5000. | 10000. | 25000. |
---|
标准过滤器 | 3.76 | 2.19 | 1.61 | 1.20 | 0.83 | 0.62 | 0.37 | 0.26 |
RB过滤器 | 2.50 | 1.30 | 1.21 | 0.99 | 0.51 | 0.38 | 0.29 | 0.14 |
算法. | 以下N值的结果:. |
---|
. | 100. | 250. | 500. | 1000. | 2500. | 5000. | 10000. | 25000. |
---|
标准过滤器 | 3.76 | 2.19 | 1.61 | 1.20 | 0.83 | 0.62 | 0.37 | 0.26 |
RB过滤器 | 2.50 | 1.30 | 1.21 | 0.99 | 0.51 | 0.38 | 0.29 | 0.14 |
3.2. 动态probit模型
我们在这里分析了一个非平稳的二进制时间序列,更具体地说,分析了(聚合的)东京降雨量数据集(Knorr-Held,1999). 它包括T型=366个观察值z(z)t吨=1表示下雨t吨年的第天和z(z)t吨否则=0。我们建模z(z)t吨通过使用动态probit模型,即。
其中(αt吨)通过使用二阶随机行走进行建模
(9)
让我们介绍一个人工的潜在过程(年t吨)这样的话
(10)
并定义
(11)
很容易检查我们是否有
我们可以很容易地改写方程式(9)–(11)在形式为(1)-(3)的状态空间模型中,通过定义
在这种情况下,作为(年t吨)是人为的,有必要将我们的程序与应用于估计对(x个0:t吨|z(z)1:t吨)而不是与对(x个0:t吨,年1:t吨|z(z)1:t吨). 引入的动机(年t吨)这是因为可以使用最佳密度作为重要性密度
这是一个截断高斯分布,并且,使用公式(7),我们获得
如果我们考虑对(x个0:t吨|z(z)1:t吨),由于相关的重要性权重,因此无法使用最佳密度对(z(z)t吨|x个t吨−1)不接受分析表达式。请注意(年t吨)已经用于开发高效的马尔可夫链蒙特卡罗采样器(Albert和Chib,1993).
超参数设置为0.01。在图中。1,我们显示观察结果z(z)t吨,E类{Φ(αt吨)|年1:t吨}和E类{Φ(αt吨)|年1:t吨}±√变量{Φ(αt吨)|年1:t吨};估计值是通过使用N个=1000个粒子。为了获得类似的结果,引导过滤器(Gordon等。,1993)需要多达N个=5000个粒子。
图1
(a) 二进制观测(z(z)t吨)和(b)E类{Φ(αt吨)|年1:t吨} (——)和E类{Φ(αt吨)|年1:t吨}±√变量{Φ(αt吨)|年1:t吨} (——)
4.结论
本文提出了一种部分观测高斯模型的递推状态估计方法。我们的算法是一种基于边缘化的SMC方法。这种边缘化是通过卡尔曼滤波方法实现的。我们的仿真表明,我们的方法可以显著优于标准SMC方法。
在本文中,模型参数λ假设已知。然而,结合此处开发的粒子滤波方法和Liu和West最近提出的方法,可以对这些参数进行批量和递归估计(2001).
致谢
我们感谢Leonhard Knorr-Held提供东京降雨量数据集,感谢Sanjeev Arulampalam、Nando de Freitas、Arthur Gretton和Elena Punskaya提出宝贵意见。
参考文献
©2002皇家统计学会