×

离散状态空间马尔可夫模型中在线参数估计的嵌套粒子滤波器。 (英语) Zbl 1414.62346号

摘要:我们解决了用序贯蒙特卡罗方法逼近状态空间动力系统固定参数的后验概率分布的问题。该方法依赖于一种嵌套结构,该结构使用两层粒子滤波器来近似感兴趣系统静态参数和动态状态变量的后验概率测度,类似于最近的“序贯蒙特卡罗平方”(SMC)算法。然而,与SMC\(^{2}\)方案不同,所提出的技术以纯粹递归的方式操作。特别是,本文介绍的方法的递归步骤的计算复杂性随着时间的推移是恒定的。我们分析了实数有界函数积分对通过该方案计算的系统参数后验分布的逼近。结果,我们证明了在正则性假设下,近似误差在(L_{p})((p\geq1))中渐近消失收敛速度与\(frac{1}{\sqrt{N}}+\frac{1}}{\scrt{M}}\)成正比,其中\(N\)是参数空间中的Monte Carlo样本数,\(N\times M\)是状态空间中的样本数。这一结果也适用于参数和状态变量的联合后验分布的近似。我们讨论了SMC(^{2})算法和新递归方法之间的关系,并给出了一个简单的示例,以通过计算机模拟来说明一些理论结果。

MSC公司:

62米05 马尔可夫过程:估计;隐马尔可夫模型
62平方米 随机过程的推断与预测
2015年1月62日 贝叶斯推断
60J10型 马尔可夫链(离散状态空间上的离散时间马尔可夫过程)
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Andrieu,C.、Doucet,A.和Holenstein,R.(2010年)。粒子马尔可夫链蒙特卡罗方法。J.R.统计社会服务。B Stat.方法。72 269-342. ·Zbl 1184.65001号
[2] Andrieu,C.、Doucet,A.、Singh,S.S.和Tadić,V.B.(2004)。用于变化检测、系统识别和控制的粒子方法。程序。IEEE 92 423-438。
[3] Beskos,A.、Crisan,D.和Jasra,A.(2014)。高维序贯蒙特卡罗方法的稳定性。附录申请。普罗巴伯。24 1396-1445. ·Zbl 1304.82070号 ·doi:10.1214/13-AAP951
[4] Bruno,M.G.S.(2013)。非线性离散时间滤波的序贯蒙特卡罗方法。信号处理综合讲座6 1-99·Zbl 1386.93286号
[5] Cappé,O.、Godsill,S.J.和Moulines,E.(2007年)。序贯蒙特卡罗的现有方法和最新进展概述。程序。IEEE 95 899-924。
[6] Cappé,O.、Guillin,A.、Marin,J.M.和Robert,C.P.(2004)。人口蒙特卡洛。J.计算。图表。统计师。13 907-929.
[7] Carvalho,C.M.、Johannes,M.S.、Lopes,H.F.和Polson,N.G.(2010年)。粒子学习和平滑。统计师。科学。25 88-106. ·兹比尔1328.62541 ·doi:10.1214/10-STS325
[8] Chen,R.、Wang,X.和Liu,J.S.(2000)。通过混合卡尔曼滤波在平坦信道中进行自适应联合检测和解码。IEEE Trans。通知。理论46 2079-2094·Zbl 1001.94008号 ·doi:10.1109/18.868479
[9] 肖邦,N.(2002)。静态模型的序列粒子滤波方法。生物特征89 539-551·Zbl 1036.62062号 ·doi:10.1093/biomet/89.3.539
[10] 肖邦,N.,雅各布,P.E.和帕帕斯皮利奥普洛斯,O.(2013)\(\text{SMC}^2 \):一种用于状态空间模型序列分析的有效算法。J.R.统计社会服务。B.统计方法。75 397-426. ·Zbl 1411.62242号
[11] Chorin,A.J.和Krause,P.(2004)。贝叶斯滤波器的降维。程序。国家。阿卡德。科学。美国101 15013-15017·Zbl 1135.93377号 ·doi:10.1073/pnas.0406222101
[12] Crisan,D.(2001)。颗粒过滤器——理论观点。《序贯蒙特卡罗方法在实践中的应用》(A.Doucet,N.de Freitas和N.Gordon编辑)。统计工程信息科学。17-41. 纽约:斯普林格·Zbl 1056.93573号
[13] Crisan,D.和Doucet,A.(2002年)。针对从业人员的粒子滤波方法收敛结果调查。IEEE传输。信号处理。50 736-746. ·Zbl 1369.60015号 ·doi:10.1109/78.984773
[14] Del Moral,P.(2004)。费曼-卡克公式:谱系和相互作用粒子系统及其应用。概率论及其应用(纽约)。纽约:斯普林格·Zbl 1130.60003号
[15] Del Moral,P.、Doucet,A.和Singh,S.S.(2015)。最优滤波器导数的粒子近似的一致稳定性。SIAM J.控制优化。53 1278-1304. ·Zbl 1349.65010号 ·数字对象标识代码:10.1137/140993703
[16] Del Moral,P.和Miclo,L.(2000)。Feynman-Kac公式的分支和相互作用粒子系统近似及其在非线性滤波中的应用。数学课堂笔记。1729 1-145. 柏林:斯普林格·Zbl 0963.60040号
[17] Douc,R.、Cappé,O.和Moulines,E.(2005年)。粒子滤波重采样方案的比较。第四届图像和信号处理与分析国际研讨会论文集64-69。
[18] Doucet,A.、de Freitas,N.和Gordon,N.(2001年)。序贯蒙特卡罗方法简介。《序贯蒙特卡罗方法在实践中的应用》(A.Doucet,N.de Freitas和N.Gordon编辑)。《统计工程信息科学》。3-14. 纽约:斯普林格·Zbl 1056.93576号
[19] Doucet,A.、Godsill,S.和Andrieu,C.(2000)。贝叶斯滤波的序贯蒙特卡罗抽样方法。统计计算。10 197-208.
[20] Fearnhead,P.(2002)。马尔可夫链蒙特卡罗、充分统计和粒子滤波器。J.计算。图表。统计师。11 848-862.
[21] Gilks,W.R.和Berzuini,C.(2001年)。遵循动态贝叶斯模型的移动目标蒙特卡罗推断。J.R.统计社会服务。B Stat.方法。63 127-146. ·Zbl 0976.62021号 ·doi:10.1111/1467-9868.00280
[22] Gordon,N.、Salmond,D.和Smith,A.F.M.(1993)。非线性和非高斯贝叶斯状态估计的新方法。IEE程序。传真140 107-113。
[23] Kantas,N.、Doucet,A.、Singh,S.S.、Maciejowski,J.和Chopin,N.(2015)。状态空间模型参数估计的粒子方法。统计师。科学。30 328-351. ·Zbl 1332.62096号 ·doi:10.1214/14-STS511
[24] Kitagawa,G.(1996年)。非高斯非线性状态空间模型的蒙特卡罗滤波器和平滑器。J.计算。图表。统计师。5 1-25.
[25] Kitagawa,G.(1998年)。自组织状态空间模型。J.Amer。统计师。协会1203-1215。
[26] Koblents,E.和Míguez,J.(2013)。具有变换权重的总体蒙特卡罗方法及其在随机动力学模型中的应用。统计计算·Zbl 1331.65015号
[27] Koblents,E.和Míguez,J.(2015)。具有变换权重的总体蒙特卡罗方法及其在随机动力学模型中的应用。统计计算。25 407-425. ·Zbl 1331.65015号 ·doi:10.1007/s11222-013-9440-2
[28] Kong,A.、Liu,J.S.和Wong,W.H.(1994年)。顺序输入和贝叶斯缺失数据问题。J.Amer。统计师。协会9 278-288·Zbl 0800.62166号 ·doi:10.1080/01621459.1994.10476469
[29] LeGland,F.和Mevel,L.(1997)。隐马尔可夫模型中的递归估计。第36届IEEE决策与控制会议记录4 3468-3473。电气与电子工程师协会。
[30] Liu,J.和West,M.(2001)。基于模拟的滤波中的参数和状态估计组合。《序贯蒙特卡罗方法在实践中》(A.Doucet,N.de Freitas和N.Gordon,eds.)。统计工程信息科学。197-223. 纽约:斯普林格·Zbl 1056.93583号
[31] Liu,J.S.和Chen,R.(1998)。动态系统的序贯蒙特卡罗方法。J.Amer。统计师。协会93 1032-1044·Zbl 1064.65500号 ·doi:10.1080/01621459.1998.10473765
[32] Lorenz,E.N.(1963年)。确定性非周期流动。J.大气。科学。20 130-141. ·Zbl 1417.37129号 ·doi:10.1175/1520-0469(1963)020<0130:DNF>2.0.CO;2
[33] Maíz,C.S.、Molanes-López,E.M.、Míguez,J.和Djurić,P.M.(2012)。用于处理被离群值破坏的时间序列的粒子滤波方案。IEEE传输。信号处理。60 4611-4627·Zbl 1393.94350号
[34] Miguez,J.、Bugallo,M.和Djuric,P.M.(2005)。用于动态系统中固定参数估计的新粒子滤波算法。第四届图像与信号处理与分析国际研讨会论文集46-51。电气与电子工程师协会。
[35] Míguez,J.、Crisan,D.和Djurić,P.M.(2013年)。关于最大后验序列估计和随机全局优化的两种序贯蒙特卡罗方法的收敛性。统计计算。23 91-107. ·Zbl 1322.65004号
[36] Olsson,J.、Cappé,O.、Douc,R.和Moulines,E.(2008)。序贯蒙特卡罗平滑及其在非线性状态空间模型参数估计中的应用。伯努利14 155-179·Zbl 1155.62055号 ·doi:10.3150/07-BEJ6150
[37] Papavasiliou,A.(2006年)。随机滤波中的参数估计和渐近稳定性。随机过程。申请。116 1048-1065·Zbl 1097.62093号 ·doi:10.1016/j.spa.2006.01.002
[38] Poyiadjis,G.、Doucet,A.和Singh,S.S.(2011年)。状态空间模型中分数和观测信息矩阵的粒子近似及其在参数估计中的应用。生物特征98 65-80·Zbl 1214.62093号 ·doi:10.1093/biomet/asq062
[39] Ristic,B.、Arulampalam,S.和Gordon,N.(2004年)。超越卡尔曼滤波器:用于跟踪应用程序的粒子滤波器。波士顿:Artech House·Zbl 1092.93041号
[40] Storvik,G.(2002)。存在未知静态参数的状态空间模型的粒子滤波器。IEEE传输。信号处理。50 281-289.
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。