×

粒子近似对最佳滤波器导数的偏移。 (英语) Zbl 1456.93006号

摘要:在许多应用程序中,状态空间模型依赖于需要在线从数据中推断出的参数。在最大似然法中,这可以通过随机梯度搜索实现,其中潜在的梯度估计基于最优滤波器和最优滤波器导数。然而,对于非线性状态空间模型,最优滤波器及其导数是不可解析的,需要进行数值逼近。[G.波伊亚吉斯等人,《生物统计学》98,第1期,65–80页(2011年;Zbl 1214.62093号)],提出了该导数的粒子近似,同时在中建立了相应的中心极限定理和(L_p)误差界[P.Del道德等,SIAM J.控制优化。53,编号3,1278-1304(2015年;Zbl 1349.65010号)]. 我们在这里导出了这个粒子近似的偏差的界。在混合条件下,这些界限在时间上是一致的,并且与粒子数成反比。

MSC公司:

93E11号机组 随机控制理论中的滤波
93C20美元 偏微分方程控制/观测系统
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] C.Andrieu、A.Doucet、S.S.Singh和V.B.Tadicí,《变化检测、系统识别和控制的粒子方法》,Proc。IEEE,92(2004),第423-438页。
[2] P.Breímaud,《离散概率模型和方法》,Springer-Verlag,柏林,2017年·Zbl 1386.60003号
[3] O.Cappeé,E.Moulines和T.Ryden,《隐马尔可夫模型中的推断》,Springer-Verlag,柏林,2005年·Zbl 1080.62065号
[4] D.Crisan和B.Rozovskii编辑,《牛津非线性滤波手册》,牛津大学出版社,牛津,2011年·Zbl 1210.60005号
[5] P.Del Moral和A.Guionnet,《关于相互作用过程的稳定性及其在过滤和遗传算法中的应用》,Ann.Inst.H.Poincareí,Probab。Stat.,37(2001),第155-194页·Zbl 0990.60005号
[6] P.Del Moral,Feynman-Kac Formulae,Springer-Verlag,柏林,2004年。
[7] P.Del Moral,蒙特卡洛积分平均场模拟,CRC出版社,佛罗里达州博卡拉顿,2013年·兹比尔1282.65011
[8] P.Del Moral、A.Doucet和G.W.Peters,Feynman-Kac粒子模型混沌估计的尖锐传播,理论概率。申请。,51(2007),第459-485页·Zbl 1156.60072号
[9] P.Del Moral、A.Doucet和S.S.Singh,Feynman-Kac公式的反向解释,ESAIM数学。模型。数字。分析。,44(2010年),第947-975页·Zbl 1209.65009号
[10] P.Del Moral、P.Jacob、A.Lee、L.Murray和G.W.Peters,《带几何相互作用跳跃的Feynman-Kac粒子积分》,斯托克。分析。申请。,31(2013),第830-871页·Zbl 1293.62166号
[11] P.Del Moral、A.Doucet和S.S.Singh,最优滤波器导数粒子近似的一致稳定性,SIAM J.Control Optim。,53(2015),第1278-1304页·Zbl 1349.65010号
[12] P.Del Moral和A.Jasra,Feynman-Kac粒子模型的尖锐一阶分析,第一部分:混沌传播,随机过程。申请。,128(2018),第332-353页·Zbl 1392.60076号
[13] R.Douc,E.Moulines和T.Ryden,马尔可夫状态自回归模型中最大似然估计量的渐近性质,Ann.Statist。,32(2004),第2254-2304页·Zbl 1056.62028号
[14] R.Douc、E.Moulines和D.S.Stoffer,《非线性时间序列:理论、方法和应用与R示例》,CRC出版社,佛罗里达州博卡拉顿,2014年·Zbl 1306.62026号
[15] A.Doucet,N.de Freitas和N.Gordon,eds.,《序贯蒙特卡罗方法在实践中的应用》,Springer-Verlag出版社,柏林,2001年·Zbl 0967.00022号
[16] N.Kantas、A.Doucet、S.S.Singh、J.Maciejowski和N.Chopin,关于状态空间模型中参数估计的粒子方法,Statist。科学。,30(2015),第328-351页·Zbl 1332.62096号
[17] F.Le Gland和L.Meível,隐马尔可夫模型中的递归估计,《第36届决策与控制会议论文集》,1997年,第3468-3473页。
[18] F.Le Gland和L.Meível,隐马尔可夫模型中的指数遗忘和几何遍历性,数学。《控制信号系统》,13(2000),第63-93页·Zbl 0941.93053号
[19] F.Le Gland和N.Oudjane,使用Hilbert度量的非线性滤波器的稳定性和一致逼近以及粒子滤波器的应用,Ann.Appl。概率。,14(2004),第144-187页·Zbl 1060.93094号
[20] J.Olsson和J.Westerborn Alenlo¨v,基于粒子的切线滤波器在线估计及其在非线性状态空间模型参数估计中的应用,《Ann.Inst.Statist》。数学。,72(2020年),第545-576页·Zbl 1469.62327号
[21] N.Oudjane和S.Rubenthaler,非遍历信号下非线性滤波器的稳定性和均匀粒子近似,Stoch。分析。申请。,23(2005),第421-448页·Zbl 1140.93485号
[22] G.Poyiadjis、A.Doucet和S.S.Singh,状态空间模型中分数和观测信息矩阵的粒子近似及其在参数估计中的应用,Biometrika,98(2011),第65-80页·Zbl 1214.62093号
[23] V.B.Tadicí和A.Doucet,一般状态空间模型中最优滤波的指数遗忘和几何遍历性,随机过程。申请。,115(2005),第1408-1436页·Zbl 1074.60051号
[24] V.B.Tadicí和A.Doucet,随机梯度搜索的渐近偏差,Ann.Appl。概率。,27(2017),第3255-3304页·Zbl 1387.49044号
[25] V.Z.B.Tadić和A.Doucet,非线性状态空间模型中递归最大似然估计的渐近性质,IEEE Trans。通知。理论,出现在arXiv:1806.095712021。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。