×

一种新的非线性马尔可夫跳跃系统辨识算法。 (英语) Zbl 07830628号

摘要:非线性马尔可夫跳跃系统(NMJS)的系统识别在建模包含未知连续和离散状态的复杂系统中至关重要。在这个系统中,连续状态的动力学由离散状态控制,这意味着系统可以在不同的模式之间运行。现有的研究主要是识别模态转移概率和噪声模型,而通常不考虑与非线性连续状态转移函数和观测函数有关的参数。为了识别所有参数,提出了一种基于新粒子系统的NMJSs识别算法。隐藏状态推断是通过包含新粒子系统和Rao-Blackwellized粒子Gibbs祖先采样内核的扩展平滑器实现的。平滑器不仅可以估计隐藏状态,而且可以更新非线性函数的参数。在推导出隐藏状态的后验密度后,利用基于对数似然的损失函数来减少识别与连续状态转移函数相关参数的不确定性。然后采用期望最大化和梯度下降更新参数。最后,通过不同的实验对所提算法进行了验证。结果表明,该算法能够逼近描述数据的参数,性能优于其他相关方法。

MSC公司:

93E12号机组 随机控制理论中的辨识
93埃14 随机控制理论中的数据平滑
93立方厘米10 控制理论中的非线性系统
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 赵,S。;Ahn,Choon K。;Shi,P。;Shmaley,Y。;Liu,F.,马尔可夫跳跃系统的贝叶斯状态估计:使用递归步骤和伪码,IEEE系统。,天啊,赛博。Mag.,5,2,27-36(2019)
[2] Aswin K.Ramasubramanian,Syed M.Aiman,N.Papakostas,《关于使用人类活动识别传感器提高协作移动机械手性能:回顾与展望》,Procedia CIRP 97(2021)211-216,CIRP组装技术与系统会议。doi:10.1016/j.procir.2020.05.227。
[3] Richa,E。;波德,M。;巴克,R。;Driessen,H.,用于多传感器目标跟踪行为分类的跳跃-马尔可夫非线性系统识别,(信息融合国际会议(Fusion)(2019),IEEE),1-8
[4] Lian,J。;李,S。;Liu,J.,正马尔可夫跳跃非线性系统的T-S模糊控制,IEEE Trans。模糊系统。,26, 4, 2374-2383 (2018)
[5] 顾毅。;Park,J.H。;沈,M。;Liu,D.,通过自适应扰动观测器方法对抗一般转移概率和多重扰动的马尔可夫跳跃系统的事件触发控制,Inf.Sci。,608, 1113-1130 (2022)
[6] 维杰·阿拉文德(Vijay Aravind,R.)。;Balasubramaniam,P.,切换Takagi-Sugeno模糊非线性系统基于驻留时间相关记忆的状态反馈控制器设计,信息科学。,609, 838-854 (2022)
[7] 马,C。;Fu,H。;Wu,W.,具有非匹配模式相关非线性的延迟半马尔可夫跳跃系统的异步故障检测,信息科学。,587, 679-691 (2022)
[8] Dai,W。;Serletis,A.,《关于通货膨胀的马尔可夫转换福利成本》,J.Econ。动态。控制,108,第103748条pp.(2019)·兹比尔1425.91314
[9] 安德烈·布拉加。;弗里奇,C。;Gustafsson,F。;Bruno,Marcelo G.S.,跳跃马尔可夫非线性系统的快速系统识别,(多传感器自适应处理(CAMSAP)计算进展国际研讨会(2017),IEEE),1-5
[10] Balenzuela,M.P。;Wills,A.G。;伦顿,C。;Ninness,B.,跳跃马尔可夫线性系统的参数估计,Automatica,135,文章109949 pp.(2022)·Zbl 1478.93678号
[11] 特雷弗·T·阿什利。;Andersson,Sean B.,跳马尔可夫状态空间模型系统识别的序贯蒙特卡罗框架,(美国控制会议(2014),IEEE),1144-1149
[12] Thomas B.Schön。;Wills,A。;Ninness,B.,非线性状态空间模型的系统识别,Automatica,47,1,39-49(2011)·Zbl 1209.93155号
[13] Lindsten,F。;乔丹,迈克尔一世。;Schön,Thomas B.,《具有祖先采样的粒子吉布斯》,J.Mach。学习。第15号决议,2145-2184(2014年)·兹伯利1319.60151
[14] Delyon,B。;拉维耶,M。;Moulines,E.,EM算法的随机近似版本的收敛性,Ann.Stat.,94-128(1999)·Zbl 0932.62094号
[15] F.Lindsten,《使用条件粒子滤波器的高效随机近似EM算法》,载于:IEEE声学、语音和信号处理国际会议,2013年,第6274-6278页。doi:10.1109/ICASSP.2013.6638872。
[16] Papeí,M.,识别跳跃马尔可夫非线性模型的粒子随机近似EM算法,IFAC-PapersOnLine,51,15,676-681(2018)
[17] Doucet,A。;Godsill,S。;Andrieu,C.,《贝叶斯滤波的序贯蒙特卡罗采样方法》,《统计计算》。,10, 3, 197-208 (2000)
[18] Mayne,David Q.,线性动力系统平滑问题的解决方案,Automatica,4,2,73-92(1966)·兹比尔0146.37801
[19] 厄兹坎,E。;Lindsten,F。;弗里奇,C。;Gustafsson,F.,跳跃马尔可夫非线性系统的递归最大似然辨识,IEEE Trans。信号处理。,63, 3, 754-765 (2014) ·兹比尔1394.94438
[20] Diederik P.Kingma,J.Ba,Adam:随机优化方法,arXiv预印本arXiv:1412.6980(2014)。
[21] Sun,T。;Tang,K。;Li,D.,带浮点数的梯度下降学习,IEEE Trans。赛博。(2020)
[22] Orguner,美国。;Demirekler,M.,跳跃马尔可夫线性系统转移概率估计的在线序列算法,Automatica,42,10,1735-1744(2006)·兹比尔1114.93103
[23] Wang,Z。;安·H。;Luo,X.,慢切换Hammerstein系统的切换检测和鲁棒参数估计,非线性分析:混合系统,32,202-213(2019)·Zbl 1425.93271号
[24] 安德烈·布拉加。;弗里奇,C。;Gustafsson,F。;Bruno,Marcelo G.S.,跳跃Markov非线性系统的基于梯度的递归最大似然识别,(信息融合国际会议(Fusion)(2017),IEEE),1-7
[25] 威廉·雅各布斯(William R.Jacobs)。;Baldachino,T。;多德,T。;Anderson,Sean R.,使用变分推理的稀疏贝叶斯非线性系统辨识,IEEE Trans。自动。控制,63,12,4172-4187(2018)·Zbl 1423.93378号
[26] Wigren,A。;沃格伯格,J。;Lindsten,F。;阿德里安·威尔斯(Adrian G.Wills)。;Schön,Thomas B.,《非线性系统识别:使用顺序蒙特卡罗方法学习并尊重物理模型》,IEEE控制系统。Mag.,42,1,75-102(2022)
[27] 肖邦,N。;Papaspiliopoulos,O.,序列蒙特卡罗导论(2020)·Zbl 1453.62005年
[28] Ahn,Choon K。;Shi,P。;Shmaley,Y。;Liu,F.,马尔可夫跳跃系统的贝叶斯状态估计:采用递归步骤和伪码,IEEE系统。,天啊,赛博。Mag.,5,2,27-36(2019)
[29] A.Doucet,Adam M.Johansen,《粒子滤波与平滑教程:十五年后》,《非线性滤波手册》12(656-704)(2009)3。
[30] Thomas B.Schön。;Lindsten,F。;Dahlin,J。;沃格伯格,J。;克里斯蒂安·纳赛斯(Christian A.Naesseth)。;Svensson,A。;Dai,L.,系统识别的序贯蒙特卡罗方法,IFAC-PapersOnLine,48,28,775-786(2015)
[31] Nguyen,Thi L.T。;Septier,F。;Peters,Gareth W。;Delignon,Y.,《贝叶斯推理的高效序贯蒙特卡罗采样器》,IEEE Trans。信号处理。,第64页,第5页,第1305-1319页(2015年)·Zbl 1412.94067号
[32] Dunn,W.L。;Shultis,J.K.,第6章-马尔可夫链蒙特卡罗,(Dunn,W.L.;Shultis and J.K.:探索蒙特卡罗方法(2023),爱思唯尔出版社),189-254
[33] 马蒂诺,L。;Elvira,V.,《压缩蒙特卡罗及其在粒子滤波中的应用》,《信息科学》。,553, 331-352 (2021) ·Zbl 1484.65006号
[34] 肖邦,N。;Singh,Sumeetpal S.,《关于颗粒吉布斯取样》,伯努利,21,3,1855-1883(2015)·Zbl 1333.60164号
[35] B.Miasojedow,W.Niemiro,马尔可夫跳跃过程的粒子吉布斯算法,arXiv预印本arXiv:1505.01434(2015)。
[36] A.Wigren,Riccardo S.Risuleo,L.Murray,F.Lindsten,粒子吉布斯采样中的参数消除,arXiv预印本arXiv:1910.14145(2019)。
[37] Cheng,C。;Tourneret,Jean-Yves,具有未知转移概率的跳跃马尔可夫非线性系统的变分边缘化粒子滤波器,《信号处理》,188,第108226页,(2021)
[38] 佩廷,Y。;Desbouvries,F.,《进一步实现跳跃马尔可夫状态空间系统的Rao-Blackwelling算法》(信息科学、信号处理及其应用国际会议(ISSPA)(2012),IEEE),706-711
[39] 萨哈,S。;Hendeby,G.,《马尔可夫调制非线性动态系统的Rao-Blackwellized粒子滤波器》,(统计信号处理研讨会(SSP)(2014),IEEE),272-275
[40] Svensson,A。;Thomas B.Schön。;Lindsten,F.,使用粒子滤波器识别跳跃马尔可夫线性模型,(决策与控制会议(2014),IEEE),6504-6509
[41] 郑,F。;德里德,S。;Pieczynski,W.,切换马尔可夫系统中的参数估计和无监督平滑,IEEE Trans。自动。控制,64,4,1761-1767(2019)·Zbl 1482.62086号
[42] O.施瓦茨。;甘诺,S。;Habets,Emanuël A.P.,一种用于相干矩阵估计的多麦克风语音去混响和降噪的期望最大化算法,IEEE/ACM Trans。音频、语音、语言处理。,24, 9, 1495-1510 (2016)
[43] 多尔凡,Y。;Plinge,A。;哈赞,G。;Gannot,S.,混响环境中扬声器定位的分布式期望最大化算法,IEEE/ACM Trans。音频、语音、语言处理。,26, 3, 682-695 (2017)
[44] 霍斯特勒,R。;南卡罗来纳州。;Godsil,Simon J.,Rao Blackwellized particle MCMC用于时空高斯过程中的参数估计,(第27届信号处理机器学习国际研讨会(MLSP)(2017),IEEE),1-6
[45] 堪萨斯州。;Doucet,A。;Sumeetpal S.Singh。;Maciejowski,J。;肖邦,N.,《状态空间模型中参数估计的粒子方法》,《统计科学》。,30, 3, 328-351 (2015) ·Zbl 1332.62096号
[46] Umenberger,J。;Thomas B.Schön。;Lindsten,F.,通过自适应恒温器对状态空间模型进行贝叶斯识别,(决策与控制会议(CDC)(2019年),IEEE),7382-7388
[47] 陈,F。;丁·F。;徐,L。;Hayat,T.,带自回归滑动平均噪声的多变量系统基于数据滤波的最大似然扩展梯度法,J.Franklin Inst.,355,7,3381-3398(2018)·Zbl 1390.93879号
[48] W.Song、J.Wang、D.Wang、C.Wang和J.Shan,跳马尔可夫非线性系统的远程状态估计:随机事件触发方法,收录于:国际控制、决策和信息技术会议(CoDIT),2020年第1卷,第1099-1104页。doi:10.1109/CoDIT49905.2020.9263908。
[49] 阿瑟·邓普斯特(Arthur P.Dempster)。;Laird,Nan M。;Donald B.Rubin,《通过EM算法从不完整数据中获取最大似然》,J.Roy。Stat.Soc.:序列号。B(Methodol.),39,1,1-22(1977)·Zbl 0364.62022号
[50] Lawrence R.Rabiner,语音识别中隐藏马尔可夫模型和选定应用教程,Proc。IEEE,77,2,257-286(1989)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。