×

基于策略迭代的自适应动态规划离散时间非线性马尔可夫跳跃系统的动态事件触发控制。 (英语) Zbl 1520.93324号

摘要:通过探索策略迭代(PI)自适应动态规划(ADP)算法,研究了离散时间(DT)非线性马尔可夫跳跃系统(MJS)的动态事件触发最优控制问题。利用在线PI算法更新各子系统中定义的性能指标函数(PIF),并通过求解最优PIF导出相应的控制策略。然后,我们采用神经网络(NN)技术,包括行动者网络和批判网络,来估计迭代PIF和控制策略。此外,设计的动态事件触发机制(DETM)用于避免在更新估计的迭代控制策略时浪费额外资源。最后,基于李亚普诺夫差分方法,证明了在所设计的控制方案下,系统的稳定性和所有信号的收敛性都得到了保证。通过一个具有两种系统模式的DT非线性MJS的仿真实例,验证了控制设计方案的可行性。

MSC公司:

93元65角 离散事件控制/观测系统
93C55美元 离散时间控制/观测系统
93立方厘米 控制理论中的非线性系统
93E03型 控制理论中的随机系统(一般)
93C40型 自适应控制/观测系统
90立方厘米 动态编程
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Walker,B.K.,使用马尔可夫建模技术评估自动可重构航空航天系统的性能和可靠性,(动态过程系统的可靠性和安全评估(1994),Springer),101-126
[2] 吴,H.-N。;Cai,K.-Y.,通过模糊控制实现不确定马尔可夫跳跃非线性系统的模态无关鲁棒镇定,IEEE Trans。系统。人类网络。B、 36、3、509-519(2006)
[3] Yin,Y。;Shi,P。;刘,F。;Teo,K.L。;Lim,C.-C.,非线性非齐次马尔可夫跳跃系统的模糊逼近鲁棒滤波,IEEE Trans。赛博。,45, 9, 1706-1716 (2014)
[4] 张,L。;宗,G。;X.赵。;赵,N.,多网络攻击下奇异马尔可夫跳跃系统事件触发控制的输出可达集综合,IEEE/ACM Trans。净值。,1-9 (2022)
[5] 张,L。;宁,Z。;Shi,P.,具有时变时滞和不确定丢包率的模糊马尔可夫跳跃系统的输入输出控制方法,IEEE Trans。赛博。,45, 11, 2449-2460 (2014)
[6] 陶,J。;鲁·R。;Shi,P。;苏,H。;Wu,Z.-G.,带执行器故障的模糊马尔可夫跳跃系统基于耗散的可靠控制,IEEE Trans。赛博。,47, 9, 2377-2388 (2016)
[7] 赵,D。;Karimi,H.R。;萨克西维尔,R。;Li,Y.,具有间歇执行器故障的非线性马尔可夫跳跃系统的非脆弱容错控制,非线性分析。混合系统。,32, 337-350 (2019) ·Zbl 1425.93264号
[8] 张,L。;X.赵。;Zhao,N.,混合时滞中立型奇异马尔可夫跳跃系统的实时可达集控制,IEEE Trans。电路系统。二、 69、3、1367-1371(2022年)
[9] Z.Feng。;Shi,P.,奇异随机马尔可夫跳跃系统的滑模控制,IEEE Trans。自动化。控制,62,8,4266-4273(2017)·Zbl 1373.93305号
[10] 张,H。;Wang,H。;牛,B。;张,L。;Ahmad,A.M.,具有平均驻留时间的切换非线性系统的基于滑模表面的自适应actor-critic最优控制,Inform。科学。,580, 756-774 (2021)
[11] 高,Y。;Liu,Y.-J.,混沌离散时间系统的直接启发式动态规划自适应模糊最优控制,J.Vib。控制,22,2595-603(2016)
[12] Mu,C。;镍,锌。;Sun,C。;He,H.,基于自适应动态规划的吸气式高超声速飞行器跟踪控制,IEEE Trans。神经网络。学习。系统。,28, 3, 584-598 (2016)
[13] 王,B。;赵,D。;Alippi,C。;Liu,D.,状态时滞非线性离散时间不确定系统的双重启发式动态规划,神经计算,134222-229(2014)
[14] 王,D。;刘,D。;赵,D。;黄,Y。;Zhang,D.,一种基于神经网络的迭代GDHP方法,用于解决一类具有控制约束的非线性最优控制问题,neural Comput。申请。,22, 2, 219-227 (2013)
[15] Sokolov,Y。;Kozma,R。;Werbos,L.D。;Werbos,P.J.,启发式近似动态规划控制设计的完全稳定性分析,Automatica,59,9-18(2015)·Zbl 1338.90442号
[16] Zhao,Y。;Wang,H。;徐,N。;宗,G。;Zhao,X.,基于强化学习的受限互联非线性系统分散容错控制,混沌孤子分形,167,第113034页,(2023)
[17] 魏,Q。;刘易斯,F.L。;刘,D。;宋,R。;Lin,H.,离散时间局部值迭代自适应动态规划:收敛分析,IEEE Trans。系统。人类网络。A、 48,6875-891(2016)
[18] 张,H。;X.赵。;Wang,H。;宗,G。;Xu,N.,具有未知扰动的切换非线性系统的基于分层滑模表面的自适应actor-critic最优控制,IEEE Trans。神经网络。学习。系统。,1-12 (2022)
[19] 彭,Z。;Zhao,Y。;胡,J。;Ghosh,B.K.,离散时间多智能体系统的数据驱动最优跟踪控制与两阶段策略迭代算法,Inform。科学。,481, 189-202 (2019) ·Zbl 1451.93228号
[20] 魏,Q。;刘,D。;林,Q。;Song,R.,通过局部策略迭代自适应动态规划实现离散时间最优控制,IEEE Trans。赛博。,47, 10, 3367-3379 (2016)
[21] 林,Q。;魏,Q。;Liu,D.,一类离散非线性系统的新型最优跟踪控制方案,使用广义策略迭代自适应动态规划算法,Internat。系统科学杂志。,48, 3, 525-534 (2017) ·Zbl 1358.93076号
[22] 钟,X。;他,H。;张,H。;Wang,Z.,使用自适应动态规划的未知离散时间非线性马尔可夫跳跃系统的最优控制,IEEE Trans。神经网络。学习。系统。,25, 12, 2141-2155 (2014)
[23] 姜浩。;张,H。;罗,Y。;Wang,J.,使用基于数据的强化学习方法实现完全未知非线性离散时间Markov跳跃系统的最优跟踪控制,神经计算,194176-182(2016)
[24] 李,Y。;Wang,H。;X.赵。;Xu,N.,通过命令滤波实现不确定分数阶非严格反馈非线性系统的事件触发自适应跟踪控制,国际鲁棒非线性控制,32,14,7987-8011(2022)
[25] 唐,F。;牛,B。;宗,G。;X.赵。;Xu,N.,基于强化学习的非线性离散时间系统周期事件触发自适应跟踪控制设计,神经网络。,154, 43-55 (2022) ·Zbl 1525.93256号
[26] 曹,Z。;牛,B。;宗,G。;Xu,N.,通过事件触发通信对切换网络非线性系统基于Small-gain技术的自适应输出约束控制设计,非线性分析。混合系统。,47, 101299 (2023) ·Zbl 1505.93122号
[27] Zhao,Y。;唐,F。;宗,G。;X.赵。;Xu,N.,具有周期性扰动的非线性多智能体系统的基于事件的自适应包容控制,IEEE Trans。电路系统。二、 69、12、5049-5053(2022年)
[28] 曹毅。;Zhao,N。;徐,N。;X.赵。;Alsaadi,F.E.,未知控制方向切换非线性系统基于最小近似的自适应事件触发控制,电子,11,20,3386(2022)
[29] 李,Y。;牛,B。;宗,G。;赵,J。;Zhao,X.,带时变全状态约束和非对称输入饱和的随机非线性系统基于命令滤波器的自适应神经有限时间控制,国际。《系统科学杂志》,53,1,199-221(2022)·Zbl 1483.93553号
[30] 张,P。;刘,T。;蒋志平,具有事件触发控制器的非线性离散系统的输入-状态镇定,系统控制快报。,103, 16-22 (2017) ·Zbl 1370.93235号
[31] 李强。;沈,B。;刘,Y。;Alsaadi,F.E.,具有马尔可夫跳跃参数和时变延迟的离散时间随机遗传调控网络的事件触发状态估计,神经计算,174,912-920(2016)
[32] Rakkiyappan,R。;Maheswari,K。;Velmurugan,G。;Park,J.H.,带量化的半马尔可夫跳变离散时间神经网络的事件触发状态估计,神经网络。,105, 236-248 (2018) ·Zbl 1441.93304号
[33] 沈,H。;苏·L。;吴振国。;Park,J.H.,使用事件触发采样信息方案的马尔可夫跳跃系统的可靠耗散控制,非线性分析。混合系统。,25, 41-59 (2017) ·Zbl 1377.93105号
[34] Wang,H。;张,D。;Lu,R.,带量化的马尔可夫跳跃系统的事件触发(H_\infty)滤波器设计,非线性分析。混合系统。,28, 23-41 (2018) ·Zbl 1380.93261号
[35] 吴,X。;Mu,X.,具有随机发生不确定性和传输延迟的网络化非线性半马尔可夫跳跃系统的事件触发控制,Inform。科学。,487, 84-96 (2019) ·兹比尔1454.93168
[36] 李,M。;刘,M。;Zhang,Y.,半马尔可夫跳跃系统的异步自适应量化反馈滑模控制:事件触发方法,非线性分析。混合系统。,第36条,第100853页(2020年)·Zbl 1441.93048号
[37] Ge,X。;韩庆林。;Wang,Z.,无线传感器网络上分布式集员估计的动态事件触发传输方案,IEEE Trans。赛博。,49, 1, 171-183 (2017)
[38] Girard,A.,事件触发控制的动态触发机制,IEEE Trans。自动化。控制,60,71992-1997(2014)·Zbl 1360.93423号
[39] 蔡,J。;温,C。;Xing,L。;Qiuzhen,Y.,具有非三角形结构不确定性的互联系统的分散反推控制,IEEE Trans。自动化。控制,1-12(2022)
[40] Long,L。;Wang,J.,非线性系统的安全临界动态事件触发控制,系统。控制信函。,162,第105176条pp.(2022)·Zbl 1485.93353号
[41] 姚,W。;王,C。;孙,Y。;周,C。;Lin,H.,通过静态或动态事件触发控制实现时变延迟的惯性记忆神经网络同步,神经计算,404,367-380(2020)
[42] 田,E。;王,Z。;邹,L。;Yue,D.,一类具有改进静态事件触发通信的非线性系统的概率约束滤波,国际。J.鲁棒非线性控制,29,5,1484-1498(2019)·Zbl 1410.93130号
[43] 霍恩,哥伦比亚特区。;Trinh,H.,《关于不确定系统事件触发控制的静态和动态触发机制,电路系统信号处理》。,39, 10, 5020-5038 (2020) ·Zbl 1485.93347号
[44] 翟,J。;牛,T。;Ye,J。;冯,E.,混合约束非线性切换系统的最优控制及其并行优化算法,非线性分析。混合系统。,25, 21-40 (2017) ·Zbl 1376.49031号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。