×

部分未知互联非线性系统基于滑模表面的分散事件触发强化学习控制。 (英语) Zbl 07832269号

摘要:本文研究了一类部分未知互联非线性系统的滑模面分散事件触发控制问题,将原来的控制问题等价地转化为设计多个以事件触发方式更新的最优控制器,大大节省了通信资源。为了得到这些基于事件的最优控制策略,通过强化学习算法求解相应的Hamilton-Jacobi-Bellman方程。与传统的强化学习算法不同,辨识-临界网络框架可以消除对系统内部动力学知识的需求,并消除近似行动者网络所产生的误差。通过梯度下降法和经验重演技术更新了评判网络中的权重向量,从而缓解了激励条件的持续性。在所提出的基于SMS的分散控制方案下,所考虑的系统具有更快的控制响应,同时最小化了成本函数。然后,根据李亚普诺夫稳定性理论,严格证明了互联非线性系统的所有信号都是有界的。最后,通过仿真实例验证了所提控制方案的有效性。

MSC公司:

93B12号机组 可变结构系统
93年第14页 分散的系统
93元65角 离散事件控制/观测系统
93B70型 网络控制
93立方厘米 控制理论中的非线性系统
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Bakule,Lubomir,《分散控制:概述》,《年度》。版本控制,32,1,87-98(2008)
[2] 曹玉萌;赵宁;徐宁;赵旭东;Alsaadi,Fawaz E.,未知控制方向切换非线性系统基于最小近似的自适应事件触发控制,电子,11,20,3386(2022)
[3] 李玉林;王焕清;赵旭东;徐宁,通过指令滤波实现不确定分数阶非严格反馈非线性系统的事件触发自适应跟踪控制,国际鲁棒非线性控制杂志,32,14,7987-8011(2022)
[4] 程发斌;梁红晶;牛、本;赵宁;赵旭东,dos攻击下非线性质量的自适应神经自触发二分安全控制,信息科学。,631, 256-270 (2023)
[5] 崔丽丽;谢祥鹏;王晓伟;罗燕红;Liu,Jingbo,连续非线性系统约束最优跟踪控制的事件触发单网络adp方法,应用。数学。计算。,352, 220-234 (2019) ·Zbl 1428.49038号
[6] 埃克雷沙维(Echreshavi),泽纳布(Zeinab);莫森·法布;Shasadeghi,Mokhtar,非线性连续时间系统的模糊事件触发积分滑模控制,IEEE Trans。模糊系统。,30, 7, 2347-2359 (2022)
[7] 费俊涛;王哲;梁,肖;冯志林;薛云灿,基于多层递归模糊神经网络的微陀螺分数阶滑模控制,IEEE Trans。模糊系统。,30, 6, 1712-1721 (2022)
[8] 胡传豪;邹元元;李绍元,基于自适应动态规划的大型非线性系统分散事件触发控制,亚洲控制杂志,24,4,1542-1556(2022)
[9] 刘德荣;王丁;李洪亮,利用在线学习最优控制方法研究一类连续非线性互联系统的分散镇定,IEEE Trans。神经网络。学习。系统。,25, 2, 418-428 (2014)
[10] 刘德荣;薛、珊;赵波;罗彪;魏庆来,控制自适应动态规划:综述和最新进展,IEEE Trans。系统。人类网络。系统。,51, 1, 142-160 (2021)
[11] 刘善林;张亮;牛、本;赵旭东;Ahmad,A.M.,具有类回滞不确定欠驱动切换非线性系统的自适应神经有限时间分层滑模控制,信息科学。,599, 147-169 (2022)
[12] 唐方华;王焕清;张晓恒;张亮;Alharbi,K.,使用基于策略迭代的自适应动态规划的离散时间非线性马尔可夫跳跃系统的动态事件触发控制,非线性分析:混合系统。,49,第101338条pp.(2022)·Zbl 1520.93324号
[13] 罗彪;阳、阴;刘德荣;吴怀宁,使用自适应动态规划实现性能保证的事件触发最优控制,IEEE Trans。神经网络。学习。系统。,31, 1, 76-88 (2020)
[14] 罗芳超;赵波;Liu,Derong,通过自适应动态规划实现非匹配互联非线性系统的事件触发分散最优容错控制,Optim。控制应用程序。方法,42,5,1365-1384(2021)·Zbl 1472.93118号
[15] 马洪军;徐林兴;Yang,Guang-Hong,仿射非线性系统基于多环境积分强化学习的容错控制,IEEE Trans。赛博。,51, 4, 1913-1928 (2021)
[16] Ali Saberi,关于一类非线性互联系统分散控制的最优性,Automatica,24,1,101-104(1988)·Zbl 0629.93005
[17] 宋军;黄龙阳;哈米德·雷扎·卡里米;牛玉刚;周嘉乐,基于Adp的部分未知大系统在注入攻击下的安全分散滑模控制,IEEE Trans。电路系统。一、 雷古尔。爸爸。,67, 12, 5290-5301 (2020) ·Zbl 1468.93016号
[18] 唐方华;牛、本;宗光登;赵旭东;徐宁,基于强化学习的非线性离散时间系统周期事件触发自适应跟踪控制设计,神经网络。,154, 43-55 (2022) ·Zbl 1525.93256号
[19] Vamvoudakis,Kyriakos G.,连续时间非线性系统的事件触发最优自适应控制算法,IEEE/CAA J.Autom。罪。,1822-293年1月3日(2014年)
[20] 文国兴;牛,本,一类高阶未知非线性动力系统基于强化学习的优化跟踪控制,信息科学。,606, 368-379 (2022)
[21] 张浩燕;赵旭东;王焕清;宗光登;Xu,Ning,具有未知扰动的切换非线性系统的基于分层滑模表面的自适应actor-critic最优控制,IEEE Trans。神经网络。学习。系统。(2022)
[22] 杨,熊;He,Haibo,使用强化学习的一类非线性互联系统的去中心化事件触发控制,IEEE Trans。赛博。,51, 2, 635-648 (2021)
[23] 杨,熊;刘德荣;黄玉柱,带控制约束的不确定非线性连续系统基于神经网络的在线最优控制,IET控制理论应用。,7, 17, 2037-2047 (2013)
[24] 杨,熊;徐梦梦;魏庆来,利用强化学习实现互联非线性系统的动态事件采样控制,IEEE Trans。神经网络。学习。系统。,1-15 (2022)
[25] 杨,熊;曾志刚;Gao,Zhongke,非线性互联系统带批判性学习的分散神经控制器设计,IEEE Trans。赛博。,1-14 (2021)
[26] 杨,熊;曾志刚;Gao,Zhongke,非线性互联系统带批判性学习的分散神经控制器设计,IEEE Trans。赛博。,52, 11, 11672-11685 (2022)
[27] Fabin Cheng;王焕清;张亮;艾哈迈德。;Xu,Ning,带执行器故障的非严格反馈非线性系统的分散自适应神经二位触发控制,神经计算,500856-867(2022)
[28] 杨,熊;朱元恒;Dong,Na;Wei,Qinglai,使用自适应批评性设计的分散事件驱动约束控制,IEEE Trans。神经网络。学习。系统。,33, 10, 5830-5844 (2022)
[29] 李玉林;牛、本;宗光登;赵金凤;赵旭东,带时变全状态约束和非对称输入饱和的随机非线性系统基于命令滤波器的自适应神经有限时间控制,国际期刊系统。科学。,53, 1, 199-221 (2022) ·Zbl 1483.93553号
[30] 张浩燕;王焕清;牛、本;张亮;Ahmad,Adil M.,具有平均驻留时间的切换非线性系统的基于滑模表面的自适应actor-critic最优控制,Inf.Sci。,580,756-7 74(2021)
[31] 张怀平;Park,Ju H。;岳、董;赵伟,带干扰多智能体系统的近最优积分滑模一致性控制,IEEE Trans。系统。人类网络。系统。,51, 8, 4741-4750 (2021)
[32] 张亮;赵旭东;Zhao,Ning,混合时滞中立型奇异马尔可夫跳跃系统的实时可达集控制,IEEE Trans。电路系统。二、 快讯,69,3,1367-1371(2022)
[33] 张亮;宗光登;赵旭东;赵宁,多网络攻击下奇异马尔可夫跳跃系统事件触发控制的输出可达集综合,IEEE/ACM Trans。净值。,30, 6, 2849-2857 (2022)
[34] 张亮;宗光登;赵旭东;赵宁;Sharaf,Sanaa,离散时间Takagi-Sugeno模糊奇异Markov跳跃系统的可达集控制,IEEE Trans。模糊系统。(2023)
[35] 张启元;宋晓娜;宋帅;Stojanovic,Vladimir,奇异摄动pde系统的有限时间滑模控制,J.Franklin Inst.,360,2,841-861(2023)·兹比尔1506.93082
[36] 张旭东;张亮;赵旭东;赵宁,通过滑模控制实现奇异系统扰动的可达集控制,J.Franklin Inst.,360,4,3307-3329(2023)·Zbl 1508.93030号
[37] 赵波;刘德荣;Alippi,Cesare,具有渐近稳定临界结构的不确定非线性系统的滑模表面近似最优控制,IEEE Trans。赛博。,51, 6, 2858-2869 (2021)
[38] 赵波;刘德荣;李元春,基于观测器的自适应动态规划在一类非线性系统容错控制中的应用,信息科学。,384, 21-33 (2017) ·兹比尔1432.93185
[39] 赵波;王丁;施光;刘德荣;李元春,通过策略迭代实现具有未知不匹配互联的大型非线性系统的分散控制,IEEE Trans。系统。人类网络。系统。,48, 10, 1725-1735 (2018)
[40] 程燕;牛、本;赵旭东;宗光登;Ahmad,A.,具有Bouc-Wen滞后输入的互联非线性系统的事件触发自适应分散控制,国际期刊系统。科学。(2023)
[41] 赵宁;赵旭东;陈孟;宗光登;Zhang,Huiyan,Resilient分布式事件触发排队控制拒绝服务攻击下的连接车辆,IEEE Trans。因特尔。运输。系统。(2023)
[42] 赵宁;赵旭东;徐宁;Zhang,Liang,网络攻击下联网自动车辆的弹性事件触发控制,IEEE/CAA J.Autom。罪。(2023)
[43] 赵燕伟;唐方华;宗光登;赵旭东;Xu,Ning,具有周期扰动的非线性多智能体系统的基于事件的自适应包容控制,IEEE Trans。电路系统。二、 快讯,69,12,5049-5053(2022)
[44] 赵燕伟;王焕清;徐宁;宗光登;赵旭东,基于强化学习的约束互联非线性系统分散容错控制,混沌孤子分形,167,文章113034 pp.(2023)
[45] 赵燕伟;牛、本;宗光登;徐宁,通过自适应动态规划实现随机互联非线性系统的事件触发最优分散控制,神经计算,539,28,第126163页,(2023)
[46] 周隆辉;陶洪峰;沃伊切赫·帕斯克;弗拉基米尔·斯托亚诺维奇;杨惠忠,不确定空间互联系统的Pd型迭代学习控制,数学,8,9(2020)·兹比尔1497.93068
[47] 张浩燕;赵旭东;张亮;牛、本;宗光登;徐宁,带输入量化的不确定欠驱动切换非线性系统基于观测器的自适应模糊分层滑模控制,国际鲁棒非线性控制,32,14,8163-8185(2022)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。