×

基于神经网络的非仿射非线性多智能体系统自适应最优包容控制。 (英语) Zbl 1520.93283号

摘要:本文研究了存在周期扰动的非仿射非线性多智能体系统的自适应最优控制问题。为了处理被扰动的内部动力学,为每个跟随器设计了一个基于傅里叶级数展开神经网络的自适应辨识器,从而解除了对系统动力学的限制。然后,采用自适应动态规划技术,在简化的actor-critic结构下获得优化的虚拟和实际控制器,其中批评者以评估控制性能为目标,参与者以执行控制任务为目标。注意,上述更新律是由设计函数的负梯度构造的,该函数是基于Hamilton-Jacobi-Bellman方程的偏导数构造的。最后,仿真结果表明了该控制方案的适用性和有效性。

MSC公司:

93C40型 自适应控制/观测系统
49升20 最优控制与微分对策中的动态规划
93立方厘米 控制理论中的非线性系统
93甲16 多代理系统
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Xiao,H。;Philip Chen,C.,使用基于模型预测的协议和切换拓扑的时间维非完整机器人一致性形成,Inf.Sci。(纽约),567201-2015(2021)·Zbl 1526.93246号
[2] 卢,M。;Liu,L.,交换网络下多刚体航天器系统姿态一致性的领导者,IEEE Trans。自动化。控制。,65, 2, 839-845 (2019) ·Zbl 07256211号
[3] 辛格,V.P。;Kishor,N。;Samuel,P.,智能电网中多区域电力系统基于分布式多代理系统的负荷频率控制,IEEE Trans。Ind.Electron公司。,64, 6, 5151-5160 (2017)
[4] 李,Z。;段,Z。;Ren,W。;Feng,G.,使用分布式连续控制器对具有多个有界输入前导的线性多智能体系统进行控制,《国际鲁棒非线性控制》,25,13,2101-2121(2015)·Zbl 1328.93023号
[5] 曹,Z。;牛,B。;宗,G。;X.赵。;Ahmad,A.M.,《非仿射非线性多智能体系统基于主动干扰抑制的事件触发二方一致性控制》,《国际鲁棒非线性控制》(2023)
[6] Cheng,F。;Liang,H。;牛,B。;Zhao,N。;Zhao,X.,DoS攻击下非线性MAS的自适应神经自触发二部安全控制,信息科学。,631, 256-270 (2023)
[7] Yoo,S.J.,《严格反馈形式的不确定非线性多智能体系统的分布式自适应控制》,Automatica,49,7,2145-2153(2013)·Zbl 1364.93413号
[8] 刘,D。;刘,Z。;陈,C。;Zhang,Y.,具有未知滞后的不确定非线性多智能体系统规定时间控制的分布式自适应模糊控制方法,非线性动态。,105, 1, 257-275 (2021)
[9] Yang,Y。;Tan,J。;Yue博士。;田,Y。;Xue,Y.,不确定非仿射非线性多智能体系统基于输出的控制,IEEE Trans。系统。曼赛本:系统。,519992-6002(2020)
[10] 霍,X。;Karimi,H.R。;X.赵。;王,B。;Zong,G.,标识符关键框架内约束非线性互联系统分散事件触发控制的自适应关键设计,IEEE Trans。赛博。,52, 8, 7478-7491 (2021)
[11] Zhao,Y。;牛,B。;宗,G。;徐,N。;Ahmad,A.M.,通过自适应动态规划实现随机互联非线性系统的事件触发最优分散控制,神经计算,539,28,第126163页,(2023)
[12] 徐,N。;牛,B。;Wang,H。;霍,X。;Zhao,X.,用于解决完全未知非线性系统最优事件触发跟踪控制问题的单网络adp,Int.J.Intell。系统。,36, 9, 4795-4815 (2021)
[13] 唐,F。;Wang,H。;Chang,X。;张,L。;Alharbi,K.H.,使用基于策略迭代的自适应动态规划的离散时间非线性马尔可夫跳跃系统的动态事件触发控制,非线性分析:混合系统,49,文章101338 pp.(2023)·Zbl 1520.93324号
[14] 刘,S。;牛,B。;宗,G。;X.赵。;Xu,N.,具有输入约束的未知非线性系统基于数据驱动的事件触发最优控制,非线性动力学。,109, 2, 891-909 (2022)
[15] 史J。;Yue博士。;Xie,X.,动力学完全未知的约束输入多智能体系统的最优领导-跟随一致性,IEEE Trans。系统。曼赛本:系统。,521182-11191(2022)
[16] 文,G。;Chen,C.L.P.,一类非线性严格反馈动态多Agent系统的强化学习优化反推一致性控制,IEEE Trans。神经网络。学习。系统。,34, 3, 1524-1536 (2023)
[17] 李凯。;Li,Y.,随机非线性多智能体系统的模糊自适应最优一致容错控制,IEEE Trans。模糊系统。,30, 8, 2870-2885 (2021)
[18] Zhao,Y。;唐,F。;宗,G。;X.赵。;Xu,N.,具有周期扰动的非线性多智能体系统的基于事件的自适应控制,IEEE Trans。电路系统。二: 快讯,69,12,5049-5053(2022)
[19] 陈伟,利用神经网络对周期扰动系统进行自适应反推动态表面控制,IET控制理论应用。,3, 10, 1383-1394 (2009)
[20] 左,R。;Dong,X。;刘,Y。;刘,Z。;Zhang,W.,具有周期扰动的mimo纯反馈非线性系统的自适应神经控制,IEEE Trans。神经网络。学习。系统。,30, 6, 1756-1767 (2018)
[21] 陈,J。;李,J。;刘,S。;赵,A.,具有周期扰动的非线性参数化多智能体系统的自适应神经一致性,ISA Trans。,126, 160-170 (2022)
[22] 赵伟。;张华,利用事件触发自适应动态规划方法实现非线性多智能体系统的分布式最优协调控制,ISA Trans。,91, 184-195 (2019)
[23] 孟,Z。;Ren,W。;You,Z.,多刚体分布式有限时间姿态控制,Automatica,46,12,2092-2099(2010)·Zbl 1205.93010号
[24] Zhao,N。;X.赵。;徐,N。;Zhang,L.,网络攻击下联网自动车辆的弹性事件触发控制,IEEE/CAA J.Autom。罪。(2023)
[25] Zhao,Y。;张,H。;Chen,Z。;Wang,H。;Zhao,X.,具有反鞭状滞后和输出约束的切换互联非线性系统的自适应神经分散控制,国际期刊系统。科学。,53, 7, 1545-1561 (2022) ·Zbl 1497.93126号
[26] 李毅。;Wang,H。;X.赵。;Xu,N.,通过命令滤波实现不确定分数阶非严格反馈非线性系统的事件触发自适应跟踪控制,国际鲁棒非线性控制,32,14,7987-8011(2022)
[27] 曹,Z。;张,L。;Ahmad,A.M。;Alsaadi,F.E。;Alassafi,M.O.,具有输入量化的切换纯反馈非线性系统的自适应神经规定性能控制,装配自动化。,42, 6, 869-880 (2022)
[28] Yang,Y。;Yue,D.,有向拓扑下非仿射纯反馈形式的一类多智能体系统的分布式跟踪控制,IEEE/CAA J.Autom。罪。,5, 1, 169-180 (2017)
[29] Kim,E。;Lee,S.,使用模糊扰动观测器的MIMO系统输出反馈跟踪控制及其在永磁同步电机速度控制中的应用,IEEE Trans。模糊系统。,13, 6, 725-741 (2005)
[30] Chen,W。;Jiao,L。;Li,R。;Li,J.,具有周期扰动的非线性参数化系统的自适应反推模糊控制,IEEE Trans。模糊系统。,18, 4, 674-685 (2010)
[31] 程,F。;牛,B。;张,L。;Chen,Z.,具有周期扰动的不确定非线性系统基于性能的低计算自适应跟踪控制,IEEE Trans。电路系统。二: 快速简报,69,11,4414-4418(2022)
[32] 唐,F。;牛,B。;Wang,H。;张,L。;Zhao,X.,具有全状态约束和未知控制方向的切换MIMO非线性系统的自适应模糊跟踪控制,IEEE Trans。电路系统。二: 快速简报,69,6,2912-2916(2022)
[33] 张,L。;宗,G。;X.赵。;Zhao,N。;Sharaf,S.,离散时间takagi-sugeno模糊奇异马尔可夫跳跃系统的可达集控制,IEEE Trans。模糊系统。(2023)
[34] 张,H。;X.赵。;Wang,H。;宗,G。;Xu,N.,具有未知扰动的切换非线性系统的基于滑模表面的自适应Actor-Critic最优控制,IEEE Trans。神经网络。学习。系统。(2022)
[35] 陈,J。;张,H。;Yin,G.,分布式动态事件触发的安全模型预测控制车队对抗DoS攻击,IEEE Trans。车辆。技术。,72, 3, 2863-2877 (2023)
[36] 张,L。;宗,G。;X.赵。;Zhao,N.,多网络攻击下奇异马尔可夫跳跃系统事件触发控制的输出可达集综合,IEEE/ACM Trans。网络,30,6,2849-2857(2022)
[37] 曹,Z。;牛,B。;宗,G。;Xu,N.,基于Small-gain技术的通过事件触发通信的切换网络非线性系统自适应输出约束控制设计,非线性分析:混合系统。,47, 101299 (2023) ·Zbl 1505.93122号
[38] 刘,Z。;高,H。;Lin,W。;邱,J。;罗德里格斯-安迪纳,J.J。;Qu,D.,B样条小波神经网络通过一种新的梯度下降算法IEEE Trans对线性电机驱动系统进行自适应控制。Ind.Electron公司。(2023)
[39] 张,H。;张凯。;蔡,Y。;Han,J.,通过积分强化学习方法对部分未知系统执行器故障的自适应模糊容错跟踪控制,IEEE Trans。模糊系统。,27, 10, 1986-1998 (2019)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。