×

多智能体系统的最佳同步:一种性能相关的交换拓扑。 (英语) Zbl 07840660号

摘要:针对性能相关的交换拓扑和DoS攻击,提出了一种异构多代理系统(HMAS)的最优输出同步控制方法。首先,分别提出了局部和全局切换性能指标函数(SPIF)和依赖于SPIF的拓扑切换律,从而可以定量地表示控制性能和拓扑质量。其次,针对哈密尔顿-雅可比-贝尔曼方程的复杂性以及切换动力学引起的分析复杂性,提出了一种带模式切换的自适应动态规划(ADP)算法。证明了切换ADP算法的收敛性,以确保其正确实现。然后,针对不同的拓扑结构,为每个agent构建多模式actor-critic神经网络,分别计算优化的控制策略和SPIF。此外,设计了一种基于神经网络的状态补偿机制,以在领导者的输出传输不可靠时扩展所设计的切换ADP算法的适用性。最后,通过数值算例验证了该方法的可行性。

MSC公司:

93C40型 自适应控制/观测系统
49升20 最优控制与微分对策中的动态规划
93甲16 多代理系统
PDF格式BibTeX公司 XML格式引用
全文: DOI程序

参考文献:

[1] Dimarogonas,D.V。;弗拉佐利,E。;Johansson,K.H.,多智能体系统的分布式事件触发控制,IEEE Trans。自动化。控制,57,5,1291-12972012·Zbl 1369.93019号
[2] Tang,Y。;Xing,X。;Karimi,H.R。;Kocarev,L。;Kurths,J.,《新脉冲特征下网络化多智能体系统的跟踪控制及其在机器人系统中的应用》,IEEE Trans。Ind.Electron公司。,63, 2, 1299-1307, 2016
[3] Schreinemachers,P。;Berger,T。;Aune,J.B.,《模拟乌干达的土壤肥力和贫困动态:生物经济多主体系统方法》,Ecol。经济。,64, 2, 387-401, 2007
[4] 科埃略,V.N。;Weiss Cohen,M。;科埃略,I.M。;刘,N。;Guimaráes,F.G.,《应用于能源系统集成的多代理系统:微电网的最新应用和趋势》,应用。能源,187820-8322017
[5] 亚德加,M。;Meskin,N.,非线性异构多智能体系统的容错控制,Automatica,127,文章109514 pp.,2021·Zbl 1461.93119号
[6] 杜,H。;文,G。;Wu,D。;Cheng,Y。;Lu,J.,《非线性异构多智能体系统的分布式定时共识》,Automatica,113,第108797页,2020年·Zbl 1440.93232号
[7] 张,X。;刘,X。;Feng,Z.,奇异异质多智能体系统的分布式控制,J.Franklin Inst.,357,3,1378-13992020·Zbl 1430.93015号
[8] Liang,C。;Ge,M。;刘,Z。;王,Y。;Karimi,H.,《通过有限时间分层控制实现网络化异构机器人系统的输出多格式跟踪》,IEEE Trans。赛博。,51, 6, 2893-2904, 2021
[9] Cheng,W。;张凯。;江,B。;Ding,S.,具有参数不确定性和扰动的异构多智能体系统的固定时间容错编队控制,IEEE Trans。电路系统。我是Regul。爸爸。,68, 5, 2121-2133, 2021
[10] 李,H。;Li,X.,《异构线性时变系统对无人机-CUSV协调的分布式共识》,IEEE Trans。电路系统。II实验简报,67,1264-12682020
[11] 薛,M。;Tang,Y。;Ren,W。;Qian,F.,《适应快速切换扰动的异步切换多智能体系统的实际输出同步》,Automatica,116,第108917页,2020年·Zbl 1440.93241号
[12] 王,P。;文,G。;黄,T。;于伟(Yu,W.)。;Lv,Y.,具有定向交换拓扑的lur’e多智能体系统的共识,IEEE Trans。电路系统。II实验简报,69,2,474-478,2022
[13] 刘易斯,F.L。;崔,B。;马,T。;Song,Y。;Zhao,C.,《异构多代理系统:降阶同步和几何》,IEEE Trans。自动化。控制,61,1391-13962016·Zbl 1359.93174号
[14] Arevalo-Castiblanco,M.F。;Tellez-Castro,D。;索夫罗尼,J。;Mojica-Nava,E.,《异构多智能体系统的自适应同步:自由观测器方法》,《系统控制快报》。,146,第104804条pp.,2020年·兹比尔1454.93124
[15] 埃斯拉米,M。;Atrianfar,H。;Menhaj,M.B.,《具有异质未知非线性开关动力学的多智能体系统共识:驻留时间方法》,Inform。科学。,618, 209-226, 2022
[16] 阿尔梅达,J。;西尔维斯特,C。;Pascoal,A.M.,《异构多代理系统的事件触发输出同步》,国际。J.鲁棒非线性控制,27,8,1302-13382017·Zbl 1364.93449号
[17] 段,Z。;魏,A。;张,X。;Mu,R.,切换拓扑下非线性多智能体系统的事件触发二部分共识:一种时变增益方法,J.Franklin Inst.,360,7,4880-48952023·Zbl 1516.93160号
[18] Xu,H。;徐,C。;Liu,C.,固定和切换拓扑下输入饱和线性多智能体系统的动态事件触发自适应半全局二方一致性,J.Franklin Inst.,360,14,10681-107052023·Zbl 1521.93181号
[19] 黄,W。;田,B。;陈,Y。;Wang,J.,具有半马尔可夫切换拓扑和时滞的多智能体系统的可达集估计,J.Franklin Inst.,360,11,7415-74372023·Zbl 1518.93014号
[20] 水谷,E。;Dreyfus,S.,《关于在模式识别中使用动态编程进行时间扭曲》,Inform。科学。,580, 684-704, 2021
[21] 刘博士。;Wei,Q.,离散非线性系统的策略迭代自适应动态规划算法,IEEE Trans。神经网络。学习。系统。,25, 3, 621-634, 2013
[22] 陈,Z。;陈,S。;Chen,K。;Zhang,Y.,能量系统部分不可控时滞模型的约束解耦自适应动态规划,Inform。科学。,608, 1352-1374, 2022
[23] 魏强。;刘博士。;Lin,H.,离散非线性系统最优控制的值迭代自适应动态规划,IEEE Trans。赛博。,46, 3, 840-853, 2016
[24] 赵,J。;Na,J。;Gao,G.,基于自适应动态规划的非匹配不确定性非线性系统鲁棒控制,神经计算,395,56-652020
[25] 薛,S。;罗,B。;刘博士。;Yang,Y.,基于并行学习自适应动态规划的约束事件触发控制,IEEE Trans。系统。人类网络。系统。,52, 1, 357-369, 2022
[26] Zhang,Y。;赵,B。;Liu,D.,无模型最优控制的确定性策略梯度自适应动态规划,神经计算,387,40-502020
[27] 姜瑜。;范,J。;高,W。;Chai,T。;Lewis,F.,非线性离散时间多智能体系统的合作自适应最优输出调节,Automatica,121,Article 109149 pp.,2020·兹比尔1448.93159
[28] Jin,W。;张,H。;Ming,Z.,基于自适应动态规划的具有事件触发机制的离散时间多智能体系统的最优二方一致性,神经计算,564,第126965页,2024
[29] 陈,C。;刘易斯,F。;谢,K。;谢S。;Liu,Y.,异构多智能体系统自适应最优输出同步的非策略学习,Automatica,119,第109081页,2020年·Zbl 1451.93012号
[30] 石户,Y。;Takaba,K。;Quevedo,D.E.,受数据包输出和有限级量化影响的网络控制系统的稳定性分析,系统。控制信函。,60, 5, 325-332, 2011 ·Zbl 1214.93010号
[31] 齐,Y。;于伟(Yu,W.)。;Ahn,C.K.,《网络交换系统的事件触发MPSC:允许的类型切换策略》,Automatica,143,第110467页,2022年·Zbl 1497.93061号
[32] 齐,Y。;张,S。;于伟(Yu,W.)。;Huang,J.,基于定时响应事件触发方案的网络交换系统MPSC,Inform。科学。,617, 435-450, 2022
[33] 刘杰。;Dong,Y。;查·L。;田,E。;Xie,X.,针对随机网络攻击的网络控制系统基于事件的安全跟踪控制,Inform。科学。,612, 306-321, 2022
[34] 刘杰。;尹,T。;岳,D。;Karimi,H.R。;Cao,J.,《具有多重网络攻击的多代理系统的基于事件的安全领导-遵循共识控制》,IEEE Trans。赛博。,51, 1, 162-173, 2021
[35] 彭,C。;Sun,H.,《恶意拒绝服务攻击下网络控制系统的类交换事件触发控制》,IEEE Trans。自动化。控制,65,9,3943-39492020·Zbl 1533.93493号
[36] Z.Feng。;Hu,G.,DoS攻击下线性多智能体系统的安全协同事件触发控制,IEEE Trans。控制系统。技术。,28, 3, 741-752, 2020
[37] Pang,Z.H。;罗,W.C。;刘,G。;Han,Q.,具有随机延迟和数据包丢失的网络化多智能体系统的基于观测器的增量预测控制,IEEE Trans。电路系统。II实验简报,68,1,426-430,2021
[38] Chen,L。;高,Y。;Bai,L。;Cheng,Y.,具有切换拓扑的异构多智能体系统的缩放一致性控制,神经计算,408,13-20,2020
[39] 孟,M。;肖·G。;翟,C。;李·G。;Wang,Z.,受切换拓扑和延迟影响的异构多智能体系统的分布式共识,J.Franklin Inst.,357,116899-69172020·Zbl 1447.93327号
[40] 王,P。;文,G。;黄,T。;于伟(Yu,W.)。;Ren,Y.,基于观测器的非零输入领先的定向交换网络共识协议,IEEE Trans。赛博。,52, 1, 630-640, 2022
[41] 张,H。;姜浩。;罗,Y。;Xiao,G.,使用强化学习方法对动态未知的离散时间多智能体系统进行数据驱动的最优一致性控制,IEEE Trans。Ind.Electron公司。,64, 5, 4091-4100, 2017
[42] Kyriakos G.Vamvoudakis,G.R.H。;Lewis,Frank L.,《多智能体微分图形游戏:同步优化的在线自适应学习解决方案》,Automatica,48,8,1598-16112012年·兹比尔1267.93190
[43] 邓,Y。;尹,X。;Hu,S.,具有DoS攻击的网络控制系统的事件触发预测控制,Inform。科学。,542, 4, 71-91, 2021 ·Zbl 1478.93387号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。