×

具有未知动力学和时滞的异质离散非线性多智能体系统的对偶ML-ADHDP方法。 (英语) Zbl 1492.93013号

摘要:本文提出了一种新的对偶ML-ADHDP方法,用于求解一类动态和时滞未知的异构离散时间非线性多智能体系统的最优一致性问题。采用分层分布式控制策略将原问题转化为非线性模型参考自适应控制(MRAC)问题和虚拟线性MAS的OCP问题该方法克服了未知动力学和神经网络估计误差,具有较高的控制精度。为了解决虚拟线性MAS的OCP问题,提高收敛速度,提出了一种新的多层性能指标。然后利用ML-ADHDP方法求解耦合哈密顿-雅可比-贝尔曼方程,得到最优虚拟控制。理论分析证明,原MAS可以达到纳什均衡,仿真结果表明,所提出的双ML-ADHDP方法保证了原MAS更好的收敛速度和更高的控制精度。

MSC公司:

93甲16 多代理系统
93D50型 共识
93C55美元 离散时间控制/观测系统
93立方厘米 控制理论中的非线性系统
49升20 最优控制与微分对策中的动态规划
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 镍,锌。;Tang,Y。;He,H。;Wen,J.,基于双重启发式动态规划的多机电力系统控制,IEEE智能电网计算智能应用研讨会(CIASG),1-7(2014),IEEE
[2] 约里诺,N。;Zoka,Y。;渡边,M。;Kurushima,T.,使用多智能体系统的电压控制装置的最优自治分散控制方法,IEEE Trans。电力系统。,30, 5, 2225-2233 (2014)
[3] 陈,J。;曹,X。;Cheng,P。;Xiao,Y。;Sun,Y.,《利用无线传感器和执行器网络实现工业自动化的分布式协同控制》,IEEE Trans。Ind.Electron公司。,57, 12, 4219-4230 (2010)
[4] 哈菲兹,A.T。;马拉斯科,A.J。;Givigi,S.N。;Iskandarani,M。;Yousefi,S。;Rabbath,C.A.,通过模型预测控制解决多无人机动态包围,IEEE Trans。控制系统。技术。,23, 6, 2251-2265 (2015)
[5] Yu,M。;宋,C。;吕,F。;Jin,K。;Tan,W.,分布式电池储能系统的事件触发共识方法,IET Gener。,Transm公司。发行,13,22,5102-5108(2019)
[6] Ye,F。;Dong,H。;卢,Y。;Zhang,W.,《通用集成器多智能体系统的一致性控制器:自动水面舰艇的分析、设计和应用》,IET控制理论应用。,12, 5, 669-678 (2018)
[7] 方,W。;辛,C。;Yong,H。;Min,W.,切换拓扑下二阶多智能体系统的有限时间一致性问题,亚洲控制杂志,19,5,1756-1766(2017)·Zbl 1386.93021号
[8] Mu,X。;Xiao,X。;刘凯。;Zhang,J.,领导使用分布式自适应协议实现具有联合连接拓扑的多智能体系统共识,J.Frankl。研究所,351,12,5399-5410(2014)·Zbl 1393.93011号
[9] 苏,Y。;黄,J.,一类线性切换系统的稳定性及其对两个一致性问题的应用,IEEE Trans。自动。控制,57,6,1420-1430(2011)·Zbl 1369.93387号
[10] 苏,Y。;Huang,J.,具有交换网络拓扑的离散时间多智能体系统的两个一致性问题,Automatica,48,91988-1997(2012)·兹比尔1258.93015
[11] 诺扎里,C。;加西亚,E。;Cortés,J.,多智能体共识网络系统的事件触发通信和控制,Automatica,105,1-27(2019)·Zbl 1429.93339号
[12] 马,J。;郑,Y。;Wang,L.,基于LQR的领导服从共识最优拓扑,国际鲁棒非线性控制,25,17,3404-3421(2015)·Zbl 1338.93028号
[13] 曹毅。;Ren,W.,最优线性一致性算法:LQR视角,IEEE Trans。系统。,人,赛博。,B部分(控制论),40,3,819-830(2009)
[14] 曹毅。;Ren,W.,基于LQR的最优线性一致性算法,美国控制会议,5204-5209(2009)
[15] Dong,W.,《多系统分布式最优控制》,《国际控制杂志》,83,10,2067-2079(2010)·Zbl 1213.49043号
[16] 莫弗里克,K.H。;Lewis,F.L.,有向图拓扑上多智能体系统的合作最优控制,IEEE Trans。自动。控制,59,3,769-774(2013)·Zbl 1360.49026号
[17] 张,H。;冯·T。;Yang,G.-H。;Liang,H.,有向图上多智能体系统的分布式协同最优控制:逆优化方法,IEEE Trans。赛博。,45, 7, 1315-1326 (2014)
[18] 陈,X。;Wang,W。;曹伟。;Wu,M.,使用两阶段值迭代的基于高斯核的自适应批评设计,信息科学。,482, 139-155 (2019)
[19] He,H。;镍,锌。;Fu,J.,基于自适应动态规划的在线学习和优化三网络架构,神经计算,78,1,3-13(2012)
[20] 魏强。;刘易斯,F.L。;孙,Q。;Yan,P。;Song,R.,离散时间确定性学习:一种新的收敛分析,IEEE Trans。赛博。,47, 5, 1224-1237 (2016)
[21] Al-Tamimi,A。;刘易斯,F.L。;Abu-Khalaf,M.,使用近似动态规划的离散时间非线性HJB解:收敛证明,IEEE Trans。系统。,人,赛博。,B部分(控制论),38,4,943-949(2008)
[22] Vamvoudakis,K.G。;刘易斯,F.L。;Hudas,G.R.,《多智能体微分图形游戏:同步优化的在线自适应学习解决方案》,Automatica,48,8,1598-1611(2012)·Zbl 1267.93190号
[23] M.I.Abouheaf。;Lewis,F.L.,《多智能体微分图形游戏:Nash在线自适应学习解决方案》,IEEE决策与控制会议,5803-5809(2013),IEEE
[24] Abouheaf,M。;刘易斯,F。;Haesaert,S。;巴布斯卡,R。;Vamvudakis,K.,多智能体离散时间图形游戏:交互式纳什均衡和价值迭代解决方案,美国控制会议,4189-4195(2013),IEEE
[25] Mu,C。;赵(Q.Zhao)。;高,Z。;Sun,C.,使用强化学习的离散时间多智能体系统最优一致性控制的Q学习解决方案,J.Frankl。研究所,356、13、6946-6967(2019)·Zbl 1418.93250号
[26] 张,H。;张杰。;Yang,G.-H。;Luo,Y.,基于Leader的最优协调控制,通过模糊自适应动态规划解决多智能体微分对策的一致性问题,IEEE Trans。模糊系统。,23, 1, 152-163 (2014)
[27] Dehshalie,M.E。;Menhaj,M.B。;Karrari,M.,仿射多智能体系统的容错协同控制:最优控制方法,J.Frankl。研究所,356,3,1360-1378(2019)·Zbl 1406.93019号
[28] 莫达雷斯,H。;刘易斯,F.L。;Kang,W。;Davoudi,A.,具有未知动力学的异质非线性系统的最佳同步,IEEE Trans。自动。控制,63,1,117-131(2017)·Zbl 1390.49028号
[29] 孙,Y。;陈,X。;Wang,W。;Fu,H.等人。;Wu,M.,部分可观测异质多飞行器系统的无模型输出一致性控制,IEEE Internet Things J.,7,8,7135-7147(2020)
[30] 王,T。;Fu,H.等人。;Li,J.等人。;Zhang,Y。;周,X。;Chen,X.,具有部分未知动力学的异质非线性多智能体系统的最优一致性控制,Int.J.control,Autom。系统。,17, 9, 2400-2413 (2019)
[31] 丁·D。;王,Z。;Han,Q.-L.,《具有输入约束的多智能体系统基于神经网络的一致性控制:事件触发案例》,IEEE Trans。赛博。,50, 8, 3719-3730 (2019)
[32] Fu,H.等人。;陈,X。;Wang,W。;Wu,M.,未知离散时间非线性异质系统基于观测器的自适应同步控制,IEEE Trans。神经网络。学习。系统。,33, 2, 681-693 (2022)
[33] Wang,W。;陈,X。;Fu,H.等人。;Wu,M.,基于actor-critic框架的离散时间非线性多智能体系统无模型分布式一致性控制,IEEE Trans。系统。,人,赛博。,50, 11, 4123-4134 (2018)
[34] Fu,H.等人。;陈,X。;Wang,W。;Wu,M.,离散时间非线性异质多智能体系统的基于数据的最优同步控制,IEEE Trans。赛博。(2020)
[35] Wang,W。;Chen,X.,基于actor-critic框架的多智能体系统无模型最优控制,神经计算,314,242-250(2018)
[36] 何,P。;Jagannathan,S.,具有输入约束的非线性离散时间系统的强化学习神经网络控制器,IEEE Trans。系统。,人,赛博。,B部分(控制论),37,2,425-436(2007)
[37] Jagannathan,S。;Lewis,F.L.,使用多层神经网络识别非线性动力系统,Automatica,32,12,1707-1712(1996)·Zbl 0879.93010号
[38] 青莱,W。;张,H.-G。;德隆,L。;Yan,Z.,一类离散非线性时滞系统的自适应动态规划最优控制方案,Acta Autom。罪。,36, 1, 121-129 (2010) ·兹比尔1240.49044
[39] Fu,H.等人。;陈,X。;Wang,W。;Wu,M.,基于监督神经动态规划的未知离散时间非线性系统的MRAC,神经计算,384130-141(2020)
[40] Ni,Z。;He,H。;Wen,J.,基于双临界网络设计的跟踪控制自适应学习,IEEE Trans。神经网络。学习。系统。,24, 6, 913-928 (2013)
[41] 钟,X。;He,H.,GrHDP解决方案,用于多智能体离散时间系统的最优一致性控制,IEEE Trans。系统。,人,赛博。,50, 7, 2362-2374 (2018)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。