霍、余;王、丁;乔俊飞 连续时间非线性互联系统分散事件触发控制的自适应临界优化。 (英语) Zbl 1531.93207号 最佳方案。控制应用程序。方法 43,第1期,198-212(2022). 摘要:本文针对具有匹配互联的非线性大系统,提出了一种分散事件触发控制(ETC)策略。首先,将大型互联系统转换为几个标称的孤立子系统。然后,采用基于自适应批评性学习的事件触发方法求解标称孤立子系统的最优控制问题。注意,采用ETC方案是为了减少计算负担和通信资源。此外,构造了一个单网络自适应批评家结构来近似最优成本和控制策略。通过在批判神经网络的权值更新律中引入稳定项,该算法不需要采用初始容许控制。此外,我们使用李亚普诺夫方法证明了关键网络中使用的估计权重向量一致最终有界。最后,我们提供了一个例子来验证所提出的分散事件触发控制策略。{©2021 John Wiley&Sons有限公司} 引用于三文件 MSC公司: 93C40型 自适应控制/观测系统 49甲15 常微分方程最优控制问题的存在性理论 93甲14 分散的系统 93元65角 离散事件控制/观测系统 93立方厘米 控制理论中的非线性系统 93甲15 大型系统 93B70型 网络控制 关键词:适应性批评学习;事件触发控制;互联系统;神经网络;最优控制 PDF格式BibTeX公司 XML格式引用 \textit{Y.Huo}等人,Optim。控制应用程序。方法43,No.1,198--212(2022;Zbl 1531.93207) 全文: 内政部 参考文献: [1] 姜瑜、姜梓。非线性系统的鲁棒自适应动态规划和反馈镇定。IEEE Trans Neural Netw学习系统。2014;25(5):882‐893. [2] 王德、刘德、张Q、赵德。不确定动态非线性鲁棒最优控制的基于数据的自适应批评器设计。IEEE Trans-Syst Man-Cybern系统。2015;46(11):1544‐1555. [3] 雅加纳森·迪尔克斯特。利用基于时间的策略更新对具有未知内部动力学的仿射非线性离散时间系统进行在线最优控制。IEEE Trans Neural Netw学习系统。2012;23(7):1118‐1129. [4] 卡马拉普尔卡尔、丁赫、巴辛斯、迪克森。连续时间非线性系统的近似最优轨迹跟踪。自动化。2015;51:40‐48. ·Zbl 1309.93086号 [5] 路易斯安那州莫达雷什。使用积分强化学习的非线性部分未知约束输入系统的最优跟踪控制。自动化。2014;50(7):1780‐1792. ·Zbl 1296.93073号 [6] QuQ、ZhangH、FengT、JiangH。基于自适应动态规划的非线性互联大系统分散自适应跟踪控制方案。神经计算。2017;225:1‐10. [7] 王德、乔杰、程莉。折现保证成本控制设计的近似神经最优解。IEEE Trans Cybern公司。2020 [8] Zhang H、Zhang J、Yang G、LuoY。基于领导的模糊自适应动态规划多智能体微分对策一致性问题的最优协调控制。IEEE跨模糊系统。2015;23(1):152‐163. [9] VamvoudakisKG,路易斯安那州。在线actor‐critic算法,用于解决连续时间无限时域最优控制问题。自动化。2010;46(5):878‐888. ·Zbl 1191.49038号 [10] KamalapurkarR、WaltersP、DixonWE。基于模型的强化学习用于近似最优调节。自动化。2016;64(1):94‐104. ·Zbl 1329.93051号 [11] LvY、NaJ、YangQ、WuX、GuoY。动态完全未知的连续非线性系统的在线自适应最优控制。国际J控制。2016;89(1):99‐112. ·Zbl 1332.93174号 [12] 朱毅、赵德、贺、纪杰。通过自适应动态规划实现部分未知约束输入系统的事件触发最优控制。IEEE Trans Ind Electron公司。2017;64(5):4101‐4109. [13] LiangY、ZhangH、Zhang K、WangR。一种用于非线性时滞系统的新型神经网络离散时间最优控制设计,采用自适应批评性设计。光电控制应用方法。2020;41(2):748‐764. ·Zbl 1467.93203号 [14] 王德、哈姆、乔杰。事件驱动形式下离散非线性系统的自学习最优调节。IEEE Trans Automat控制。2020;65(3):1272‐1279. ·Zbl 1533.93653号 [15] 王德、贺、刘德。自适应临界非线性鲁棒控制:综述。IEEE Trans Cybern公司。2017;47(10):3429‐3451. [16] LinH、WeiQ、LiuD。非线性系统最优控制的在线辨识器-行动者批评算法。光电控制应用方法。2017;38(3):317‐335. ·兹比尔1370.49021 [17] LewisFL、VrabieD、VamvoudakisKG。强化学习和反馈控制:使用自然决策方法设计最优自适应控制器。IEEE控制系统杂志2012;32(6):76‐105. ·兹比尔1395.93584 [18] LiY、YangT、TongS。一类非线性系统的自适应神经网络有限时间最优控制。IEEE Trans Neural Netw学习系统。2020;31(11):4451‐4460. [19] LiY、MinX、TongS。不确定非线性系统基于观测器的模糊自适应逆最优输出反馈控制。IEEE Trans Fuzzy系统。2020https://doi.org/10.109/TFUZZ.2020.2979389 ·doi:10.1109/TFUZZ.2020.2979389 [20] 王德、哈姆、乔杰。针对城市污水处理厂的数据驱动迭代自适应临界控制。IEEE Trans Ind Electron公司。2021;68(8):7362‐7369. [21] 姜浩、张浩、崔莹、小刚。基于数据驱动强化学习方法的一类具有完全未知动态的不确定非线性系统的鲁棒控制方案。神经计算。2018;273:68‐77. [22] QuQ、Zhang H、Luo C、YuR。基于自适应动态规划的多人非线性系统的鲁棒控制设计。神经计算。2019;334:1‐10. [23] VamvoudakisKG、VrabieD、LewisFL。带积分强化学习的在线自适应最优控制算法。Int J鲁棒非线性控制。2014;24(17):2686‐2710. ·Zbl 1304.49059号 [24] 王德、刘德、穆克、马赫。不确定互联系统的分散保成本控制:基于学习的最优控制策略。神经计算。2016;214:297‐306. [25] 刘C、张赫、小刚、孙斯。输入受限的未知非线性互联大系统基于积分强化学习的分散最优跟踪控制。神经计算。2019;323:1‐11. [26] BianT、JiangY、JiangZ。大规模系统的分散自适应最优控制及其在电力系统中的应用。IEEE Trans Ind Electron公司。2015;62(4):2439‐2447。 [27] 杨X、曾Z、高Z。非线性互联系统的带批判性学习的分散神经控制器设计。IEEE跨赛博网络早期访问。2021https://doi.org/10.109/TCYB.2021.3085883 ·doi:10.1109/TCYB.2021.3085883 [28] MuC、SunC、WangD、SongA、QianC。具有匹配互联的非线性系统的分散自适应最优镇定。软计算。2018;22(8):2705‐2715. ·Zbl 1398.93127号 [29] 王德、何赫、赵波、刘德。非线性分散反馈稳定问题的自适应近最优控制器。IET控制理论应用。2017;11(6):799‐806. [30] 赵波、王德、石、刘德、李毅。通过策略迭代实现具有未知不匹配互联的大规模非线性系统的分散控制。IEEE Trans-Syst Man-Cybern系统。2018;48(10):1725‐1735. [31] SahooA、XuH、JagannathanS。非线性连续时间系统基于神经网络的事件触发状态反馈控制。IEEE Trans Neural Netw学习系统。2016;27(3):497‐509. [32] VamvoudakisKG公司。连续时间非线性系统的事件触发最优自适应控制算法。IEEE/CAA J自动正弦。2014;1(3):282‐293. [33] 张Q、赵德、朱莉。基于并行学习的连续时间非线性系统的事件触发控制。IEEE Trans-Syst Man-Cybern系统。2017;47(7):1071‐1081. [34] HeH,ZhongX。具有未知内部状态的连续时间系统的事件触发ADP控制方法。IEEE Trans Cybern公司。2017;47(3):683‐694. [35] 王德、何赫、钟X、刘德。事件驱动的非线性折扣最优调节涉及电力系统应用。IEEE Trans Ind Electron公司。2017;64(10):8177‐8186. [36] 王德、何赫、刘德。改进基于事件的非线性控制设计的批判性学习。IEEE跨网络。2017;47(10):3417‐3428. [37] YangX,HeH。使用自适应批评家学习的事件驱动\(H_{\operatorname{\infty})约束控制。IEEE Trans-Cybern早期访问。2020https://doi.org/10.109/TCYB.2020.2972748 ·doi:10.1109/TCYB.2020.2972748 [38] YangX,HeH。使用单网络自适应临界设计的非线性输入约束系统的事件触发鲁棒镇定。IEEE Trans-Syst Man-Cybern系统。2020;50(9):3145‐3157. [39] 张Q、赵德、王德。基于自适应动态规划的不确定非线性系统的事件鲁棒控制。IEEE Trans Neural Netw学习系统。2018;29(1):37‐50. [40] 王德、刘德。通过事件触发机制和自适应学习技术实现神经鲁棒稳定。神经网络。2018;102:27‐35. ·Zbl 1441.93214号 [41] 王德、刘德。通过基于事件的自适应批评家实施学习并保证成本控制。IEEE Trans Neural Netw学习系统。2018;29(12):6004‐6014. [42] YangX、HeH、LiuD。未知非线性系统的事件触发强化学习最优神经控制器设计。IEEE Trans-Syst Man-Cybern系统。2019;49(9):1866‐1878. [43] 刘特、江泽、张鹏。大规模非线性系统的分散事件触发控制。Int J鲁棒非线性控制。2020;30(4):1451‐1466. ·Zbl 1465.93010号 [44] 张毅、赵波、刘德。具有未知动态的多玩家零和游戏的事件触发自适应动态规划。软计算。2021;25(1):2237‐2251. ·Zbl 1492.91015号 [45] 刘德、王德、李海。一类连续时间非线性互联系统的分散镇定,采用在线学习最优控制方法。IEEE Trans Neural Netw学习系统。2014;25(2):418‐428. [46] Wang D、Liu D、LiH、MaH。一类不确定非线性系统基于神经网络的自适应动态规划鲁棒最优控制设计。信息科学。2014;282:167-179·Zbl 1354.93045号 [47] 王德、穆克、刘德、马赫。基于自适应评论的非线性(H_{\operatorname{\infty}})控制的混合数据和事件驱动设计。IEEE Trans Neural Netw学习系统。2018;29(4):993‐1005. [48] 王德、穆克、贺、刘德。通过NDP策略对具有不确定性的非线性系统进行事件驱动自适应鲁棒控制。IEEE Trans-Syst Man-Cybern系统。2017;47(7):1358‐1370. [49] 刘易斯FL、贾加纳坦S、耶西尔迪拉克A。机器人机械手和非线性系统的神经网络控制。泰勒和弗朗西斯;1999 [50] KhalilHK公司。非线性系统。普伦蒂斯·霍尔;2002. ·兹比尔1003.34002 此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。