唐玉红;杨,熊;Na Dong 不匹配互联非线性系统分散神经控制的自适应动态规划。 (英语) Zbl 1531.93020号 最佳方案。控制应用程序。方法 43,第5期,1501-1519(2022). 摘要:本文通过一种最优控制方法,对一类具有非匹配关联的连续非线性系统提出了一种分散神经控制方案。将所研究的非线性互联系统的分散控制问题转化为一组辅助子系统的最优控制问题。首先,设计了与关联项边界相关的辅助子系统的价值函数。证明了在一定条件下,由辅助子系统的最优控制策略组成的分散控制可以稳定整个互联系统。然后,提出了一种自适应动态规划算法来求解Hamilton-Jacobi-Bellman方程。采用临界神经网络(NN)逼近辅助子系统的值函数,以获得最优控制策略。此外,证明了辅助子系统的状态和关键神经网络的权重估计误差一致最终有界。最后,通过一个数值算例和一个互联电力系统验证了所提出的分散神经控制策略。{©2022 John Wiley&Sons有限公司} 引用于三文件 MSC公司: 93年第14页 分散的系统 93C40型 自适应控制/观测系统 49升20 最优控制与微分对策中的动态规划 93立方厘米10 控制理论中的非线性系统 93B70型 网络控制 关键词:自适应动态规划;分散控制;不匹配互连;最优控制;强化学习 PDF格式BibTeX公司 XML格式引用 \textit{Y.Tang}等人,Optim。控制应用程序。方法43,No.5,1501--1519(2022;Zbl 1531.93020) 全文: 内政部 参考文献: [1] 胡杰,曹杰,陈明珠,等。基于集中控制的多个异构TCL聚合器的负载跟踪。IEEE输电系统。2017;32(4):3157‐3167. [2] FattahiS、FazelniaG、LawaiJ、ArcakM。将最优集中式控制器转换为近全局最优静态分布式控制器。IEEE Trans Automat控制。2019;1(64):66‐80. ·Zbl 1423.93415号 [3] TongS、SunK、SuiS。严格反馈非线性大系统的基于观测器的自适应模糊分散最优控制设计。IEEE Trans Fuzzy系统。2018年;26(2):569‐584. [4] 巴库莱尔。分散控制:概述。年收入控制。2008;32(1):87‐98. [5] BianT、JiangY、JiangZP。大规模系统的分散自适应最优控制及其在电力系统中的应用。IEEE Trans Ind Electron公司。2015;62(4):2439‐2447. [6] NarayananV、SahooA、JagannathanS、GeorgeK。使用事件触发非零和对策的非线性互联系统的近似最优分布式控制。IEEE Trans Neural Netw学习系统。2019;30(5):1512‐1522. [7] YangX,HeH。具有不匹配互连的不确定非线性大系统分散镇定的自适应动态规划。IEEE Trans-Syst Man-Cybern系统。2020;50(8):2870‐2882. [8] 霍伊、王德、乔杰。连续时间非线性互联系统分散事件触发控制的自适应临界优化。光电控制应用方法。2022;43(1):198‐212. ·Zbl 1531.93207号 [9] MuC、SunC、WangD、SongA、QianC。具有匹配互联的非线性系统的分散自适应最优镇定。软计算。2018年;22(8):2705‐2715. ·Zbl 1398.93127号 [10] Werbos PJ公司。超越回归:行为科学中预测和分析的新工具。博士论文。马萨诸塞州剑桥:哈佛大学;1974 [11] 伟Q、廖Z、杨Z、LiB、LiuD。连续时变策略迭代。IEEE Trans Cybern公司。2020;50(12):4958‐4971. [12] 罗B、刘德、吴翰、王德、刘易斯FL。基于数据的最优控制的策略梯度自适应动态规划。IEEE Trans Cybern公司。2017;47(10):3341‐3354. [13] 罗波、杨毅、刘德。适应的[(Q\]\)-学习基于数据的最优输出调节,并进行经验回放。IEEE Trans Cybern公司。2018年;48(12):3337‐3348. [14] BertsekasDP。最优控制和自适应动态规划中的值和策略迭代。IEEE Trans Neural Netw学习系统。2017;28(3):500‐509. [15] 苏赫、张赫、张克、高伟。通过数值迭代对一类部分未知连续非线性系统进行在线强化学习。光电控制应用方法。2018年;39(2):1011‐1028. ·Zbl 1391.93133号 [16] VrabieD,弗吉尼亚州,路易斯佛罗里达州。基于强化学习原理的最优自适应控制和微分对策。IET;2012 [17] WeiQ、LiuD、LiuY、SongR。通过自适应动态规划优化微电网中的约束自学习电池顺序管理。IEEE/CAA J自动化标准。2017;4(2):168‐176. [18] 刘德、徐毅、魏强、刘翔。基于自适应动态规划的变气候太阳能住宅能源调度。IEEE/CAA J自动化标准。2018年;5(1):36‐46. [19] 郭伟(GuoW)、司杰(SiJ)、刘芳(LiuF)、梅斯(MeiS)。离散时间非线性系统的策略迭代近似动态规划中的策略近似。IEEE Trans Neural Netw学习系统。2018年;29(7):2794‐2807. [20] YangX,HeH。非线性约束优化的近似动态规划。IEEE跨网络。2021;51(5):2419‐2432. [21] YangX,HeH。具有未知动态的非线性系统事件触发鲁棒控制的自适应批评器设计。IEEE Trans Cybern公司。2019;49(6):2255‐2267。 [22] BuX、XiaoY、LeiH。高超声速飞行器基于自适应批评性设计的模糊神经控制器:预定义的行为非仿射控制。IEEE/ASME Trans Mechatron公司。2019;24(4):1871‐1881. [23] BuX、QiQ。基于单网络自适应临界设计的高超声速飞行器模糊最优跟踪控制。IEEE Trans Fuzzy系统。2020;30(1):270‐278. [24] 王德、哈姆、乔杰。事件驱动形式下离散非线性系统的自学习最优调节。IEEE传输自动控制。2020;65(3):1272‐1279. ·Zbl 1533.93653号 [25] 王德、哈姆、乔杰。针对城市污水处理厂的数据驱动迭代自适应临界控制。IEEE跨行业电子。2021;68(8):7362‐7369. [26] SongR、LewisFL、WeiQ。解非线性连续多人非零和博弈的非策略积分强化学习方法。IEEE Trans Neural Netw学习系统。2017;28(3):704‐713. [27] Yang D、LiT、Zhang H、XieX。使用强化学习方法对非线性约束输入系统进行基于事件触发的鲁棒控制。神经计算。2019;340:158‐170. [28] 王德、何赫、赵波、刘德。非线性分散反馈稳定问题的自适应近最优控制器。IET控制理论应用。2017;11(6):799‐806. [29] 刘德、王德、李海。利用在线学习最优控制方法对一类连续时间非线性互联系统进行分散镇定。IEEE Trans Neural Netw学习系统。2014年;25(2):418‐428. [30] YangX,HeH。使用强化学习的一类非线性互联系统的分散事件触发控制。IEEE Trans Cybern公司。2021;51(2):635‐648。 [31] 赵波、王德、石、刘德、李毅。通过策略迭代实现具有未知不匹配互联的大规模非线性系统的分散控制。IEEE Trans-Syst Man-Cybern系统。2018年;48(10):1725‐1735. [32] Narayanan V,JagannathanS公司。仿射非线性互联系统的事件触发分布式近似最优状态和输出控制。IEEE Trans Neural Netw学习系统。2018年;29(7):2846‐2856. [33] 苏赫、张赫、梁X、刘C。无线通信网络上未知大规模系统的分散事件触发在线自适应控制。IEEE Trans Neural Netw学习系统。2020;31(11):4907‐4919. [34] 亚历山大岛伊拉克利奥斯D。用于功率调节的多任务自动发电控制。2005年《电力系统研究》;73(3):275‐285。 [35] KhalilHK公司。非线性系统。普伦蒂斯·霍尔;2002. ·Zbl 1003.34002号 [36] 林夫。鲁棒控制设计:一种最优控制方法。约翰·威利父子公司;2007 [37] YangX,HeH。具有非匹配关联的不确定非线性系统最优控制的自适应批评器设计。神经网络。2018年;105:142‐153. ·Zbl 1441.93223号 [38] BeardRW、SaridisGN、WenJT。广义Hamilton‐Jacobi‐Bellman方程的Galerkin近似。自动化。1997;33(12):2159‐2177. ·Zbl 0949.93022号 [39] Liu D、WeiQ、Wang D、Yang X、LiH。自适应动态规划及其在最优控制中的应用。施普林格;2017. ·Zbl 1390.93003号 [40] HornikK、StinchcombeM、WhiteH。使用多层前馈网络对未知映射及其导数进行普遍逼近。神经网络。1990;3(5):551‐560. [41] 阿布‐哈拉夫M,黄J,路易斯安那州。非线性[( {H} _2/{H}_约束反馈控制:一种使用神经网络的实用设计方法。施普林格;2006. ·Zbl 1116.93028号 [42] VamvoudakisKG,路易斯安那州。在线actor-critic算法求解连续时间无限时域最优控制问题。自动化。2010年;46(5):878‐888. ·Zbl 1191.49038号 [43] VasicPM米特里诺维奇。分析不等式。施普林格;1970. ·兹比尔0199.38101 [44] 刘易斯(LewisF)、贾甘纳坦(JagannathanS)、耶西尔迪拉克(YesildirakA)。机器人机械手和非线性系统的神经网络控制。泰勒和弗朗西斯;1999 [45] 霍克斯、卡里米赫尔、赵克斯、王勃、宗庚。标识符关键框架内约束非线性互联系统分散事件触发控制的自适应关键设计。IEEE Trans-Cybern。2020年doi:10.1109/TCYB.2020.3037321 [46] DuP、PanY、LiH、LamHK。大规模非线性系统的非奇异有限时间事件触发模糊控制。IEEE Trans Fuzzy系统。2021;29(8):2088‐2099. [47] 罗芙、赵波、刘德。基于自适应动态规划的非匹配互联非线性系统的事件触发分散最优容错控制。光电控制应用方法。2021;42(5):1365‐1384. ·Zbl 1472.93118号 [48] 罗波、杨毅、刘德、吴翰。事件触发的最优控制,使用自适应动态编程实现性能保证。IEEE Trans Neural Netw学习系统。2020;31(1):76‐88. [49] BuX、QiQ、JiangB。应用于乘波飞机的具有规定性能的简化有限时间模糊神经控制器。IEEE跨模糊系统2021。doi:10.1109/TFUZZ.2021.3089031 此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。