×

一类非线性系统的在线策略迭代优化算法。 (英语) Zbl 1454.93060号

摘要:提出了一种用于设计一类非线性系统在线(H_)最优律的新策略迭代方案。首先,应用基于神经网络的线性微分包含技术和两个多层感知对非线性项进行线性化。然后,将在线部分无模型策略迭代方案应用于线性化系统,以获得H_(infty)最优控制律的设计。线性H_(infty)控制问题的迭代格式由策略评估和通过代数Riccati方程改进的策略组成。我们建立了新策略迭代格式对最优控制律的收敛性。通过数值模拟验证了我们设计算法的可行性和适用性。

MSC公司:

93B36型 \(H^\infty)-控制
93立方厘米 控制理论中的非线性系统
93B18号机组 线性化
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Ahn,C.K.,基于神经网络线性微分包含的非线性系统的衰减时域鲁棒控制,J.Optim。理论应用。,160, 2, 659-678 (2014) ·Zbl 1304.93037号
[2] Chang,X.-H。;熊,J。;李,Z.-M。;Park,J.H.,离散时间系统的量化静态输出反馈控制,IEEE Trans。Ind.Inf.,14,8,3426-3435(2018)
[3] Chang,X.-H。;Yang,G.-H.,线性离散时间系统输出反馈(H_∞)控制的新结果,IEEE Trans。自动化。对照,59,5,1355-1359(2014)·Zbl 1360.93383号
[4] He,S。;艾,Q。;Ren,C。;Dong,J。;Liu,F.,异步切换下一类不确定非线性时滞系统的有限时间弹性控制器设计,IEEE Trans。系统。人类网络。,49, 2, 281-286 (2019)
[5] He,S。;宋,J。;丁,Z。;Liu,F.,使用新型策略迭代算法对连续时间Markov跳跃线性系统进行在线自适应最优控制,IET控制理论应用。,9, 10, 1536-1543 (2015)
[6] He,S。;宋,J。;Liu,F.,使用滑模控制策略的时滞二次非线性系统的鲁棒有限时间有界控制器设计,IEEE系统。人类网络。,48, 11, 1863-1873 (2018)
[8] 何,X。;黄,T。;Yu,J。;李,C。;Zhang,Y.,基于多智能体网络的分布式优化连续时间算法,IEEE Trans。系统。人类网络。(2017)
[9] 江,B。;Kao,Y。;Karimi,H.R。;Gao,C.,具有一般不确定转移率的奇异切换半马尔可夫跳跃系统的稳定性和镇定,IEEE Trans。自动化。控制,63,11,3919-3926(2018)·Zbl 1423.93397号
[10] 江,B。;Karimi,H.R。;Kao,Y。;Gao,C.,非线性半马尔可夫跳T-S模糊系统的新型鲁棒模糊积分滑模控制,IEEE Trans。模糊系统。,26, 6, 3594-3604 (2018)
[11] 姜瑜。;Jiang,Z.-P.,具有完全未知动力学的连续时间线性系统的计算自适应最优控制,Automatica,48,102699-2704(2012)·Zbl 1271.93088号
[12] Karimi,H.R。;Maralani,P.J。;罗曼,B。;Moshiri,B.,使用多项式参数相关二次函数对参数相关状态延迟系统的(h∞)控制,国际J控制,78,4,254-263(2005)·兹比尔1083.93012
[13] Kleinman,D.,《关于Riccati方程计算的迭代技术》,IEEE Trans。自动化。控制,13,1114-115(1968)
[14] 刘易斯,F.L。;Vrabie,D.,反馈控制的强化学习和自适应动态规划,IEEE电路系统。Mag.,9,3,32-50(2009)
[15] 利马诺德,S。;Si,J.,基于神经网络的控制设计:LMI方法,IEEE Trans。神经网络。,9, 6, 1422-1429 (1998)
[16] 刘,D。;Wei,Q.,离散非线性系统的策略迭代自适应动态规划算法,IEEE Trans。神经网络。学习。系统。,25, 3, 621-634 (2014)
[17] 刘,D。;魏强。;Yan,P.,离散非线性系统的广义策略迭代自适应动态规划,IEEE Trans。系统。人类网络。,45, 12, 1577-1591 (2015)
[18] 刘杰。;Wei,L。;谢,X。;田,E。;Fei,S.,具有混合触发机制和随机网络攻击的T-S模糊系统的量化镇定,IEEE Trans。模糊系统。,26, 6, 3820-3834 (2018)
[19] 刘杰。;查,L。;谢,X。;田,E.,基于弹性观测器的混合触发网络非线性T-S模糊系统控制,非线性动力学。,91, 3, 2049-2061 (2018) ·Zbl 1390.93327号
[20] 刘,X。;Cao,J.,具有不连续激活的神经网络的鲁棒状态估计,IEEE系统。人类网络。,40, 6, 1425-1437 (2010)
[21] 卢,L.-Z。;Lin,W.-W.,求解离散代数Riccati方程的迭代算法,线性代数应用。,188, 465-488 (1993) ·Zbl 0779.65038号
[22] 栾,X。;Shi,P。;Liu,F.,基于失谐的马尔可夫跳跃系统Given-time多频控制,信息科学。,451-452 (2018) ·Zbl 1448.93221号
[23] 莫达雷斯,H。;Sistani,M.-B.N。;Lewis,F.L.,连续时间约束输入系统在线最优控制的策略迭代方法,ISA Trans。,52, 5, 611-621 (2013)
[24] Mu,C。;镍,锌。;Sun,C。;He,H.,基于自适应动态规划的吸气式高超声速飞行器跟踪控制,IEEE Trans。神经网络。学习。系统。,28,3584-598(2017)
[25] Seiffertt,J.E。;三亚,S。;Wunsch,D.C.,Hamilton-Jacobi-Bellman方程和时间尺度上的近似动态规划,IEEE系统。人类网络。,38, 4, 918-923 (2008)
[26] Shi,H。;林,Z。;张,S。;李,X。;Hwang,K.,机器人足球的模糊贝叶斯强化学习自适应决策方法,信息科学。,436-437 (2018)
[27] 宋,J。;He,S。;丁,Z。;Liu,F.,基于在线实现的求解连续马尔可夫跳跃线性系统(h∞)控制问题的新迭代算法,国际鲁棒非线性控制,26,17,3737-3754(2016)·Zbl 1351.93055号
[28] Tanaka,K.,《神经网络控制系统稳定性准则的方法》,IEEE Trans。神经网络。,7, 3, 629-642 (1996)
[29] 弗拉比,D。;Lewis,F.L.,基于策略迭代的连续非线性系统自适应最优控制算法,Proc。第47届IEEE决策与控制会议,73-79(2008)
[30] 弗拉比,D。;帕斯特拉瓦努,O。;阿布·哈拉夫,M。;Lewis,F.L.,基于策略迭代的连续线性系统自适应最优控制,Automatica,45,2,477-484(2009)·Zbl 1158.93354号
[31] Waljee,A.K。;刘,B。;Sauder,K。;朱,J。;Govani,S.M。;斯蒂德姆,R.W。;Higgins,P.D.R.,用维多利珠单抗预测克罗恩病无皮质类固醇生物缓解,炎症。肠道疾病。,24, 6, 1185-1192 (2018)
[32] Waljee,A.K。;刘,B。;Sauder,K。;朱,J。;Govani,S.M。;Stidham,R.W。;Higgins,P.D.R.,用维多利珠单抗预测溃疡性结肠炎的无皮质类固醇内镜缓解,Aliment。药理学。疗法。,47, 6, 763-772 (2018)
[33] 王,D。;刘,D。;Li,H.,一类连续非线性系统鲁棒控制在线设计的策略迭代算法,IEEE Trans。自动。科学。工程,11,2,627-632(2014)
[34] Wang,F。;张,H。;Liu,D.,自适应动态编程:简介,IEEE计算。智力。Mag.,4,2,39-47(2009)
[35] Wang,Y。;Karimi,H.R。;沈,H。;方,Z。;Liu,M.,非线性广义系统基于模糊模型的滑模控制,IEEE Trans。赛博。(2018)
[36] Wang,Y。;沈,H。;Duan,D.,关于量化采样数据神经网络控制系统的稳定性,IEEE Trans。系统。人类网络。,47, 10, 3124-3135 (2017)
[37] Wu,H。;罗,B.,学习线性连续时间(h∞)状态反馈控制解的同步策略更新算法,信息科学。,222472-485(2013年)·Zbl 1293.93275号
[38] 翟,D。;An,L。;李,X。;Zhang,Q.,具有多传感器故障和未知控制方向的非线性系统的自适应容错控制,IEEE Trans。神经网络。学习。系统。,29, 9, 4436-4446 (2018)
[39] 翟,D。;An,L。;Ye,D。;Zhang,Q.,针对Markovian跳跃传感器故障的自适应可靠静态输出反馈控制,IEEE Trans。神经网络。学习。系统。,第29页,第3页,第631-644页(2018年)
[40] 张博士。;徐,Z。;Karimi,H.R。;王庆国。;Yu,L.,具有非周期采样数据通信的异构线性多智能体系统一致性的分布式(H_∞)输出反馈控制,IEEE Trans。Ind.Electron公司。,65, 5, 4145-4155 (2018)
[41] 张博士。;徐,Z。;Srinivasan,D。;Yu,L.,Leader-fowler consensition of multi-agent systems with energy constraints:a Markovian system approach,IEEE Trans。系统。人类网络。,47, 7, 1727-1736 (2017)
[42] 张,H。;魏强。;Liu,D.,求解一类非线性零和微分对策的迭代自适应动态规划方法,Automatica,47,1207-214(2011)·Zbl 1231.91028号
[43] 钟,X。;He,H.,具有未知内部状态的连续时间系统的事件触发ADP控制方法,IEEE Trans。系统。人类网络。,47, 3, 683-694 (2017)
[44] 钟,X。;He,H。;王,D。;Ni,Z.,未知非线性零和微分对策的无模型自适应控制,IEEE Trans。赛博。,48, 5, 1633-1646 (2018)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。