×

具有平均驻留时间的切换非线性系统的滑模表面自适应actor-critic最优控制。 (英语) Zbl 07786227号

摘要:本文研究了一类具有平均驻留时间(ADT)的连续切换非线性系统的基于滑模面(SMS)的自适应最优控制问题。通过开发与SMS相关的特定成本函数,将原来的控制问题等价地转化为寻找一系列最优控制策略的问题。然后,将从哈密尔顿-雅可比-贝尔曼(HJB)方程中分离出来的误差项积分为一个函数,有效地减少了近似误差引起的一些重复放大的影响。此外,HJB方程的解由基于SMS的AC神经网络(NNs)识别,其中开发了参与者和批评者NNs以同时执行RL策略。参与者更新律是根据系统输出来执行控制动作,而批评者更新律则需要评估当前的控制动作并反馈给参与者。基于Lyapunov稳定性理论,验证了所提出的自适应交流最优控制方法的适用性,以保证所考虑的闭环切换非线性系统中所有信号的有界性。最后,通过仿真实例说明了所提出的自适应最优控制方法的有效性。

MSC公司:

93年XX月 系统论;控制
68倍 计算机科学
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Wang,Y。;牛,B。;Wang,H。;阿洛塔比,N。;Abozinadah,E.,具有规定性能的切换非线性系统的基于神经网络的自适应跟踪控制:平均停留时间切换方法,神经计算,435295-306(2021)
[2] Chang,Y。;周,P。;牛,B。;Wang,H。;徐,N。;阿拉斯萨菲,M。;Ahmad,A.,通过平均驻留时间实现纯反馈切换非线性系统基于开关观测器的未知增益自适应输出反馈控制设计,国际期刊系统。科学。,1-15 (2021)
[3] 徐,N。;X.赵。;宗,G。;王毅,实现渐近跟踪性能的不确定切换非严格反馈非线性系统自适应控制设计,应用数学与计算,408126344(2021)·兹比尔1510.93165
[4] 莫尔特,A。;Rafikov,M.,人口系统的非线性最优控制:在生态系统中的应用,非线性动力学。,76, 2, 1141-1150 (2014) ·Zbl 1306.92066号
[5] X.Tang,D.Zhai,X.Li,高超声速飞行器全状态约束下基于自适应容错控制的有限时间反推,信息科学。507(2020)53-66·Zbl 1461.93266号
[6] H.Xiao,C.P.Chen,使用基于模型预测的协议与切换拓扑的时变非完整机器人一致性形成,信息科学。567 (2021) 201-215. ·Zbl 1526.93246号
[7] X.Zhao,X.Wang,L.Ma,G.Zong,一类不确定切换非线性系统基于模糊逼近的渐近跟踪控制,IEEE Trans。模糊系统。28(4) (2019) 632-644.
[8] 刘振华,陈斌,林振中,一类切换非线性系统的自适应神经量化控制,科学与信息。537 (2020) 313-333. ·兹比尔1475.93064
[9] 苏,X。;Wu,L。;Shi,P。;Chen,C.P.,随机扰动模糊切换系统的模型逼近,IEEE Trans。模糊系统。,23, 5, 1458-1473 (2014)
[10] 李毅。;隋,S。;Tong,S.,具有任意切换和未建模动态的随机非线性切换系统的自适应模糊控制设计,IEEE Trans。赛博。,47, 2, 403-414 (2016)
[11] 卢,J。;她,Z。;冯·W。;Ge,S.S.,基于分段连续标量函数的时变切换系统的稳定性,IEEE Trans。自动。控制,64,6,2637-2644(2018)·Zbl 1482.34134号
[12] 马·R。;An,S.,一类切换正非线性系统全局指数稳定性的最小驻留时间,IEEE/CAA J.Autom。罪。,6, 2, 471-477 (2018)
[13] 刘,X。;钟,S。;赵强,延迟切换非线性系统动力学及其在级联系统中的应用,Automatica,87,251-257(2018)·Zbl 1378.93109号
[14] 马,L。;徐,N。;霍,X。;Zhao,X.,具有平均驻留时间的切换纯反馈非线性系统的自适应有限时间输出反馈控制设计,非线性分析:混合系统。,第37条,第100908页(2020年)·Zbl 1478.93327号
[15] 江,B。;沈,Q。;Shi,P.,任意切换下切换非线性纯反馈系统的神经网络自适应跟踪控制,Automatica,61119-125(2015)·Zbl 1327.93246号
[16] Chesi,G。;Colaneri,P.,具有任意切换和驻留时间约束的切换系统性能分析的齐次有理lyapunov函数,IEEE Trans。自动。控制,62,10,5124-5137(2017)·兹比尔1390.93704
[17] 周,P。;张,L。;张,S。;Alkhateeb,A.F.,基于观测器的切换纯反馈非线性系统规定性能的自适应模糊有限时间控制设计,IEEE Access,9,69481-69491(2021)
[18] Precup,R.E。;罗马人,R.C。;Teban,T.A。;Albu,A。;Petriu,E.M。;Pozna,C.,假手肌电控制系统中手指动力学的无模型控制,Stud.Inf.control,29,4,399-410(2020)
[19] 萝卜,A。;Panggabean,J.,基于混合控制器设计的四分之一汽车悬架磁流变减振器查找表,国际J.Artif。智能,18,1,193-206(2020)
[20] 李毅。;徐,N。;牛,B。;Chang,Y。;赵,J。;Zhao,X.,具有未建模动态和扰动的不确定非线性系统基于Small-gain技术的自适应模糊命令滤波控制,国际自适应控制和信号处理杂志,35,9,1664-1684(2021)
[21] 温,S。;陈明珠。;曾,Z。;Yu,X。;Huang,T.,通过动态滑模方法对不确定车辆主动悬架系统进行模糊控制,IEEE Trans。系统。网络人:系统。,47, 1, 24-32 (2016)
[22] 尹,S。;Yang,H。;高,H。;邱,J。;Kaynak,O.,《具有未建模动态的非线性时变时滞系统的基于nn的自适应容错控制方法》,IEEE Trans。神经网络学习。系统。,28, 8, 1902-1913 (2016)
[23] Lei,J。;Khalil,H.K.,使用高增益预测器对具有时变输入和输出延迟的非线性系统进行反馈线性化,IEEE Trans。自动。控制,61,8,2262-2268(2015)·Zbl 1359.93107号
[24] 刘,D。;Yang,X.先生。;Li,H.,一类具有未知内部动力学的连续仿射非线性系统的自适应最优控制,神经计算。申请。,23, 7-8, 1843-1850 (2013)
[25] 刘,Y。;高,Y。;唐,S。;Li,Y.,一类具有死区的非线性离散时间系统的基于模糊逼近的自适应反推最优控制,IEEE Trans。模糊系统。,24, 1, 16-28 (2015)
[26] Lv,Y。;Na,J。;杨琼。;吴,X。;郭毅,动力学完全未知的连续非线性系统的在线自适应最优控制,国际控制杂志,89,1,99-112(2016)·Zbl 1332.93174号
[27] 罗,B。;刘,D。;Wu,H.,仅限评论家结构的基于数据的非线性离散时间系统的自适应约束最优控制设计,IEEE Trans。神经网络学习。系统。,29, 6, 2099-2111 (2017)
[28] N.Xu,B.Niu,H.Wang,X.Huo,X.Zhao,用于解决完全未知非线性系统的最优事件触发跟踪控制问题的单网络adp,Int.J.Intell。系统。doi:10.1002/int.22491。
[29] 温,G。;Chen,C.P。;Ge,S.S。;Yang,H。;Liu,X.,使用actor-critic强化学习策略的优化自适应非线性跟踪控制,IEEE Trans。Ind.Inf.,15,9,4969-4977(2019)
[30] Schmid,V.,使用近似动态规划解决动态救护车搬迁和调度问题,Eur.J.Oper。研究,219,3,611-621(2012)·Zbl 1253.90155号
[31] 刘,D。;王,D。;赵,D。;魏强。;Jin,N.,使用全局对偶启发式规划对一类未知离散非线性系统进行基于神经网络的最优控制,IEEE Trans。自动。科学。工程师,9,3,628-634(2012)
[32] 巴辛,S。;Kamalapurkar,R。;约翰逊,M。;Vamvoudakis,K.G。;刘易斯,F.L。;Dixon,W.E.,不确定非线性系统近似最优控制的新型actor-critic-identifier结构,Automatica,49,1,82-92(2013)·Zbl 1257.93055号
[33] 王,W。;Chen,X.,基于actor-critic框架的多智能体系统无模型最优控制,神经计算,314,242-250(2018)
[34] R.Palm。;Driankov,D.,使用滑模控制原理设计模糊增益调度器,模糊集系统。,121, 1, 13-23 (2001) ·Zbl 0983.93039号
[35] 海德格尔,T。;Kovács,L。;Precup,R.E。;Preitl,S。;贝尼奥,B。;Benyó,Z.,为空间医学服务的远程机器人系统的级联控制,IFAC Proc。第44卷,第1卷,第3759-3764页(2011年)
[36] Asl,R.M。;哈格,Y.S。;Palm,R.,自适应非奇异终端滑模鲁棒控制,工程应用。Artif公司。智力。,59, 205-217 (2017)
[37] Chiu,C.,一类mimo非线性系统的微分和积分终端滑模控制,Automatica,48,2,316-326(2012)·Zbl 1260.93033号
[38] 纳西里,A。;Nguang,S.K。;斯温,A。;Almakhles,D.,一类具有不确定性的mimo非线性系统的被动执行器容错控制,国际控制杂志,92,3,693-704(2019)·Zbl 1414.93081号
[39] 费,J。;Lu,C.,使用双环递归神经网络结构的动态系统自适应滑模控制,IEEE Trans。神经网络学习。系统。,29, 4, 1275-1286 (2017)
[40] 崔,R。;Chen,L。;杨,C。;Chen,M.,具有未知扰动和不确定非线性的水下机器人基于扩展状态观测器的积分滑模控制,IEEE Trans。工业。电子。,64, 8, 6785-6795 (2017)
[41] 熊,J。;Zhang,G.,四旋翼无人机的全局快速动态终端滑模控制,ISA Trans。,66, 233-240 (2017)
[42] X.赵。;Yang,H。;Zong,G.,非严格反馈非线性系统的自适应神经递阶滑模控制及其在电子电路中的应用,IEEE Trans。系统。网络人:系统。,47, 7, 1394-1404 (2016)
[43] 范,Q。;Yang,G.,状态约束仿射非线性系统的近最优滑模容错控制,神经计算,21678-88(2016)
[44] 张,H。;徐,N。;宗,G。;Alkhateeb,A.,带执行器故障的不确定欠驱动切换非线性系统的自适应模糊分层滑模控制,国际系统科学杂志,52,8,1499-1514(2021)·Zbl 1483.93325号
[45] B.Zhao,D.Liu,C.Alippi,具有渐近稳定临界结构的不确定非线性系统基于滑模曲面的近似最优控制,IEEE Trans。赛博。doi:10.1109/TCYB.2019.2962011。
[46] 赵,J。;Na,J。;Gao,G.,基于自适应动态规划的非匹配不确定性非线性系统鲁棒控制,神经计算,395,56-65(2020)
[47] 赵,J。;Gan,M.,使用强化学习的连续时间不确定非线性系统的Finite-horizon最优控制,国际期刊系统。科学。,51, 13, 2429-2440 (2020) ·Zbl 1483.49038号
[48] Long,L。;王,Z。;Zhao,J.,具有不稳定子系统的切换非线性参数化系统的切换自适应控制,Automatica,54,217-228(2015)·兹比尔1318.93082
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。