×

基于指令滤波器的约束非严格反馈非线性系统自适应actor-critic神经最优控制。 (英语) Zbl 1534.93222号

摘要:本文研究具有未建模动态的非严格反馈形式的状态约束非线性系统的actor-critic神经最优控制。引入的补偿信号抵消了传统动态表面控制(DSC)中的滤波误差。两个设计阶段共同决定了输入:前馈输入设计和近似最优输入设计。在前馈输入设计中,建立了一个映射规则,使所有状态保持在有限范围内,并设计了一阶附加信号来处理未建模动态。在近似最优输入设计中,通过自适应动态规划(ADP)使近似最优输入最小化依赖于重构误差系统的成本函数。在整个设计过程中,用径向基函数神经网络(RBFNNs)对未知非线性不确定部分进行拟合。稳定性分析表明,受控系统中的所有信号都是有界的。通过两个仿真实例验证了理论结果。
©2023 John Wiley&Sons有限公司。

MSC公司:

93C40型 自适应控制/观测系统
49升20 最优控制与微分对策中的动态规划
93B52号 反馈控制
93立方厘米 控制理论中的非线性系统
93E11号机组 随机控制理论中的滤波
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] KanellakopoulosI、KokotovicPV、MorseAS。反馈线性化系统自适应控制器的系统设计。IEEE Trans Automat Contr.1991;36(11):1241‐1253. ·Zbl 0768.93044号
[2] 刘华、潘YP、曹京东、王HX、周毅。执行器故障分数阶非线性系统的自适应神经网络反推控制。IEEE Trans Neural Netw学习系统2020;31(12):5166‐5177.
[3] ChenQ、ShiHH、SunMX。严格反馈系统基于回声状态网络的反推自适应迭代学习控制:一种误差跟踪方法。IEEE Trans Cybern.2020;50(11):3009‐3022.
[4] ShangY、ChenB、LinC。基于自适应神经反步法的分布式非线性多智能体系统的一致性跟踪控制。IEEE Trans-Syst Man-Cybern系统2020;50(7):2436‐2444.
[5] HeKH、DongCY、WangQ。基于多个扩展状态观测器的不确定纯反馈系统抗干扰动态逆反推控制。J Frank Inst.2021;35(13):6385‐6407. ·Zbl 1470.93057号
[6] LiuYC、ZhuQD、Zhang、Wang LP。具有时变状态约束和类间隙滞后的非严格反馈非线性系统的自适应模糊反推控制。通知科学。2021;574:606‐624.
[7] YangWL、ShiZY、ZhongYS。不匹配不确定性非线性系统的鲁棒反推非光滑实用跟踪。国际J鲁棒非线性控制2022;32(6):3674‐3695.
[8] LiXY、HeJS、WenCY、LiuXK。一类具有外部扰动的不确定非公度分数阶非线性系统的基于Backstepping的自适应控制。IEEE跨行业电子。2022;69(4):4087‐4095.
[9] 郑熙、张赫、杨海川、杨福伟、王泽平、维拉西克。通过云辅助自适应后推方法实现主动整车悬架控制。IEEE Trans Cybern.2020;50(7):3113‐3124.
[10] 孙JL、YiJQ、PuZQ、LiuZ。高超声速飞行器有限时间收敛的自适应模糊非光滑反推输出反馈控制。IEEE Trans Fuzzy系统。2020;28(10):2320‐2334.
[11] ZhengXL、YangXB。扰动PVTOL飞机的改进自适应神经网络反推控制设计。神经计算机。2020;410:51‐60.
[12] ChengX、ZhangYJ、LiuHS、WollherrD、BussM。具有有界转矩输入的柔性关节机器人的自适应神经反步法控制。神经计算机。2021;458:70‐86.
[13] DuJL、LiJ、LewisFL。基于数据驱动状态预测器的欠驱动AUV通信延迟分布式三维时变编队控制。IEEE Trans Ind Inf.2023;19(5):6963‐6971.
[14] SwaroopD、HedrickJK、YipPP。一类不确定非线性系统的动态表面控制。IEEE Trans Automat控制。2000;45(10):1893‐1899. ·Zbl 0991.93041号
[15] SunWW、WangLP、WuY。具有未知控制方向的状态约束时滞非线性非紧反馈系统的自适应动态表面模糊控制。IEEE Trans-Syst Man Cybern系统2021;51(12):7423‐7434.
[16] LiKW、LiYM。非线性系统的自适应神经网络有限时间动态表面控制。IEEE Trans Neural Netw学习系统2021;32(12):5688‐5697.
[17] YooSJ。针对不确定非线性时滞网络物理系统的未知欺骗攻击,基于神经网络的自适应弹性动态表面控制。IEEE Trans Neural Netw学习系统。2020;31(10):4341‐4353.
[18] 杨毅、刘克德、岳德、韩秋林。基于预测器的神经动态表面控制用于一类非线性多智能体系统的二部跟踪。IEEE Trans Neural Netw学习系统2022;33(4):1791‐1802.
[19] FarrellJA、PolycarpouM、SharmaM、DongW。命令过滤了backstepping。IEEE Trans Automat Contr.2009;54(6):1391‐1395. ·Zbl 1367.93382号
[20] DongW、FarrellJA、PolycarpouM、DjapicV、SharmaM。命令过滤的自适应反推。IEEE变速器控制系统技术。2012;30(3):566‐580.
[21] YuJ、ShiP、DongW、LinC。饱和输入非线性系统的基于指令滤波的模糊控制。IEEE Trans Cybern.2017;47(9):2472‐2479.
[22] YuJ、ShiP、DongW、LinC。基于指令滤波的未知死区非线性系统的自适应模糊控制。IEEE Trans-fuzzy系统。2018;26(1):46‐55.
[23] 夏JW、张杰、冯杰、王Z、张总。控制方向未知的非线性系统的基于指令滤波器的自适应模糊控制。IEEE Trans-Syst Man-Cybern系统。2021;51(3):1945‐1953.
[24] 张华、刘毅、戴杰、王毅。一类具有滞后的不确定非线性系统的基于指令滤波器的自适应模糊有限时间控制。IEEE Trans Fuzzy系统。2021;29(9):2553‐2564.
[25] 贝尔曼R。动态编程。普林斯顿大学出版社;1957. ·Zbl 0077.13605号
[26] WerbosP公司。用于实时控制和神经建模的近似动态规划。在:WhiteDA(编辑),SofgeDA(编辑),编辑。智能控制手册:神经、模糊和自适应方法。第15卷。Van Nostrand Reinhold公司;1992:493‐525.
[27] 江毅、江泽平。非线性系统的鲁棒自适应动态规划和反馈镇定。IEEE Trans Neural Netw学习系统2014;23(5):882‐893.
[28] 江泽平高文。严格反馈非线性系统的基于学习的自适应最优跟踪控制。IEEE Trans Neural Netw学习系统2018;29(6):2614‐2624.
[29] FanB、YangQM、TangXY、SunYX。具有输出约束的连续时间非线性系统的鲁棒ADP设计。IEEE Trans Neural Netw学习系统2018;29(6):2127‐2138.
[30] 赵峰、高文、江泽平、刘TF。带有输出反馈的事件触发自适应最优控制:一种自适应动态规划方法。IEEE Trans Neural Netw学习系统2021;32(11):5208‐5221.
[31] 扎尔加德赫、迪尔克斯特、贾甘纳坦。基于自适应神经网络的严格反馈形式的非线性连续系统的最优控制。国际自适应控制信号过程。2014;28:305‐324. ·Zbl 1331.93119号
[32] 扎尔加德赫、迪尔克斯特、贾甘纳坦。严格反馈形式的非线性连续时间系统的最优控制。IEEE Trans Neural Netw Learn Sys.2015;26(10):2535‐2549.
[33] SunKK、LiYM、TongSC。严格反馈非线性系统的模糊自适应输出反馈最优控制设计。IEEE Trans-Syst Man Cybern系统2017;47(1):33‐44.
[34] LiYM、SunKK、TongSC。SISO非线性系统基于观测器的自适应模糊容错最优控制。IEEE Trans Cybern.2019;49(2):649‐661.
[35] SunJL、LiuCS、ZhaoX。具有输入和输出约束的导弹-目标拦截系统的基于后退的零和微分对策。IET控制理论应用。2018;12(2):243‐253.
[36] SunJL、LiuCS。具有输入饱和和输出约束的严格反馈形式的多智能体系统的分布式零和微分对策。神经网络。2018;106:8‐19. ·Zbl 1443.91058号
[37] 张TP、徐华新。具有输出约束的严格反馈非线性系统的自适应最优动态表面控制。国际J鲁棒非线性控制。2019;30(5):2059‐2078. ·Zbl 1465.93114号
[38] 张TP、徐和新、夏晓恩、YiY。具有输出约束的不确定非线性系统的自适应神经最优控制。神经计算机。2020;406(17):182‐195.
[39] WenGX、GeSS、TuFW。优化的反步法用于严格反馈系统的跟踪控制。IEEE Trans Neural Netw学习系统2018;29(8):3850‐3862.
[40] Weng GX、Chen CLP、GeSS。一类动态函数未知的非线性严格反馈系统的简化优化反推控制。IEEE Trans Cybern.2021;51(9):4567‐4580.
[41] ShaoXF,YeD。不确定非线性EASS的无可行性条件下的神经自适应延迟全状态约束控制。J Frank Inst.2022;359(7):281‐2832. ·Zbl 1489.93057号
[42] 樊JZ,Zhao L。具有状态约束的多AUV分布式有限时间自适应一致性跟踪控制。J Frank Inst.2021;358(17):9158‐9177. ·Zbl 1478.93596号
[43] 彭梓、奇瑞、江波。具有状态约束的高超声速飞行器系统自适应容错控制。J Frank Inst.2020;357(14):9351‐9377. ·Zbl 1448.93167号
[44] GuoT、WuWM。基于非线性映射的输出约束非线性系统的Backstepping控制。神经计算应用。2014;25:1665‐1674.
[45] 张特普、夏姆Z、YiY。具有全状态约束和未建模动态的严格反馈非线性系统的自适应神经动态表面控制。自动化。2017;81:232‐239. ·Zbl 1372.93125号
[46] ZhaoK、SongYD。消除状态约束严格反馈系统跟踪控制设计的可行性条件。2019年IEEE Trans Automat控制;64(3):1265‐1272. ·Zbl 1482.93260号
[47] CaoY、WenCY、SongYD。具有或不具有状态约束的不确定纯反馈系统的统一事件触发控制方法。IEEE Trans Cybern公司。2021;51(3):1262‐1271.
[48] HuaY,ZhangTP。具有全状态时变约束和未建模动态的纯反馈非线性系统的自适应控制。国际J自适应控制信号处理.200;34(2):183‐198. ·Zbl 1467.93175号
[49] 张TP、华业、夏新、杨业。具有动态和静态约束的不确定多输入多输出非线性系统的统一自适应事件触发控制。国际J鲁棒非线性控制2021;31(6):2371‐2392. ·Zbl 1526.93136号
[50] PralyL江泽平。动态不确定性非线性系统的鲁棒自适应控制器设计。自动化。1998;34(7):825‐840. ·Zbl 0951.93042号
[51] 江泽平,HillDJ。针对具有未建模动态的非线性系统,提出了一种鲁棒自适应反步法。IEEE Trans Automat Contr.1999;44(9):1705‐1711. ·Zbl 0958.93053号
[52] Zhang TP、TangHL、XiaXN、YiY。具有执行器故障和通过命令滤波器进行输入量化的随机非限制反馈互联非线性系统的分散自适应输出反馈动态表面控制。国际J鲁棒非线性控制2022;32(12):6739‐6766.
[53] YangYL、GaoWN、ModaresH、XuCZ。具有未建模动力学的连续时间非线性系统的鲁棒actor-critical学习。IEEE Trans Fuzzy系统。2022;30(6):2101‐2112.
[54] TongSC、LiKW、LiYM。具有未建模动态的高阶非线性系统的鲁棒模糊自适应有限时间控制。IEEE Trans Fuzzy系统。2020;52(1):275‐286.
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。