×

基于强化学习的水面舰船在不同天气条件下的饱和自适应鲁棒输出反馈漏斗控制。 (英语) Zbl 1530.93189号

摘要:本文解决了饱和自适应鲁棒actor-critic学习PID跟踪控制设计的问题,该设计保证具有多个死区的船舶具有规定的漏斗性能,其中船舶的速度/加速度和动态参数未知且随外部可用性而时变干扰。该控制器由观测器、自适应actor-critic多层神经网络、广义饱和函数、规定性能漏斗控制、自适应鲁棒控制器和多个死区组成。观测器计算船舶速度/加速度的估计值,通过限制观测器信号来防止峰值现象。在自适应作动器临界设计的结构中,采用自适应多层神经网络,以抵消船舶的时变不确定性和作动器饱和非线性。为了降低执行器饱和的可能性,考虑了广义饱和函数。为了实现预定的跟踪误差的瞬态和稳态性能,采用了规定的性能控制。为了避免切角,提高轨迹跟踪精度,计算了圆弧轨迹的曲率,并对圆弧角进行了补偿。本文采用自适应鲁棒控制器来抵抗外部干扰,并设计了多死区方案来保护激波中的执行器系统。

MSC公司:

93C40型 自适应控制/观测系统
93B35型 灵敏度(稳健性)
93B52号 反馈控制
68T07型 人工神经网络与深度学习
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 朱,G。;Du,J.,输入饱和条件下水面舰艇的全局鲁棒自适应轨迹跟踪控制。IEEE J.海洋。工程师,2442-450(2018)
[2] 利用扰动观测器对具有输入延迟的电动机器人进行基于复合模糊电压的指令滤波学习控制。J.Franklin Inst.B,2813-840(2023年)·Zbl 1506.93050号
[3] 吴,J。;曾,C。;Hu,Y.,未知控制系数和干扰下船舶航向跟踪的间接自适应鲁棒控制设计。国际J.控制自动化。系统。,6, 2059-2067 (2021)
[4] 胡,X。;杜,J。;Sun,Y.,船舶动态定位的鲁棒自适应控制。IEEE J.海洋。工程师,4826-835(2017)
[5] Z.强。;桂冰,Z。;Xin,H。;Y.Renming,《自适应神经网络船舶自航控制》。海洋工程,40-48(2019)
[6] 钱,Y。;胡,D。;陈,Y。;方,Y。;Hu,Y.,基于自适应神经网络的欠驱动海上船对船起重机系统跟踪控制,受未知波浪运动干扰。IEEE传输。系统。网络人:系统。,6, 3626-3637 (2022)
[7] 张,L。;郑毅。;黄,B。;Su,Y.,饱和约束下欠驱动无人水面舰艇的有限时间轨迹跟踪控制。海洋工程(2022)
[8] 刘,H。;王,Z。;Tian,X.,具有不确定性和时变扰动的无人水面舰艇鲁棒自适应自结构神经网络跟踪控制。国际。J.鲁棒非线性控制,63334-3360(2022)·Zbl 1527.93211号
[9] 沈,Z。;毕,Y。;Wang,Y。;Guo,C.,基于MLP神经网络的递归滑模动态表面控制,用于动态未知和输入饱和的全驱动水面舰艇的轨迹跟踪。神经计算,103-112(2020)
[10] 郑,Z。;Jin,C。;朱,M。;Sun,K.,带有非对称饱和致动器的海上水面船舶的轨迹跟踪控制。机器人。自动。系统。,83-91 (2017)
[11] Liang,K。;林,X。;陈,Y。;李,J。;Ding,F.,具有输入饱和的动态定位船舶的自适应滑模输出反馈控制。海洋工程(2020)
[12] 卢,Y。;张,G。;乔·L。;Zhang,W.,欠驱动水面舰艇的自适应输出反馈编队控制。国际。J.控制,3400-409(2020)·Zbl 1440.93128号
[13] 沈,Z。;李,A。;李,L。;Yu,H.,基于非线性观测器的输入饱和欠驱动船舶自适应输出反馈跟踪控制。J.Mar.科学。技术。,2, 1015-1030 (2022)
[14] 邓,Y。;Zhang,X.,事件触发复合自适应模糊输出反馈控制,用于自主水面舰艇的路径跟踪。IEEE传输。模糊系统。,9, 2701-2713 (2021)
[15] 朱,G。;马云(Ma,Y.)。;李,Z。;Malekian,R。;Sotelo,M.,使用复合学习的MSV动态事件触发自适应神经输出反馈控制。IEEE传输。智力。运输。系统。,1, 787-800 (2023)
[16] 高,X。;李·T。;袁,L。;Bai,W.,鲁棒模糊自适应输出反馈最优跟踪控制,用于具有未知扰动和不确定动力学的船舶动态定位。国际模糊系统杂志。,7, 2283-2296 (2021)
[17] Bechlioulis,C.P。;Rovithakis,G.A.,具有规定性能的反馈线性化MIMO非线性系统的鲁棒自适应控制。IEEE传输。自动化。控制,92090-2099(2008)·Zbl 1367.93298号
[18] 李,J。;杜,J。;Hu,X.,未知扰动和输入约束下船舶动态定位的鲁棒自适应规定性能控制。海洋工程(2020)
[19] 邓,Y。;张,Z。;龚,M。;Ni,T.,具有规定性能的欠驱动船舶的事件触发渐近跟踪控制。IEEE传输。智力。运输。系统。,1, 645-656 (2023)
[20] 朱,L。;Li,T.,基于观测器的智能船舶自动舵自适应模糊规定性能控制。系统。科学。控制工程师,1489-496(2021)
[21] 沈,Z。;王,Q。;Dong,S。;Yu,H.,用于跟踪具有规定性能和非对称时变全状态约束的无人水面舰艇的动态表面控制。海洋工程(2022)
[22] 李,J。;X.向。;Yang,S.,鲁棒自适应神经网络控制,用于在模型不确定性和输入饱和下具有规定性能的海船动态定位。神经计算,1-12(2022)
[23] 沈,Z。;王,Q。;Dong,S。;Yu,H.,为具有输入饱和的无人水面舰艇的轨迹跟踪规定了性能动态水面控制。申请。海洋研究(2021)
[24] 张建新。;Chai,T.,具有规定性能的不确定欠驱动水面舰艇的无奇异连续自适应控制。IEEE传输。系统。网络人:系统。,9, 5646-5655 (2022)
[25] Wang,H。;李,M。;张,C。;Shao,X.,基于事件的动态定位船舶规定性能控制。IEEE传输。电路系统。二、 72548-2552(2021)
[26] Bayuwindra,A。;Ploeg,J。;列斐伯,E。;Nijmeijer,H.,《带扩展视线头的汽车式车辆排的纵向和横向联合控制》。IEEE传输。控制系统。技术。,3, 790-803 (2020)
[27] 彭,Z。;刘,E。;潘,C。;Wang,H。;王,D。;Liu,L.,基于模型的深度强化学习,用于欠驱动无人水面飞行器的数据驱动运动控制:路径跟踪和轨迹跟踪。J.Franklin Inst.B,6,4399-4426(2023)·兹比尔1516.93185
[28] 巴贾里亚,P。;Yerudkar,A。;Glielmo,L。;Del Vecchio,C。;Wu,Y.,概率布尔控制网络的自触发控制:强化学习方法。J.Franklin Inst.B,12,6173-6195(2022)·Zbl 07566311号
[29] 非策略强化学习用于动态完全未知的离散马尔可夫跳跃线性系统的跟踪控制。J.Franklin Inst.B,3,2361-2378(2023)·Zbl 1507.93140号
[30] 穆萨维,A。;Markazi,A.H。;Khanmirza,E.,近最优强化学习框架中非线性欠驱动智能体的自适应模糊滑模共识控制,J.Franklin Inst.B,10,4804-4841(2022)·Zbl 1491.93111号
[31] 李,J。;Cui,H.,质子交换膜燃料电池的最优轨迹探索大规模深度强化学习调谐最优控制器。J.Franklin Inst.B,第15期,8107-8126页(2022年)·Zbl 1497.93073号
[32] 动态未知离散系统的基于数据的L2增益最优控制。J.Franklin Inst.B,6,4354-4377(2023)·Zbl 1516.93047号
[33] 刘,G。;Sun,N。;Yang,T.等人。;Fang,Y.,基于强化学习的具有测量噪声的气动肌肉驱动机器人手臂的规定性能运动控制。IEEE传输。系统。网络人:系统。,3, 1801-1812 (2023)
[34] 黄,Z。;Bai,W。;李·T。;Long,Y。;Chen,C.P。;Liang,H。;Yang,H.,具有规定性能的严格反馈非线性系统的自适应强化学习最优跟踪控制。通知。科学。,407-423 (2023)
[35] 魏,C。;熊,Y。;陈,Q。;Xu,D.,关于航天器的自适应姿态跟踪控制:一种基于强化学习的增益调谐方法,具有保证的性能。高级空间研究,11,4534-4548(2023)
[36] McCleme,D.G。;劳伦斯,N.P。;Backström,J.U。;Loewen,P.D。;《福布斯》,M.G。;Gopaluni,R.B.,用于PI控制器调整的元强化学习:一种离线方法。过程控制,139-152(2022)
[37] 秦,H。;Tan,P。;陈,Z。;孙,M。;Sun,Q.,基于深度强化学习的船舶航向自抗扰控制。神经计算,99-108(2022)
[38] 王,S。;严,X。;马,F。;吴,P。;Liu,Y.,一种基于快速行进法和深度强化学习的新型自主船舶路径跟踪方法。海洋工程(2022)
[39] Wang,L。;李,S。;刘杰。;Wu,Q.,基于天线突变甲虫群预测强化学习的欠驱动船舶数据驱动路径允许控制。申请。海洋研究(2022)
[40] Pham,T.L。;Dao,P.N.,基于扰动观测器的扰动不确定水面舰船自适应强化学习。ISA事务。,277-292 (2022)
[41] 马丁森,A.B。;莱卡斯,A.M。;Gros,S.,用于ASV跟踪控制的基于强化学习的NMPC:理论和实验。控制工程实践。(2022)
[42] Do,K.D。;Pan,J.,《船舶和水下航行器的控制:欠驱动和非线性海洋系统的设计》,第1卷(2009年),Springer
[43] 高,W。;Selmic,R.R.,一类执行器饱和非线性系统的神经网络控制。IEEE传输。神经网络。,1, 147-156 (2006)
[44] Bayuwindra,A。;Lefeber,E。;Ploeg,J。;Nijmeijer,H.,带车辆排定向误差观测器的扩展look-ahead跟踪控制器。IEEE传输。智力。运输。系统。,11, 4808-4821 (2020)
[45] Chen,M.,轮式移动机器人打滑和打滑时的干扰衰减跟踪控制。IEEE传输。Ind.Electron公司。,4, 3359-3368 (2017)
[46] Bechlioulis,C.P。;Rovithakis,G.A.,为控制非线性系统中的多输入多输出仿射规定了性能自适应控制。IEEE传输。自动化。控制,51220-1226(2010)·Zbl 1368.93288号
[47] O.Elhaki。;Shojaei,K.,一种新的自适应模糊强化学习控制器,适用于一排具有规定性能和路径曲率补偿的非轴挂接牵引拖车。《欧洲期刊控制》(2023)·Zbl 1507.93135号
[48] O.Elhaki。;Shojaei,K。;Shanahan,D。;Montazeri,A.,保证输出约束的潜水器饱和输出反馈混合强化学习控制器。IEEE接入,136580-136592(2021)
[49] O.Elhaki。;Shojaei,K.,《基于观测者的电动汽车式移动机器人鲁棒排队编队控制》,在避免碰撞和保持连通性的情况下,具有规定的性能。J.可控震源。控制,19-20,2696-2716(2022)
[50] O.Elhaki。;Shojaei,K.,《具有规定性能保证的欠驱动自主水面船舶的轨迹跟踪控制》,22-27
[51] O.Elhaki。;Shojaei,K.,输出反馈鲁棒饱和actor-critic多层神经网络控制器,用于带有n拖车的多体电动拖拉机,保证规定的输出约束。机器人。自动。系统。(2022)
[52] Ge,S.S。;Zhang,J.,通过状态反馈和输出反馈实现零动态非仿射非线性系统的神经网络控制。IEEE传输。神经网络。,4, 900-918 (2003)
[53] 阿吉纳加·鲁伊斯,E。;Zavala-Río,A。;Santibáñez,V。;Reyes,F.,通过静态反馈对输入有界的机器人操纵器进行全局轨迹跟踪。IEEE传输。控制系统。技术。,4, 934-944 (2009)
[54] Khalil,H.K.,《非线性系统》(1996),普伦蒂斯·霍尔出版社:普伦蒂斯霍尔出版社,美国新泽西州上鞍河
[55] 刘易斯,F.L。;Dawson,D.M。;Abdallah,C.T.,机器人操纵器控制理论与实践(2004),马塞尔·德克尔:马塞尔·戴克尔纽约
[56] Ge,S.S。;杭州。;Lee,T.H。;Zhang,T.,稳定自适应神经网络控制,第13卷(2013),Springer Science&Business Media
[57] 三通,K.P。;Ge,S.S。;Tay,F.E.,垂直飞行直升机的自适应神经网络控制。IEEE传输。控制系统。技术。,4, 753-762 (2008)
[58] Lin,C.-K.,使用模糊基函数网络的非线性系统鲁棒自适应临界控制:LMI方法。通知。科学。,22, 4934-4946 (2007) ·兹比尔1120.93034
[59] Lin,C.-K.,使用模糊基函数网络的倾斜转弯导弹自适应批评性自动驾驶仪设计。IEEE传输。系统。人类网络。B、 2197-207(2005)
[60] 布,X。;Xiao,Y。;Lei,H.,高超声速飞行器基于自适应批评性设计的模糊神经控制器:预定义的行为非仿射控制。IEEE/ASME标准。机电一体化,41871-1881(2019)
[61] Kim,Y.H。;Lewis,F.L.,强化自适应学习神经网络摩擦补偿控制,用于高速和高精度。IEEE传输。控制系统。技术。,1, 118-126 (2000)
[62] 杨琼。;Jagannathan,S.,使用在线逼近器设计仿射非线性离散时间系统的强化学习控制器。IEEE传输。系统。人类网络。B、 2377-390(2012)
[63] 罗,Y。;孙,Q。;张,H。;崔,L.,动态未知非线性分布参数系统的基于自适应批评性设计的鲁棒神经网络控制。神经计算,200-208(2015)
[64] Zhao,Y。;杜,X。;周,C。;Tian,Y.C.,执行器攻击下网络物理系统的反饱和弹性控制。通知。科学。,1245-1260 (2022)
[65] 吴国喜。;丁,Y。;塔辛,T。;Atilla,I.,自适应神经网络和基于扩展状态观测器的非奇异终端滑模跟踪控制,用于具有未知不确定性的欠驱动USV。申请。海洋研究(2023)
[66] Tetley,L.公司。;Calcutt,D.,《电子导航系统》(2007),Routledge
[67] 杜,J。;胡,X。;刘,H。;Chen,C.P.,基于高增益观测器的海洋动态定位系统自适应鲁棒输出反馈控制。IEEE传输。神经网络。学习。系统。,11, 2775-2786 (2015)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。