潘永平;斯坦尼斯拉夫·阿拉诺夫斯基;阿列克谢·博布佐夫;于浩勇 在足够的激励下从自适应控制中有效学习。 (英语) Zbl 1418.93280号 国际J鲁棒非线性控制 29,第10号,3111-3124(2019). 摘要:参数收敛在自适应控制中是可取的,因为它增强了闭环系统的整体稳定性和鲁棒性。在现有的在线历史数据(OHD)驱动的参数学习方案中,所有OHD都被用来更新参数估计,从而在充分激励(SE)条件下保证参数收敛,该条件严格弱于经典的持续激励条件。然而,所有OHD的利用不仅导致可能的无限适应,而且失去了处理缓慢时变不确定性的灵活性。本文提出了一种有效的OHD驱动的自适应控制参数学习方案,其中专门设计了一个变量遗忘因子,并配备了估计误差反馈,从而在SE条件下实现了指数参数收敛,而没有上述缺点。将所提出的参数学习方案与直接自适应控制相结合,构造了一种基于OHD的复合学习控制策略。数值结果验证了该方法的有效性。 引用于11文件 MSC公司: 93E35型 随机学习与自适应控制 93C40型 自适应控制/观测系统 93立方厘米 控制理论中的非线性系统 关键词:自适应控制;复合学习;数据驱动控制;非线性系统;参数估计 PDF格式BibTeX公司 XML格式引用 \textit{Y.Pan}等人,《国际鲁棒非线性控制》29,No.10,3111--3124(2019;Zbl 1418.93280) 全文: DOI程序 参考文献: [1] 汉兹·纳伦德拉克斯。自适应控制的变化面:多模型的使用。年收入控制。2011;35(1):1‐12. [2] Martin‐SanchezJM、LemosJM、RodellarJ.《工业优化自适应控制综述》。国际J自适应控制信号处理。2012;26(10):881‐918. ·Zbl 1263.93120号 [3] KhanSG、HerrmannG、LewisFL、PipeT、MelhuishC。强化学习和最优自适应控制:概述和实施示例。年收入控制。2012;36(1):42‐59. [4] 巴尔卡纳。简单自适应控制——一种稳定的直接模型参考自适应控制方法——简要概述。国际J自适应控制信号处理。2014;28(7‐8):567‐603. ·Zbl 1332.93163号 [5] ChanLP、NaghdyF、StirlingD。自适应控制器在遥操作系统中的应用:综述。IEEE Trans Hum Mach系统。2014;44(3):337‐352. [6] 陶工。多变量自适应控制:一项调查。自动化。2014;50(11):2737‐2764. ·Zbl 1300.93101号 [7] NageshraoSP、LopesGAD、JeltsemaD、BabuskaR。自适应和学习控制中的Port‐Hamilton系统:综述。IEEE Trans Autom控制。2016;61(5):1223‐1238. ·兹比尔1359.93230 [8] SastrySS,BodsonM。自适应控制:稳定性、收敛性和鲁棒性。恩格尔伍德悬崖,新泽西州:普伦蒂斯·霍尔;1989. ·Zbl 0721.93046号 [9] LinJS,KanellakopoulosI。非线性增强了输出反馈系统中的参数收敛性。IEEE Trans Autom控制。1998;43(2):204‐222. ·Zbl 0904.93024号 [10] 博伊德·S、萨斯特里·SS。自适应控制中的参数收敛问题。系统控制许可。1983;3(6):311‐319. ·Zbl 0542.93038号 [11] 博伊德·S、萨斯特里·SS。自适应控制中参数收敛的充要条件。自动化。1986;22(6):629‐639. [12] 博德森·德马瑟林。多变量递归辨识中参数收敛的频域条件。自动化。1990;26(4):757‐767. ·Zbl 0719.93086号 [13] ZhangYP、IoannouPA、ChienCC。一类新的自适应控制器的参数收敛性。IEEE Trans Autom控制。1996;41(10):1489‐1493. ·Zbl 0863.93045号 [14] LinJS,KanellakopoulosI。非线性增强了严格反馈系统中的参数收敛性。IEEE Trans Autom控制。1999;44(1):89‐94. ·Zbl 0989.93050号 [15] 黄JT。一类线性参数化系统的自适应补偿器。IEEE Trans Autom控制。2002;47(3):483‐486. ·Zbl 1364.93089号 [16] 黄JT。线性化系统参数收敛的充分条件。IEEE Trans Autom控制。2003;48(5):878‐880. ·Zbl 1364.93640号 [17] 法雷尔JA。被动学习控制中激励条件的持续性。自动化。1997;33(4):699‐703. ·Zbl 0876.93058号 [18] HsuL,CostaRR。具有不连续σ因子和饱和的自适应控制,以提高鲁棒性。国际J控制。1987;45(3):843‐859. ·Zbl 0608.93045号 [19] ChowdharyGV、MuhleggM、JohnsonEN。指数参数和跟踪误差的收敛性保证了无激励持续的自适应控制器。国际J控制。2014;87(8):1583‐1603. ·Zbl 1317.93148号 [20] KreisselmeierG,JoosD。模型参考自适应控制的收敛速度。IEEE Trans Autom控制。1982;27(3):710‐713. ·Zbl 0483.93064号 [21] KrauseJM、KhargonekarPP。直接自适应控制中可测信号的参数信息含量。IEEE Trans Autom控制。1987;32(9):802‐810. ·Zbl 0634.93049号 [22] KrauseJM、KhargonekarPP。鲁棒自适应控制中的一个辨识问题。摘自:第26届IEEE决策与控制会议记录,第26卷;1987; 加利福尼亚州洛杉矶。 [23] ArteagaMA TangY公司。基于被动性的机器人自适应控制。IEEE Trans Autom控制。1994;39(9):1871‐1875. ·兹伯利0817.93048 [24] TangY,ArteagaMA。具有改进瞬态性能的机器人自适应控制。IEEE Trans Autom控制。2002;47(7):1198‐1202. ·Zbl 1364.93507号 [25] 阿德托拉五世,瓜伊姆。非线性系统自适应控制中的有限时间参数估计。IEEE Trans Autom控制。2008;53(3):807‐811. ·Zbl 1367.93295号 [26] 阿德托拉五世,瓜伊姆。线性参数化非线性系统自适应控制的性能改进。IEEE Trans Autom控制。2010;55(9):2182‐2186. ·Zbl 1368.93619号 [27] HartmanM、BauerN、TeelAR。使用混合系统框架的鲁棒有限时间参数估计。IEEE Trans-Autom控制。2012;57(11):2956‐2962. ·兹比尔1369.93160 [28] 乔达里GV,JohnsonEN。并行学习自适应控制器的理论和飞行试验验证。J制导控制动态。2011;34(2):592‐607. [29] KamalapurkarR、ReishB、ChowdharyG、DixonWE。使用动态状态导数估计器进行参数估计的并行学习。IEEE Trans Autom控制。2017;62(7):3594‐3601. ·Zbl 1370.93090号 [30] 帕里卡、卡马拉普尔卡尔、迪克森韦。积分并行学习:参数收敛的自适应控制,无PE或状态导数。2015.arXiv预印arXiv:1512.03464。 [31] 尤希·帕尼普(YuHY PanYP)。自适应动态曲面控制的复合学习。IEEE Trans Autom控制。2016;61(9):2603‐2609. ·Zbl 1359.93231号 [32] PanYP、ZhangJ、YuHY。无持续激励的模型参考复合学习控制。IET控制理论应用。2016;10(16):1963‐1971. [33] 尤希·帕尼普(YuHY PanYP)。保证参数收敛的复合学习机器人控制。自动化。2018;89:398‐406. ·兹比尔1388.93063 [34] PanYP、SunTR、LiuYQ、YuHY。自适应反推神经网络控制的复合学习。神经网络。2017;95:134‐142. ·Zbl 1441.93147号 [35] PanYP、SunTR、YuHY。最小二乘辨识和自适应控制中的参数收敛问题。国际J鲁棒非线性控制。待发布。https://doi.org/10.1002/rnc.4527 ·Zbl 1418.93123号 ·doi:10.1002/rnc.4527 [36] GuoK、PanYP、YuHY。带摩擦补偿的复合学习机器人控制:一种基于神经网络的方法。IEEE Trans Ind Electron公司。待发布。https://doi.org/10.109/TIE.2018.2886763 ·doi:10.1109/TIE.2018.2886763 [37] KrsticM、KanellakopoulosI、KokotovicPV。非线性和自适应控制设计。纽约州纽约市:Wiley;1995 [38] IoannouPA、FidanB。自适应控制教程。宾夕法尼亚州费城:SIAM;2006. ·Zbl 1116.93001号 [39] 阿斯托尔菲A,卡拉吉安尼斯D,奥尔特加R。非线性和自适应控制及其应用。英国伦敦:施普林格;2008. ·Zbl 1149.93002号 [40] SlotineJJE,LiWP公司。机器人操作器的复合自适应控制。自动化。1989;25(4):509‐519. ·Zbl 0696.93045号 [41] SastrySS,IsidoriA。线性化系统的自适应控制。IEEE Trans Autom控制。1989;34(11):1123‐1131. ·Zbl 0693.93046号 [42] AranovskiyS、BobtsovA、OrtegaR、PyrkinA。通过动态回归扩展和混合增强参数估计量的性能。IEEE Trans Autom控制。2017;62(7):3546‐3550. ·Zbl 1370.93250号 [43] OrtegaR、PralyL、AranovskiyS、YiB、ZhangW。关于动态回归元扩展和混合参数估计:两种Luenberger观测器的解释。自动化。2018;95:548‐551. https://doi.org/10.1016/j.automatica.2018.06.011 ·Zbl 1402.93065号 ·doi:10.1016/j.automatica.2018.06.011 此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。