×

在足够的激励下从自适应控制中有效学习。 (英语) Zbl 1418.93280号

摘要:参数收敛在自适应控制中是可取的,因为它增强了闭环系统的整体稳定性和鲁棒性。在现有的在线历史数据(OHD)驱动的参数学习方案中,所有OHD都被用来更新参数估计,从而在充分激励(SE)条件下保证参数收敛,该条件严格弱于经典的持续激励条件。然而,所有OHD的利用不仅导致可能的无限适应,而且失去了处理缓慢时变不确定性的灵活性。本文提出了一种有效的OHD驱动的自适应控制参数学习方案,其中专门设计了一个变量遗忘因子,并配备了估计误差反馈,从而在SE条件下实现了指数参数收敛,而没有上述缺点。将所提出的参数学习方案与直接自适应控制相结合,构造了一种基于OHD的复合学习控制策略。数值结果验证了该方法的有效性。

MSC公司:

93E35型 随机学习与自适应控制
93C40型 自适应控制/观测系统
93立方厘米 控制理论中的非线性系统
PDF格式BibTeX公司 XML格式引用
全文: DOI程序

参考文献:

[1] 汉兹·纳伦德拉克斯。自适应控制的变化面:多模型的使用。年收入控制。2011;35(1):1‐12.
[2] Martin‐SanchezJM、LemosJM、RodellarJ.《工业优化自适应控制综述》。国际J自适应控制信号处理。2012;26(10):881‐918. ·Zbl 1263.93120号
[3] KhanSG、HerrmannG、LewisFL、PipeT、MelhuishC。强化学习和最优自适应控制:概述和实施示例。年收入控制。2012;36(1):42‐59.
[4] 巴尔卡纳。简单自适应控制——一种稳定的直接模型参考自适应控制方法——简要概述。国际J自适应控制信号处理。2014;28(7‐8):567‐603. ·Zbl 1332.93163号
[5] ChanLP、NaghdyF、StirlingD。自适应控制器在遥操作系统中的应用:综述。IEEE Trans Hum Mach系统。2014;44(3):337‐352.
[6] 陶工。多变量自适应控制:一项调查。自动化。2014;50(11):2737‐2764. ·Zbl 1300.93101号
[7] NageshraoSP、LopesGAD、JeltsemaD、BabuskaR。自适应和学习控制中的Port‐Hamilton系统:综述。IEEE Trans Autom控制。2016;61(5):1223‐1238. ·兹比尔1359.93230
[8] SastrySS,BodsonM。自适应控制:稳定性、收敛性和鲁棒性。恩格尔伍德悬崖,新泽西州:普伦蒂斯·霍尔;1989. ·Zbl 0721.93046号
[9] LinJS,KanellakopoulosI。非线性增强了输出反馈系统中的参数收敛性。IEEE Trans Autom控制。1998;43(2):204‐222. ·Zbl 0904.93024号
[10] 博伊德·S、萨斯特里·SS。自适应控制中的参数收敛问题。系统控制许可。1983;3(6):311‐319. ·Zbl 0542.93038号
[11] 博伊德·S、萨斯特里·SS。自适应控制中参数收敛的充要条件。自动化。1986;22(6):629‐639.
[12] 博德森·德马瑟林。多变量递归辨识中参数收敛的频域条件。自动化。1990;26(4):757‐767. ·Zbl 0719.93086号
[13] ZhangYP、IoannouPA、ChienCC。一类新的自适应控制器的参数收敛性。IEEE Trans Autom控制。1996;41(10):1489‐1493. ·Zbl 0863.93045号
[14] LinJS,KanellakopoulosI。非线性增强了严格反馈系统中的参数收敛性。IEEE Trans Autom控制。1999;44(1):89‐94. ·Zbl 0989.93050号
[15] 黄JT。一类线性参数化系统的自适应补偿器。IEEE Trans Autom控制。2002;47(3):483‐486. ·Zbl 1364.93089号
[16] 黄JT。线性化系统参数收敛的充分条件。IEEE Trans Autom控制。2003;48(5):878‐880. ·Zbl 1364.93640号
[17] 法雷尔JA。被动学习控制中激励条件的持续性。自动化。1997;33(4):699‐703. ·Zbl 0876.93058号
[18] HsuL,CostaRR。具有不连续σ因子和饱和的自适应控制,以提高鲁棒性。国际J控制。1987;45(3):843‐859. ·Zbl 0608.93045号
[19] ChowdharyGV、MuhleggM、JohnsonEN。指数参数和跟踪误差的收敛性保证了无激励持续的自适应控制器。国际J控制。2014;87(8):1583‐1603. ·Zbl 1317.93148号
[20] KreisselmeierG,JoosD。模型参考自适应控制的收敛速度。IEEE Trans Autom控制。1982;27(3):710‐713. ·Zbl 0483.93064号
[21] KrauseJM、KhargonekarPP。直接自适应控制中可测信号的参数信息含量。IEEE Trans Autom控制。1987;32(9):802‐810. ·Zbl 0634.93049号
[22] KrauseJM、KhargonekarPP。鲁棒自适应控制中的一个辨识问题。摘自:第26届IEEE决策与控制会议记录,第26卷;1987; 加利福尼亚州洛杉矶。
[23] ArteagaMA TangY公司。基于被动性的机器人自适应控制。IEEE Trans Autom控制。1994;39(9):1871‐1875. ·兹伯利0817.93048
[24] TangY,ArteagaMA。具有改进瞬态性能的机器人自适应控制。IEEE Trans Autom控制。2002;47(7):1198‐1202. ·Zbl 1364.93507号
[25] 阿德托拉五世,瓜伊姆。非线性系统自适应控制中的有限时间参数估计。IEEE Trans Autom控制。2008;53(3):807‐811. ·Zbl 1367.93295号
[26] 阿德托拉五世,瓜伊姆。线性参数化非线性系统自适应控制的性能改进。IEEE Trans Autom控制。2010;55(9):2182‐2186. ·Zbl 1368.93619号
[27] HartmanM、BauerN、TeelAR。使用混合系统框架的鲁棒有限时间参数估计。IEEE Trans-Autom控制。2012;57(11):2956‐2962. ·兹比尔1369.93160
[28] 乔达里GV,JohnsonEN。并行学习自适应控制器的理论和飞行试验验证。J制导控制动态。2011;34(2):592‐607.
[29] KamalapurkarR、ReishB、ChowdharyG、DixonWE。使用动态状态导数估计器进行参数估计的并行学习。IEEE Trans Autom控制。2017;62(7):3594‐3601. ·Zbl 1370.93090号
[30] 帕里卡、卡马拉普尔卡尔、迪克森韦。积分并行学习:参数收敛的自适应控制,无PE或状态导数。2015.arXiv预印arXiv:1512.03464。
[31] 尤希·帕尼普(YuHY PanYP)。自适应动态曲面控制的复合学习。IEEE Trans Autom控制。2016;61(9):2603‐2609. ·Zbl 1359.93231号
[32] PanYP、ZhangJ、YuHY。无持续激励的模型参考复合学习控制。IET控制理论应用。2016;10(16):1963‐1971.
[33] 尤希·帕尼普(YuHY PanYP)。保证参数收敛的复合学习机器人控制。自动化。2018;89:398‐406. ·兹比尔1388.93063
[34] PanYP、SunTR、LiuYQ、YuHY。自适应反推神经网络控制的复合学习。神经网络。2017;95:134‐142. ·Zbl 1441.93147号
[35] PanYP、SunTR、YuHY。最小二乘辨识和自适应控制中的参数收敛问题。国际J鲁棒非线性控制。待发布。https://doi.org/10.1002/rnc.4527 ·Zbl 1418.93123号 ·doi:10.1002/rnc.4527
[36] GuoK、PanYP、YuHY。带摩擦补偿的复合学习机器人控制:一种基于神经网络的方法。IEEE Trans Ind Electron公司。待发布。https://doi.org/10.109/TIE.2018.2886763 ·doi:10.1109/TIE.2018.2886763
[37] KrsticM、KanellakopoulosI、KokotovicPV。非线性和自适应控制设计。纽约州纽约市:Wiley;1995
[38] IoannouPA、FidanB。自适应控制教程。宾夕法尼亚州费城:SIAM;2006. ·Zbl 1116.93001号
[39] 阿斯托尔菲A,卡拉吉安尼斯D,奥尔特加R。非线性和自适应控制及其应用。英国伦敦:施普林格;2008. ·Zbl 1149.93002号
[40] SlotineJJE,LiWP公司。机器人操作器的复合自适应控制。自动化。1989;25(4):509‐519. ·Zbl 0696.93045号
[41] SastrySS,IsidoriA。线性化系统的自适应控制。IEEE Trans Autom控制。1989;34(11):1123‐1131. ·Zbl 0693.93046号
[42] AranovskiyS、BobtsovA、OrtegaR、PyrkinA。通过动态回归扩展和混合增强参数估计量的性能。IEEE Trans Autom控制。2017;62(7):3546‐3550. ·Zbl 1370.93250号
[43] OrtegaR、PralyL、AranovskiyS、YiB、ZhangW。关于动态回归元扩展和混合参数估计:两种Luenberger观测器的解释。自动化。2018;95:548‐551. https://doi.org/10.1016/j.automatica.2018.06.011 ·Zbl 1402.93065号 ·doi:10.1016/j.automatica.2018.06.011
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。