文件Zbl 1418.93280-zbMATH Open

在足够的激励下从自适应控制中有效学习。（英语） Zbl 1418.93280号

国际J鲁棒非线性控制 29，第10号，3111-3124（2019）.

摘要：参数收敛在自适应控制中是可取的，因为它增强了闭环系统的整体稳定性和鲁棒性。在现有的在线历史数据（OHD）驱动的参数学习方案中，所有OHD都被用来更新参数估计，从而在充分激励（SE）条件下保证参数收敛，该条件严格弱于经典的持续激励条件。然而，所有OHD的利用不仅导致可能的无限适应，而且失去了处理缓慢时变不确定性的灵活性。本文提出了一种有效的OHD驱动的自适应控制参数学习方案，其中专门设计了一个变量遗忘因子，并配备了估计误差反馈，从而在SE条件下实现了指数参数收敛，而没有上述缺点。将所提出的参数学习方案与直接自适应控制相结合，构造了一种基于OHD的复合学习控制策略。数值结果验证了该方法的有效性。

引用于11文件

MSC公司：

93E35型	随机学习与自适应控制
93C40型	自适应控制/观测系统
93立方厘米	控制理论中的非线性系统

关键词：

自适应控制;复合学习;数据驱动控制;非线性系统;参数估计

PDF格式 BibTeX公司 XML格式引用

全文： DOI程序

参考文献：

[1]	汉兹·纳伦德拉克斯。自适应控制的变化面：多模型的使用。年收入控制。2011;35(1):1‐12.
[2]	Martin‐SanchezJM、LemosJM、RodellarJ.《工业优化自适应控制综述》。国际J自适应控制信号处理。2012;26(10):881‐918. ·Zbl 1263.93120号
[3]	KhanSG、HerrmannG、LewisFL、PipeT、MelhuishC。强化学习和最优自适应控制：概述和实施示例。年收入控制。2012;36(1):42‐59.
[4]	巴尔卡纳。简单自适应控制——一种稳定的直接模型参考自适应控制方法——简要概述。国际J自适应控制信号处理。2014;28(7‐8):567‐603. ·Zbl 1332.93163号
[5]	ChanLP、NaghdyF、StirlingD。自适应控制器在遥操作系统中的应用：综述。IEEE Trans Hum Mach系统。2014;44(3):337‐352.
[6]	陶工。多变量自适应控制：一项调查。自动化。2014;50(11):2737‐2764. ·Zbl 1300.93101号
[7]	NageshraoSP、LopesGAD、JeltsemaD、BabuskaR。自适应和学习控制中的Port‐Hamilton系统：综述。IEEE Trans Autom控制。2016;61(5):1223‐1238. ·兹比尔1359.93230
[8]	SastrySS，BodsonM。自适应控制：稳定性、收敛性和鲁棒性。恩格尔伍德悬崖，新泽西州：普伦蒂斯·霍尔；1989. ·Zbl 0721.93046号
[9]	LinJS，KanellakopoulosI。非线性增强了输出反馈系统中的参数收敛性。IEEE Trans Autom控制。1998;43(2):204‐222. ·Zbl 0904.93024号
[10]	博伊德·S、萨斯特里·SS。自适应控制中的参数收敛问题。系统控制许可。1983;3(6):311‐319. ·Zbl 0542.93038号
[11]	博伊德·S、萨斯特里·SS。自适应控制中参数收敛的充要条件。自动化。1986;22(6):629‐639.
[12]	博德森·德马瑟林。多变量递归辨识中参数收敛的频域条件。自动化。1990;26(4):757‐767. ·Zbl 0719.93086号
[13]	ZhangYP、IoannouPA、ChienCC。一类新的自适应控制器的参数收敛性。IEEE Trans Autom控制。1996;41(10):1489‐1493. ·Zbl 0863.93045号
[14]	LinJS，KanellakopoulosI。非线性增强了严格反馈系统中的参数收敛性。IEEE Trans Autom控制。1999;44(1):89‐94. ·Zbl 0989.93050号
[15]	黄JT。一类线性参数化系统的自适应补偿器。IEEE Trans Autom控制。2002;47(3):483‐486. ·Zbl 1364.93089号
[16]	黄JT。线性化系统参数收敛的充分条件。IEEE Trans Autom控制。2003;48(5):878‐880. ·Zbl 1364.93640号
[17]	法雷尔JA。被动学习控制中激励条件的持续性。自动化。1997;33(4):699‐703. ·Zbl 0876.93058号
[18]	HsuL，CostaRR。具有不连续σ因子和饱和的自适应控制，以提高鲁棒性。国际J控制。1987;45(3):843‐859. ·Zbl 0608.93045号
[19]	ChowdharyGV、MuhleggM、JohnsonEN。指数参数和跟踪误差的收敛性保证了无激励持续的自适应控制器。国际J控制。2014;87(8):1583‐1603. ·Zbl 1317.93148号
[20]	KreisselmeierG，JoosD。模型参考自适应控制的收敛速度。IEEE Trans Autom控制。1982;27(3):710‐713. ·Zbl 0483.93064号
[21]	KrauseJM、KhargonekarPP。直接自适应控制中可测信号的参数信息含量。IEEE Trans Autom控制。1987;32(9):802‐810. ·Zbl 0634.93049号
[22]	KrauseJM、KhargonekarPP。鲁棒自适应控制中的一个辨识问题。摘自：第26届IEEE决策与控制会议记录，第26卷；1987; 加利福尼亚州洛杉矶。
[23]	ArteagaMA TangY公司。基于被动性的机器人自适应控制。IEEE Trans Autom控制。1994;39(9):1871‐1875. ·兹伯利0817.93048
[24]	TangY，ArteagaMA。具有改进瞬态性能的机器人自适应控制。IEEE Trans Autom控制。2002;47(7):1198‐1202. ·Zbl 1364.93507号
[25]	阿德托拉五世，瓜伊姆。非线性系统自适应控制中的有限时间参数估计。IEEE Trans Autom控制。2008;53(3):807‐811. ·Zbl 1367.93295号
[26]	阿德托拉五世，瓜伊姆。线性参数化非线性系统自适应控制的性能改进。IEEE Trans Autom控制。2010;55(9):2182‐2186. ·Zbl 1368.93619号
[27]	HartmanM、BauerN、TeelAR。使用混合系统框架的鲁棒有限时间参数估计。IEEE Trans-Autom控制。2012;57(11):2956‐2962. ·兹比尔1369.93160
[28]	乔达里GV，JohnsonEN。并行学习自适应控制器的理论和飞行试验验证。J制导控制动态。2011;34(2):592‐607.
[29]	KamalapurkarR、ReishB、ChowdharyG、DixonWE。使用动态状态导数估计器进行参数估计的并行学习。IEEE Trans Autom控制。2017;62(7):3594‐3601. ·Zbl 1370.93090号
[30]	帕里卡、卡马拉普尔卡尔、迪克森韦。积分并行学习：参数收敛的自适应控制，无PE或状态导数。2015.arXiv预印arXiv:1512.03464。
[31]	尤希·帕尼普（YuHY PanYP）。自适应动态曲面控制的复合学习。IEEE Trans Autom控制。2016;61(9):2603‐2609. ·Zbl 1359.93231号
[32]	PanYP、ZhangJ、YuHY。无持续激励的模型参考复合学习控制。IET控制理论应用。2016;10(16):1963‐1971.
[33]	尤希·帕尼普（YuHY PanYP）。保证参数收敛的复合学习机器人控制。自动化。2018;89:398‐406. ·兹比尔1388.93063
[34]	PanYP、SunTR、LiuYQ、YuHY。自适应反推神经网络控制的复合学习。神经网络。2017;95:134‐142. ·Zbl 1441.93147号
[35]	PanYP、SunTR、YuHY。最小二乘辨识和自适应控制中的参数收敛问题。国际J鲁棒非线性控制。待发布。https://doi.org/10.1002/rnc.4527 ·Zbl 1418.93123号 ·doi:10.1002/rnc.4527
[36]	GuoK、PanYP、YuHY。带摩擦补偿的复合学习机器人控制：一种基于神经网络的方法。IEEE Trans Ind Electron公司。待发布。https://doi.org/10.109/TIE.2018.2886763 ·doi:10.1109/TIE.2018.2886763
[37]	KrsticM、KanellakopoulosI、KokotovicPV。非线性和自适应控制设计。纽约州纽约市：Wiley；1995
[38]	IoannouPA、FidanB。自适应控制教程。宾夕法尼亚州费城：SIAM；2006. ·Zbl 1116.93001号
[39]	阿斯托尔菲A，卡拉吉安尼斯D，奥尔特加R。非线性和自适应控制及其应用。英国伦敦：施普林格；2008. ·Zbl 1149.93002号
[40]	SlotineJJE，LiWP公司。机器人操作器的复合自适应控制。自动化。1989;25(4):509‐519. ·Zbl 0696.93045号
[41]	SastrySS，IsidoriA。线性化系统的自适应控制。IEEE Trans Autom控制。1989;34(11):1123‐1131. ·Zbl 0693.93046号
[42]	AranovskiyS、BobtsovA、OrtegaR、PyrkinA。通过动态回归扩展和混合增强参数估计量的性能。IEEE Trans Autom控制。2017;62(7):3546‐3550. ·Zbl 1370.93250号
[43]	OrtegaR、PralyL、AranovskiyS、YiB、ZhangW。关于动态回归元扩展和混合参数估计：两种Luenberger观测器的解释。自动化。2018;95:548‐551. https://doi.org/10.1016/j.automatica.2018.06.011 ·Zbl 1402.93065号 ·doi:10.1016/j.automatica.2018.06.011

此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配，可能包含数据转换错误。在某些情况下，zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献，而不要求完整或完全匹配。

任何	在任何地方
一个	内部文档标识符
澳大利亚	作者、编辑
人工智能	内部作者标识符
钛	标题
洛杉矶	语言
所以	来源
ab公司	回顾，摘要
第页	出版年份
车辆	评审员
复写的副本	MSC代码
美国犹他州	关键字
日期	文档类型(j个：期刊文章；b条：book；一：书籍文章）

一&b条	逻辑和
一\|b条	逻辑或
!ab公司	逻辑不
美国广播公司*	右通配符
"ab c公司"	短语
(ab c公司)	圆括号

示例

领域

操作员

在足够的激励下从自适应控制中有效学习。（英语） Zbl 1418.93280号

MSC公司：

关键词：

参考文献：

示例

领域

操作员

在足够的激励下从自适应控制中有效学习。 （英语） Zbl 1418.93280号

MSC公司：

关键词：

参考文献：

在足够的激励下从自适应控制中有效学习。（英语） Zbl 1418.93280号