×

具有完全未知动态的连续非线性系统的在线自适应最优控制。 (英语) Zbl 1332.93174号

摘要:针对具有完全未知动力学的连续时间非线性系统,提出了一种在线自适应最优控制,该控制是通过开发一种具有对偶神经网络(NN)近似结构的新的基于标识符-评论家的近似动态规划算法来实现的。首先,设计了一个自适应神经网络辨识器,以消除对系统动力学完全知识的要求,并使用一个批判性神经网络来逼近最优值函数。然后,根据辨识器NN和评判器NN的信息计算最优控制律,从而不需要行动者NN。特别是,提出了一种新的带有参数估计误差的自适应律设计方法,以同时在线更新标识符NN和批评者NN的权重,使其收敛到其理想值附近的小邻域。利用李亚普诺夫理论证明了闭环系统的稳定性和在最优解附近收敛到小邻域。还对所提出的自适应算法进行了改进,以实现神经网络权重的有限时间收敛。最后,通过仿真验证了所提方法的有效性。

理学硕士:

93C40型 自适应控制/观测系统
93立方厘米 信息不完整的控制/观测系统
92B20型 生物研究、人工生命和相关主题中的神经网络
93立方厘米30 系统标识
93立方厘米 控制理论中的非线性系统
90立方厘米 动态编程
PDF格式BibTeX公司 XML格式引用
全文: 内政部 链接

参考文献:

[1] DOI:10.1016/j.automatica.2004.11.034·Zbl 1087.49022号 ·doi:10.1016/j.automatica.2004.11.034
[2] 内政部:10.1109/TSMCB.2008.926614·doi:10.10109/TSMCB.2008.926614
[3] Bellman R.E.,动态编程(1957)·Zbl 0077.13605号
[4] DOI:10.1016/j.自动2012.09.019·Zbl 1257.93055号 ·doi:10.1016/j.automatica.2012.09.019
[5] 内政部:10.1109/9.668834·Zbl 0925.93821号 ·数字对象标识代码:10.1109/9.668834
[6] 内政部:10.1109/TNNLS.2012.2196708·doi:10.1109/TNNLS.2012.2196708
[7] 内政部:10.1162/089976600300015961·doi:10.1162/089976600300015961
[8] 内政部:10.1080/00207170903141069·Zbl 1184.93023号 ·网址:10.1080/00207170903141069
[9] 内政部:10.1109/TNN.2006.889499·doi:10.1109/TNN.2006.889499
[10] DOI:10.1016/j.自动2012.06.096·Zbl 1271.93088号 ·doi:10.1016/j.automatica.2012.06.096
[11] 内政部:10.1080/00207170701710974·兹比尔1152.93316 ·网址:10.1080/00207170701710974
[12] 内政部:10.1109/CDC.2013.6760878·doi:10.1109/CDC.2013.6760878
[13] 内政部:10.1109/MCAS.2009.933854·doi:10.10109/MCAS.2009.933854
[14] 内政部:10.1002/9781118122631·数字对象标识代码:10.1002/9781118122631
[15] 内政部:10.1080/00207179.2013.790562·Zbl 1278.93145号 ·doi:10.1080/0207179.2013.790562
[16] DOI:10.1109/TSMCB.2012.2216523·doi:10.1109/TSMCB.2012.2216523
[17] 内政部:10.1109/TNNLS.2014.2360724·doi:10.1109/TNNLS.2014.2360724
[18] 内政部:10.1109/TNNLS.2013.2276571·doi:10.1109/TNNLS.2013.2276571
[19] Na J.,IEEE/CAA自动化学报1(4)第412页–(2014)·doi:10.10109/JAS/2014.7004668
[20] Na J.,IEEE智能控制国际研讨会(ISIC)第1014页–(2011年)
[21] 内政部:10.1109/TNNLS.2012.225845·doi:10.1109/TNNLS.2012.225845
[22] 内政部:10.1109/TNNLS.2013.2247627·doi:10.1109/TNNLS.2013.2247627
[23] 内政部:10.1080/00207179.2013.863432·Zbl 1292.49029号 ·doi:10.1080/00207179.2013.863432
[24] DOI:10.1016/j.automatica.2008.12.009·Zbl 1162.93345号 ·doi:10.1016/j.automatica.2008.12.009
[25] Sastry S.,《自适应控制:稳定性、收敛性和鲁棒性》(1989)·Zbl 0721.93046号
[26] 内政部:10.1109/9780470544785·doi:10.1109/9780470544785
[27] 内政部:10.1007/978-1-4615-3618-5·doi:10.1007/978-1-4615-3618-5
[28] 内政部:10.1007/978-3-642-84379-2·doi:10.1007/978-3642-84379-2
[29] DOI:10.1016/j.automatica.2010.02.018·Zbl 1191.49038号 ·doi:10.1016/j.automatica.2010.02.018
[30] 内政部:10.1016/j.neunet.2009.03.008·Zbl 1335.93068号 ·doi:10.1016/j.neunet.2009.03.008
[31] DOI:10.1016/j.自动2008.08.017·Zbl 1158.93354号 ·doi:10.1016/j.automatica.2008.08.017
[32] DOI:10.1016/j.自动2012.05.049·Zbl 1269.49042号 ·doi:10.1016/j.automatica.2012.05.049
[33] 内政部:10.1109/MCI.2009.932261·doi:10.1109/MCI.2009.932261
[34] Werbos P.J.,控制神经网络(1990)
[35] Werbos P.J.,《智能控制手册:神经、模糊和自适应方法》,第67页–(1992)
[36] 内政部:10.1109/TNNLS.2013.2292704·doi:10.1109/TNNLS.2013.2292704
[37] 内政部:10.1109/TSMCB.2011.2166384·doi:10.1109/TSMCB.2011.2166384
[38] DOI:10.10109/TSMCB.2008.926607·doi:10.1109/TSMCB.2008.926607
[39] 内政部:10.1080/00207179.2013.848292·Zbl 1317.93158号 ·doi:10.1080/00207179.2013.848292
[40] 内政部:10.1109/TNN.2011.2168538·doi:10.1109/TNN.2011.2168538
[41] 内政部:10.1109/TNN.2011.2172628·doi:10.1109/TNN.2011.2172628
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。