×

一类具有多比例时滞的递归神经网络的全局逆最优性。 (英语) Zbl 07840718号

摘要:本文针对一类具有多比例时滞的递归神经网络,提出了两种新的输入-状态稳定控制的理论设计。本文开发的分析工具基于Lyapunov函数和逆优化方法,不需要求解Hamilton-Jacobi-Bellman方程。通过状态和输入维构造了两个逆最优反馈律,保证了所考虑系统的输入-状态稳定性。当状态和输入维数不同时,我们建立了一个标量函数,并利用Sontag公式给出了一个控制律。此外,对于一些有意义的成本泛函,逆最优控制的设计同时达到了系统的全局逆最优性和全局渐近稳定性。文中给出了四个数值算例来说明逆最优控制的有效性。

MSC公司:

93D25号 控制理论中的输入输出方法
93D20型 控制理论中的渐近稳定性
93B70型 网络控制
93立方厘米 延迟控制/观测系统
49号45 最优控制中的逆问题
PDF格式BibTeX公司 XML格式引用
全文: DOI程序

参考文献:

[1] 王,Z。;刘,Y。;罗,X。;Wang,J。;高,C。;彭,D。;Chen,W.,使用新的非凸正则化器实现大尺度仿射矩阵秩最小化,IEEE Trans。神经网络。学习。系统。,33, 9, 4661-4675, (2022)
[2] Akhmet,M.U。;阿鲁·阿斯兰克,D。;Y'lmaz,E.,广义型分段常数变元递归神经网络的稳定性分析,神经网络。,23, 7, 805-811, (2010) ·Zbl 1400.34112号
[3] 胡,S。;Wang,J.,连续时间递归神经网络的全局渐近稳定性和全局指数稳定性,IEEE Trans。自动。控制,47,5,802-807,(2002)·Zbl 1364.93680号
[4] 范,L。;Zhu,Q.,具有部分不稳定子系统和混合时滞的离散时间Markov切换随机神经网络的均方指数稳定性,Inf.Sci。,580, 243-259, (2021)
[5] 桑切斯,E.N。;Perez,J.P.,动态神经网络的输入-状态稳定性(ISS)分析,IEEE Trans。电路系统。一、 46、11、1395-1398(1999)·Zbl 0956.68133号
[6] 张,H。;刘,Z。;黄,G。;Wang,Z.,时变时滞递归神经网络新的基于加权延迟的稳定性准则,IEEE Trans。神经网络。,21, 1, 91-106, (2010)
[7] Hien,L.V。;儿子,D.T。;Trinh,H.,关于具有多重比例延迟的非自治神经网络的全局耗散性,IEEE Trans。神经网络。学习。系统。,29, 1, 225-231, (2018)
[8] 黄,Z。;Bin,H。;曹,J。;Wang,B.,基于一类q型允许时间尺度的比例延迟神经网络同步,IEEE Trans。神经网络。学习。系统。,29, 8, 3418-3428, (2018)
[9] 杨,X。;宋,Q。;曹,J。;Lu,J.,通过量化控制实现具有比例延迟的耦合马尔可夫反应扩散神经网络的同步,IEEE Trans。神经网络。学习。系统。,30, 3, 951-958, (2019)
[10] Zhou,L.,一类具有比例延迟的细胞神经网络的耗散性,非线性动力学。,73, 3, 1895-1903, (2013) ·兹比尔1281.92010
[11] 黄,H。;黄,T。;陈,X。;钱,C.,延迟递归神经网络的指数镇定:基于状态估计的方法,神经网络。,48, 153-157, (2013) ·Zbl 1297.93153号
[12] 姜浩。;Teng,Z.,时变系数和时滞细胞神经网络的全局指数稳定性,神经网络。,17, 10, 1415-1425, (2004) ·Zbl 1068.68121号
[13] 王,Z。;刘,Y。;Liu,X.,具有离散和分布时滞的跳跃递归神经网络的状态估计,神经网络。,22, 1, 41-48, (2009) ·Zbl 1335.93125号
[14] 曾,Z。;Wang,J.,强外部刺激下时变时滞递归神经网络的全局指数稳定性,神经网络。,19, 10, 1528-1537, (2006) ·Zbl 1178.68479号
[15] Ahn,C.K.,时滞切换Hopfield神经网络的被动学习和输入-状态稳定性,信息科学。,180, 23, 4582-4594, (2010) ·Zbl 1211.93109号
[16] Arik,S.,《关于时滞动态神经网络的全局耗散性》,Phys。莱特。A、 326、1-2、126-132(2004)·Zbl 1161.37362号
[17] 周,L.,比例时滞细胞神经网络的全局渐近稳定性,非线性动力学。,77, 1-2, 41-47, (2014) ·Zbl 1314.92021号
[18] Jia,R.,一类多比例时滞模糊细胞神经网络的有限时间稳定性,模糊集系统。,319, 70-80, (2017) ·Zbl 1385.34052号
[19] Liu,B.,具有中立比例时滞和时变泄漏时滞的CNN的有限时间稳定性,数学。方法应用。科学。,40, 1, 167-174, (2017) ·Zbl 1356.34074号
[20] 曹,J。;袁,K。;Li,H.,具有多个离散时滞和分布时滞的递归神经网络的全局渐近稳定性,IEEE Trans。神经网络。,17, 6, 1646-1651, (2006)
[21] 周,L。;刘杰。;郑毅。;肖,F。;Xi,J.,混合多智能体系统基于游戏的共识,IEEE Trans。赛博。,53, 8, 5346-5357, (2023)
[22] Hua,M。;郑,D。;邓,F。;费,J。;Cheng,P。;具有乘性噪声和部分模相关特征的非齐次马尔可夫跳跃重复标量非线性系统的Dai,X.,H_∞滤波,IEEE Trans。系统。人类网络。系统。,51, 5, 3180-3192, (2021)
[23] 克拉克,F.H。;Stern,R.J.,状态约束反馈镇定,SIAM J.控制优化。,42,2422-441,(2003年)·Zbl 1037.93068号
[24] 刘易斯,F.L。;Syrmos,V.L.,《最优控制》,(1995年),威利出版社:纽约威利出版社
[25] Cheng,T。;刘易斯,F.L。;Abu-Khalaf,M.,非线性系统固定最终时间最优控制的神经网络解决方案,Automatica,43,3,482-490,(2007)·Zbl 1137.93331号
[26] Marzban,G.R。;Hoseini,S.M.,解决多时滞非线性最优控制问题的有效离散化方案,Optim。控制应用程序。方法,37,4,682-707,(2016)·Zbl 1346.49044号
[27] Kalman,R.E.,线性控制系统何时是最优的?,《基础工程杂志》,86,1,81-90,(1964)
[28] 邓,H。;Krstíc,M.,随机非线性稳定-II:逆最优性,系统。对照Lett。,32, 3, 151-159, (1997) ·Zbl 0902.93050号
[29] Do,K.D.,由Lévy过程驱动的随机系统的逆最优控制,Automatica,107,539-550,(2019)·Zbl 1429.93417号
[30] Freeman,R.A。;Kokotovic,P.V.,鲁棒稳定中的逆最优性,SIAM J.控制优化。,34, 4, 1365-1391, (1996) ·Zbl 0863.93075号
[31] Jin,W。;Kulíc,D。;林,J.F.S。;牟,S。;Hirche,S.,多相成本函数的逆最优控制,IEEE Trans。机器人。,35, 6, 1387-1398, (2019)
[32] 克里斯蒂奇,M。;邓,H.,非线性不确定系统的镇定,(1998),施普林格:施普林格伦敦·Zbl 0906.93001号
[33] 李伟(Li,W.)。;Xie,X.,线性化不可镇定的随机非线性系统的逆最优镇定,Automatica,45,2,498-503,(2009)·Zbl 1158.93411号
[34] 桑切斯,E.N。;Perez,J.P.,动态神经网络的输入到状态稳定,IEEE Trans。系统。人类网络。,A部分,系统。Hum.,33,4,532-535,(2003)
[35] 塞普尔赫里,R。;扬科维奇,M。;Kokotovic,P.,构造非线性控制,(1997),Springer-Verlag:Springer-Verlag纽约·兹比尔1067.93500
[36] Vega,C.J。;O.J.苏亚雷斯。;桑切斯,E.N。;Chen,G.R。;Elvira-Ceja,S。;Rodriguez-Castellanos,D.,通过逆最优钉扎控制实现复杂网络的轨迹跟踪,IEEE Trans。自动。控制,64,2767-774,(2019)·Zbl 1482.93688号
[37] Liu,Z.,基于Hamilton-Jacobi-Bellman方程的耦合随机神经网络混沌同步非线性最优控制设计,神经网络。,99, 166-177, (2018) ·Zbl 1441.93344号
[38] 刘,Z。;舒尔茨,H。;北安萨里。;王强,随机细胞神经网络微分极小极大控制器的理论设计,神经网络。,26, 110-117, (2012) ·Zbl 1245.93137号
[39] 杨,B。;马伟(Ma,W.)。;郑毅,具有时滞脉冲的混合脉冲随机泛函微分系统的实用指数稳定性,国际鲁棒非线性控制,33,14,8336-8356,(2023)
[40] Wang,J。;周,L。;张,D。;刘杰。;肖,F。;Zheng,Y.,二阶一致性抗干扰协议选择,Automatica,161111497,(2024)
[41] 哈代,G。;利特伍德,J。;Polya,G.,《不等式》(1989),剑桥大学出版社:剑桥大学出版社,英国剑桥。
[42] 刘,H。;卢,J。;吕,J。;Hill,D.J.,具有时滞的不确定一般复杂动力网络的结构识别,Automatica,45,8,1799-1807,(2009)·Zbl 1185.93031号
[43] Malisoff,M。;里福德,L。;Sontag,E.D.,全局渐近可控性意味着输入-状态稳定,SIAM J.控制优化。,42, 6, 2221-2238, (2004) ·Zbl 1069.93031号
[44] Sontag,E.D.,关于非线性镇定的Artstein定理的通用构造,系统。对照Lett。,13, 2, 117-123, (1989) ·Zbl 0684.93063号
[45] Yang,D。;宗,G。;不确定Markov混合切换系统的Su,S.,H_∞跟踪控制:模糊切换动态自适应控制方法,IEEE Trans。赛博。,52, 5, 3111-3122, (2022)
[46] Hua,M。;钱,Y。;邓,F。;费,J。;Cheng,P。;Chen,H.,带量化效应的离散时间Takagi-Sugeno模糊非齐次马尔可夫跳跃系统的滤波,IEEE Trans。赛博。,52, 2, 982-995, (2022)
[47] 赛尔夫,R。;M.阿布迪亚。;纳希德·马赫穆德,S.M。;Kamalapurkar,R.,确定性系统的基于模型的反向强化学习,Automatica,140,第110242页,(2022)·Zbl 1485.93135号
[48] Lian,B。;Kartal,Y。;刘易斯,F.L。;Mikulski,D.G。;Hudas,G.R。;Wan,Y。;Davoudi,A.,使用反向强化学习优化自治系统的异常检测和纠正,IEEE Trans。赛博。,53, 7, 4555-4566, (2023)
[49] Wu,H.,通过自适应逆最优控制在线学习一类人机系统的人类行为,IEEE Trans。人-马。系统。,52, 5, 1004-1014, (2022)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。