×

非线性系统有限时域(H_∞)状态反馈控制的神经网络解。 (英语) Zbl 1283.93108号

摘要:本文利用神经网络近似求解有限时域最优(H_{infty})状态反馈控制问题。该方法基于求解相应的有限视界零和对策的相关Hamilton-Jacobi-Isaacs方程。神经网络在状态空间的某个域上近似对应的博弈值函数,并产生作为神经网络输出计算的控制。结果表明,神经网络逼近一致收敛于博弈值函数,所得控制器具有闭环稳定性和有界增益。结果是求解了一个几乎精确的时变系数反馈控制器先验的脱机。本文的结果应用于旋转/平移致动器基准非线性控制问题。

MSC公司:

93B36型 \(H^\infty)-控制
93B52号 反馈控制
93立方厘米 控制理论中的非线性系统
92B20型 生物研究、人工生命和相关主题中的神经网络
PDF格式BibTeX公司 XML格式引用
全文: DOI程序

参考文献:

[1] DOI:10.1016/j.automatica.2004.11.034·Zbl 1087.49022号 ·doi:10.1016/j.automatica.2004.11.034
[2] Abu Khalaf,M,Lewis,FL和Huang,J.2005。”执行器饱和的神经网络状态反馈控制:非线性基准问题”。第五届控制与自动化国际会议记录。2005年1月。匈牙利:布达佩斯。
[3] Abu-Khalaf M,第十二届地中海控制和自动化会议记录(2004年)
[4] Abu Khalaf,M,Lewis,FL和Huang,J.“约束输入非线性系统的Hamilton-Jacobi-Isacs公式”。第43届IEEE决策与控制会议记录。美国12月,第5034–5040页。巴哈马。
[5] Adams R,Sobolev Spaces,2。编辑(2003)
[6] 阿诺德六世,常微分方程(1973)
[7] 内政部:10.1137/0316030·Zbl 0384.93036号 ·doi:10.1137/0316030
[8] 内政部:10.1007/978-0-8176-4755-1·doi:10.1007/978-0-8176-4755-1
[9] 巴特尔·RG,《真实分析的要素》,第2页。编辑(1976年)
[10] 内政部:10.1007/978-0-8176-4757-5·doi:10.1007/978-0-8176-4757-5
[11] Beard R,博士论文(1995年)
[12] 内政部:10.1080/002071798221542·Zbl 0945.49021号 ·doi:10.1080/002071798221542
[13] DOI:10.1023/A:1022664528457·Zbl 0916.49021号 ·doi:10.1023/A:1022664528457
[14] 内政部:10.1109/TCS.1978.1084534·Zbl 0397.93009号 ·doi:10.1109/TCS.1978.1084534
[15] DOI:10.1002/(SICI)1099-1239(19980415/30)8:4/5<307::AID-RNC354>3.0.CO;2-7 ·doi:10.1002/(SICI)1099-1239(19980415/30)8:4/5<307::AID-RNC354>3.0.CO;2-7
[16] 内政部:10.1109/9.293202·Zbl 0812.93050号 ·doi:10.1109/9.293202
[17] DOI:10.1016/j.automatica.2006.09.021·兹比尔1137.93331 ·doi:10.1016/j.automatica.2006.09.021
[18] Finlayson BA,加权残差法和变分原理(1972)
[19] 内政部:10.1080/00207729608929339·Zbl 0879.93026号 ·doi:10.1080/0207729608929339
[20] Gorman DJ,梁和轴的自由振动分析(1975)
[21] 内政部:10.1016/0893-6080(90)90005-6·doi:10.1016/0893-6080(90)90005-6
[22] 内政部:10.2514/3.21495·兹伯利0841.93018 ·数字对象标识代码:10.2514/3.21495
[23] 数字对象标识码:10.1016/S0362-546X(00)85016-6·Zbl 0959.49021号 ·doi:10.1016/S0362-546X(00)85016-6
[24] 内政部:10.1109/9.159566·Zbl 0755.93043号 ·数字对象标识代码:10.1109/9.159566
[25] Khalil HK,“非线性系统”(2002)
[26] Lewis,FL和Abu-Khalaf,M.“约束神经网络控制的Hamilton-Jacobi设置”。2003年IEEE智能控制国际研讨会论文集。10月5日至8日,德克萨斯州。第1-15页。休斯顿。
[27] Lewis,F.L,Abu-Khalaf,M和Huang,J.“使用神经网络对约束输入系统进行鲁棒最优控制”。第23届中国控制会议记录。八月,中国无锡。全体会议文件。
[28] Lewis,FL,Abu-Khalaf,M和Huang,J.“约束输入系统的Hamilton-Jacobi-Isaacs公式:神经网络解”。第二届国际会计师联合会系统、结构和控制研讨会会议记录。12月,墨西哥瓦哈卡。第1-6页。全体会议文件。
[29] Lewis FL,机器人机械手和非线性系统的神经网络控制(1999)
[30] 数字对象标识码:10.1007/s002459911010·Zbl 0952.49023号 ·doi:10.1007/s002459911010
[31] Miller WT,控制神经网络(1990)
[32] Mracek,CP和Cloutier,JR。“非线性基准问题的初步控制设计”。1996年控制应用国际会议记录。密歇根州,第265-272页。迪尔伯恩。
[33] 内政部:10.1109/72.728390·doi:10.1009/72.728390
[34] 内政部:10.1109/9.486648·Zbl 0846.93060号 ·数字对象标识代码:10.1109/9.486648
[35] 内政部:10.1109/21.278990·兹比尔1371.93112 ·doi:10.1109/21.278990
[36] 内政部:10.1109/81.704826·Zbl 0952.94027号 ·数字对象标识代码:10.1109/81.704826
[37] 桑纳,RM和斯隆,JJE。”使用径向高斯网络的稳定自适应控制和递归辨识”。程序。IEEE Conf.决策和控制。第2116-2123页。布赖顿。
[38] DOI:10.1002/(SICI)1099-1239(19980415/30)8:4/5<311::AID-RNC357>3.0.CO;2英尺·Zbl 0908.93031号 ·doi:10.1002/(SICI)1099-1239(19980415/30)8:4/5<311::AID-RNC357>3.0.CO;2楼
[39] 内政部:10.1109/9.256331·Zbl 0755.93037号 ·数字对象标识代码:10.1109/9.256331
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。