×

用动态规划方法数值求解最优反馈控制:局部近似算法。 (英语) Zbl 1380.49031号

摘要:本文研究具有有限时域代价泛函的一般连续时间有限维确定性系统的最优反馈控制。提出了一种实用的算法,用动态规划方法计算最优反馈控制的数值解。该算法的亮点是:a)它基于作者之前提出的最优反馈控制律的收敛构造算法,通过对动态规划方法开发的时空离散化方案的粘性解进行近似;b) 由于只计算了最优轨迹周围某些局部锥上的粘性解值,因此计算复杂度大大降低。通过两个数值实验验证了该算法的有效性和快速性。

MSC公司:

49升20 最优控制与微分对策中的动态规划
49平方米25 最优控制中的离散逼近
90C29型 多目标规划
93立方厘米 控制理论中的非线性系统
93立方厘米 由常微分方程控制的控制/观测系统
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Sussmann H J和Willems J C,《300年的最优控制:从短时间到最大原则》,IEEE控制系统杂志,1997年,17:32-44·Zbl 1014.49001号 ·数字对象标识代码:10.1109/37.588098
[2] Stoer J和Bulirsch R,《数值分析导论》,第二版,Springer-Verlag,纽约,1993年·Zbl 0771.65002号 ·doi:10.1007/978-1-4757-2272-7
[3] Brysun Jr A E,最优控制-1950至1985,IEEE控制系统杂志,1996年,13:26-33·数字对象标识代码:10.1109/37.506395
[4] Bardi M和Dolcetta I C,Hamilton-Jacobi-Bellman方程的最优控制和粘度解,Birkhäuser,波士顿,1997年·Zbl 0890.49011号 ·doi:10.1007/978-0-8176-4755-1
[5] Crandall M G和Lions P L,Hamilton-Jacobi方程的粘度解,Tran。阿默尔。数学。Soc.,1983年,277:1-42·兹比尔0599.35024 ·doi:10.1090/S0002-9947-1983-0690039-8
[6] Crandall M G和Lions P L,哈密尔顿-雅可比方程解的两种近似,数学。公司。,1984, 43: 1-19. ·Zbl 0556.65076号 ·doi:10.1090/S0025-5718-1984-0744921-8
[7] Carlini E、Falcone M和Ferretti R,高维Hamilton-Jacobi方程的有效算法,计算。视觉。科学。,2004, 7: 15-29. ·Zbl 1070.65072号 ·doi:10.1007/s00791-004-0124-5
[8] Osher S和Shu C W,Hamilton-Jacobi方程的高阶本质非振荡格式,SIAM J.Numer。分析。,1991, 28: 907-922. ·Zbl 0736.65066号 ·doi:10.1137/0728049
[9] Zhang,Y.T。;舒,C.W。;Hou,T.Y(编辑);Tadmor,E.(编辑),二维非结构网格上Hamilton-Jacobi方程的三阶和四阶加权ENO格式,941-950(2003)·Zbl 1075.70004号 ·doi:10.1007/978-3-642-55711-889
[10] Hu C和Shu C W,Hamilton-Jacobi方程的间断Galerkin有限元方法,SIAM J.Sci。计算。,1999, 21: 666-690. ·Zbl 0946.65090号 ·doi:10.1137/S1064827598337282
[11] Cheng Y和Shu C W,直接求解Hamilton-Jacobi方程的间断Galerkin有限元方法,J.Compute。物理。,2007, 223: 398-415. ·兹比尔1124.65090 ·doi:10.1016/j.jp.2006.09.012
[12] Aubin J P和Frankowska H,计算无限时域最优控制问题值函数的生存核算法,J.Math。分析。申请。,1996, 201: 555-576. ·Zbl 0862.65039号 ·doi:10.1006/jmaa.1996.0273
[13] Carlini,E。;克里斯蒂亚尼,E。;Forcadel,N.,Hamilton-Jacobi方程模拟位错动力学的非单调快速推进方案,723-731(2006)·Zbl 1118.65369号 ·doi:10.1007/978-3-540-34288-570
[14] 蔡毅,程丽婷,奥舍尔·S,等,一类哈密尔顿-雅可比方程的快速扫描算法,SIAM J.Numer。分析。,2003, 41: 673-694. ·Zbl 1049.35020号 ·doi:10.1137/S0036142901396533
[15] Sethian J A和Vladimirsky A,静态Hamilton-Jacobi方程的有序逆风方法,Proc。国家。阿卡德。科学。美国,2001,98:11069-11074·Zbl 1002.65112号 ·doi:10.1073/pnas.201222998
[16] Dupuis P和Szpiro A,一类确定性最优控制问题数值方法中最优反馈策略的收敛性,SIAM J.control和Optim。,2001, 40: 393-420. ·Zbl 1001.49032号 ·doi:10.1137/S0363012998344968
[17] 法尔科内,M。;Menaldi,J.L(编辑);Rofman,E.(编辑);Sulem,A.(编辑),关于通过数值方法合成反馈控制的一些评论,456-465(2001)·Zbl 1054.65511号
[18] Kushner H J和Dupuis P G,连续时间随机控制问题的数值方法,Springer-Verlag,柏林,1992年·Zbl 0754.65068号 ·doi:10.1007/978-1-4684-0441-8
[19] Barron E N,无限维Hamilton-Jacobi-Bellman方程粘性解在分布式最优控制中的应用,J.Optim。理论与应用。,1990, 64: 245-268. ·Zbl 0687.49022号 ·doi:10.1007/BF00939448
[20] 郭本泽和孙斌,种群动力学最优生育反馈控制的数值解:粘性解方法,Optim。控制应用程序。方法。,2005, 26: 229-254. ·doi:10.1002/oca.759
[21] Kocan M和Soravia P,状态约束最优控制中产生的无限维Hamilton-Jacobi方程的粘性方法,SIAM J.控制优化。,1998, 36: 1348-1357. ·兹比尔0918.49025 ·doi:10.137/S0363012996301622
[22] Yong J M和Zhou X Y,《随机控制:哈密顿系统和HJB方程》,Springer,纽约,1999年·Zbl 0943.93002号 ·doi:10.1007/978-1-4612-1466-3
[23] McEneaney W M,非线性控制和估计的Max-Plus方法,Birkhauser,波士顿,2006年·Zbl 1103.93005号
[24] McEneaney WM,用二次型极大值表示的Hamilton-Jacobi-Bellman偏微分方程无诅咒维数方法的收敛速度,SIAM J.Control Optim。,2009, 48: 2651-2685. ·Zbl 1203.49039号 ·数字对象标识代码:10.1137/070687980
[25] McEneaney W M和Kluberg L J,一类HJB偏微分方程无维数诅咒方法的收敛速度,SIAM J.控制优化。,2009, 48: 3052-3079. ·Zbl 1218.35074号 ·数字对象标识代码:10.1137/070681934
[26] 郭伯忠,吴天通,最优反馈控制逼近:动态规划方法,全局优化。,2010年,46:395-422·Zbl 1185.49030号 ·数字对象标识代码:10.1007/s10898-009-9432-0
[27] Peyret R和Taylor T D,流体流动的计算方法,Springer-Verlag,纽约,1983年·Zbl 0514.76001号 ·doi:10.1007/978-3-642-85952-6
[28] Wang S、Gao F和Teo K L,Hamilton-Jacobi-Bellman方程粘性解近似的迎风有限差分方法,IMA J.Math。控制和通知。,2000, 17: 167-178. ·Zbl 0952.49025号 ·doi:10.1093/imamci/17.2.167
[29] 郭伯忠,孙斌,连铸过程最优反馈控制的数值解法,J.Global Optim。,2007, 39: 171-195. ·Zbl 1123.49024号 ·doi:10.1007/s10898-006-9130-0
[30] 郭B Z和孙B,求最优反馈控制数值解的新算法,IMA J.Math。控制和通知。,2009, 26: 95-104. ·Zbl 1160.49037号 ·doi:10.1093/imamci/dnn001
[31] Crandall M G、Ishii H和Lions P L,二阶偏微分方程粘度解用户指南,Bull。阿默尔。数学。Soc.,1992年,27:1-67·Zbl 0755.35015号 ·doi:10.1090/S0273-0979-1992-00266-5
[32] Falcone M和Ferretti R,Hamilton-Jacobi-Bellman方程粘性解的离散时间高阶格式,数值。数学。,1994年,67:315-344·兹伯利0791.65046 ·doi:10.1007/s002110050031
[33] Drake D、Xin M和Balakrishnan S N,可重复使用运载火箭上升阶段的新型非线性控制技术,AIAA J.制导、控制和动力学,2004,27:938-948。
[34] Wu,T.T。;Guo,B.Z.,最优反馈控制数值解的邻域近似算法,515-525(2009)
[35] 《动态规划原理与哈密尔顿-雅可比-贝尔曼方程》,上海科学技术出版社,上海,1992年。
[36] Knowles G,《应用最优控制导论》,学术出版社,纽约,1981年·Zbl 0469.49001号
[37] 郭文忠和孙斌,艾滋病病毒/艾滋病两种药物治疗的最优控制数值解,Optim。工程,2014,15:119-136·Zbl 1307.49023号 ·文件编号:10.1007/s11081-012-9204-4
[38] Westphal L C,《控制系统工程手册》,Kluwer学术出版社,波士顿,2001年·doi:10.1007/978-1-4615-1533-3
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。