×

解决HJB最小时间控制问题的多级技术。 (英语) Zbl 1485.93180号

摘要:最小时间反馈最优控制问题的求解通常采用动态规划方法,其中值函数必须在具有大量点的数值网格上计算。如果网格点的数量很大,经典的数值策略(如值迭代(VI)或策略迭代(PI)方法)将变得非常低效。这对它们在实际应用中的使用是一个很大的限制。为了解决这个问题,作者提出了一种新的多级框架,其中经典的VI和PI嵌入到全近似存储(FAS)方案中。事实上,作者将证明VI和PI具有出色的平滑特性,这一事实使它们非常适合在多级框架中使用。此外,通过使用Anderson的外推技术加速VI,开发了一种新的平滑器。通过几个数值实验验证了我们新方案的有效性。

MSC公司:

93B52号 反馈控制
49升12 最优控制和微分对策中的Hamilton-Jacobi方程
49升20 最优控制与微分对策中的动态规划

软件:

安德森
PDF格式BibTeX公司 XML格式引用
全文: 内政部 链接

参考文献:

[1] Jurdjevic,V.,《几何控制理论》(1996),剑桥:剑桥大学出版社,剑桥·兹比尔1138.93005
[2] Lee,E.B。;Markus,L.,《最优控制理论基础》(1967),纽约:威利出版社,纽约·Zbl 0159.13201号
[3] 苏斯曼,H.J。;Willems,J.C.,《300年的最优控制:从最短时间到最大原则》,IEEE控制系统,17,32-44(1997)·Zbl 1014.49001号
[4] Bellman,R.,《动态编程》(1957),普林斯顿:普林斯顿大学出版社,普林斯顿·Zbl 0077.13605号
[5] 巴迪,M。;Dolcetta,I.C.,Hamilton-Jacobi-Bellman方程的最优控制和粘度解(1997),巴塞尔:Birkhäuser,巴塞尔·Zbl 0890.49011号
[6] 郭,B。;Wu,T.T.,《用动态规划方法求解最优反馈控制的数值解:局部近似算法》,《系统科学与复杂性杂志》,30,4,782-802(2017)·Zbl 1380.49031号
[7] Chai,L。;钱,C.,通过动态线性控制器实现一类非线性时滞系统的状态反馈镇定,《系统科学与复杂性杂志》,27,3,453-462(2014)·Zbl 1303.93140号
[8] 法尔科内,M。;Ferretti,R.,线性方程和Hamilton-Jacobi方程的半拉格朗日近似方案(2014)·Zbl 1335.65001号
[9] Howard,R.A.,动态编程,管理。科学。,12, 5, 317-348 (1966)
[10] Pollatschek,M。;Avi-Itzhak,B.,具有几何解释的随机游戏算法,管理。科学。,15, 7, 399-415 (1969) ·Zbl 0182.53502号
[11] Puterman,M.L.(Puterman,M.L.)。;Brumelle,S.L.,关于平稳动态规划中策略迭代的收敛性,数学。操作。第4、1、60-69号决议(1979年)·Zbl 0411.90072号
[12] Alla,A。;法尔科内,M。;Kalise,D.,动态规划方程的有效策略迭代算法,SIAM J.Sci。计算。,37、1、A181-A200(2015)·兹比尔1327.65259
[13] Cacace,S。;克里斯蒂亚尼,E。;Falcone,M.,一类Hamilton-Jacobi-Bellman方程的补丁动态规划方案,SIAM J.Sci。计算。,34、5、A2625-A2649(2012)·Zbl 1259.65097号
[14] 卡米利,F。;法尔科内,M。;Lanucara,P.,Bellman方程的区域分解方法,康特姆。数学。,180477-477(1994年)·Zbl 0817.65055号
[15] Festa,A.,一类Hamilton-Jacobi方程独立子域的重建及其在并行计算中的应用,ESAIM:Math。模型。数字,50,4,1223-1240(2016)·Zbl 1347.49044号
[16] Alla,A。;Haasdonk,B。;Schmidt,A.,通过模型降阶和动态规划原理对参数化产品进行反馈控制,高级计算。数学。,46, 1, 1-28 (2020) ·Zbl 1441.49031号
[17] Sun,B。;陶振中。;Wang,Y.Y.,动态规划粘性解方法及其在最优控制问题中的应用,《工程、建模和社会问题的数学应用》,363-420(2019)·Zbl 1430.90554号
[18] Sun,B。;Guo,B.Z.,最优控制中Hamilton-Jacobi-Bellman方程迎风有限差分格式的收敛性,IEEE自动控制学报,60,11,3012-3017(2015)·Zbl 1360.65218号
[19] Alla,A。;法布里尼,G。;Falcone,M.,高效解决最优控制问题的耦合MPC和DP方法,IFIP系统建模和优化会议,68-77(2015)
[20] 法布里尼,G。;法尔科内,M。;Volkwein,S.,基于POD的反馈定律计算的耦合MPC和HJB,欧洲数值数学和高级应用会议,941-949(2017)·Zbl 07136779号
[21] Annunziato,M。;Borzi,A。;Nobile,F.,《关于Hamilton-Jacobi-Bellman和Fokker-Planck控制框架之间的连接》,J.Appl。数学,5,16,2476-2484(2014)
[22] Anderson,D.,非线性积分方程的迭代程序,J.Assoc.Compute。机器。,12, 547-560 (1965) ·Zbl 0149.11503号
[23] Walker,H.F。;Ni,P.,定点迭代的Anderson加速度,SIAM J.Numer。分析。,49, 4, 1715-1735 (2011) ·Zbl 1254.65067号
[24] Walker,H.F.,Anderson加速:算法和实现,WPI数学。科学部报告MS-6-15-50(2011)
[25] Saad,Y.,《大型特征值问题的数值方法》(1992),英国曼彻斯特:曼彻斯特大学出版社,英国曼城·Zbl 0991.65039号
[26] 托斯,A。;Kelley,C.,安德森加速度收敛分析,SIAM J.Numer。分析。,53, 2, 805-819 (2015) ·兹比尔1312.65083
[27] Hoppe,R.H.,Hamilton-Jacobi-Bellman方程的多重网格方法,数值。数学。,49, 2-3, 239-254 (1986) ·Zbl 0577.65088号
[28] Han,D。;Wan,J.W.,二阶Hamilton-Jacobi-Bellman和Hamilton-Jacobi-Ballman-Isaacs方程的多重网格方法,SIAM J.Sci。计算。,35、5、S323-S344(2013)·Zbl 1281.65128号
[29] 阿基安,M。;Detournay,S.,双人零和随机博弈的多网格方法,Numer。线性代数应用。,19, 2, 313-342 (2012) ·Zbl 1274.91059号
[30] Hackbusch,W.,《多重网格方法和应用》(2003),纽约:Springer,纽约·Zbl 0595.65106号
[31] Borz,A.,《多重网格方法简介》(2011年)
[32] 弗莱明,W。;Rishel,R.,《确定性和随机最优控制》(1975),纽约:Springer Verlag出版社,纽约·兹伯利0323.49001
[33] 巴迪,M。;Falcone,M.,最小时间函数的近似方案,SIAM J.Control Optim。,28, 4, 950-965 (1990) ·Zbl 0723.49024号
[34] Falcone,M.,动态规划方程的数值解,HJB方程的最优控制和粘度解(1997),柏林:Birkhäuser,柏林
[35] 桑托斯,M.S。;Rust,J.,策略迭代的收敛性,SIAM J.控制优化。,42, 6, 2094-2115 (2004) ·Zbl 1134.90530号
[36] 甘德,W。;甘德,M.J。;Kwok,F.,《科学计算——使用Maple和Matlab的简介》(2014)·Zbl 1296.65001号
[37] Ulbrich,M.,《函数空间中变分不等式和约束优化问题的半光滑牛顿方法》(2011),PA:SIAM,Philadelphia,PA·Zbl 1235.49001号
[38] Henson,V.E.,《非线性问题的多重网格方法:概述》(2002年),CA(美国):Lawrence Livermore国家实验室,CA(US)
[39] 波茨?,A。;Ciaramella,G。;Sprengel,M.,《量子控制问题的公式和数值解》(2017),宾夕法尼亚州费城:SIAM,宾夕法尼亚州,费城·兹比尔1402.81006
[40] 陈,Y。;Hou,T。;Yi,N.,抛物方程控制的最优控制问题的变分离散化,《系统科学与复杂性杂志》,26,6,902-924(2013)·Zbl 1297.49048号
[41] Tang,Y。;Chen,Y.,带控制约束的抛物线最优控制问题的变分离散化,系统科学与复杂性杂志,25,5,880-895(2012)·Zbl 1269.49054号
[42] Gubisch,M。;Volkwein,S.,线性二次最优控制的正确正交分解,模型简化和近似:理论和算法(2017),宾夕法尼亚州费城:SIAM,宾夕法尼亚州
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。