×

针对有限时域最优控制问题,提出了一种基于树结构的高效DP算法。 (英语) Zbl 1423.49024号

概述:最优控制问题的经典动态规划(DP)方法基于值函数作为Hamilton-Jacobi-Bellman方程唯一粘性解的特征。Bellman方程粘性解数值近似的DP格式通常基于时间离散化,时间离散化投影在固定的状态空间网格上。时间离散化可以通过动力学的一步格式完成,网格上的投影通常使用局部插值。显然,网格的使用对于因维数灾难而可能应用于高维问题的应用来说是一个限制。在这里,我们提出了一种新的方法来解决有限时域最优控制问题,其中值函数是使用DP算法和由时间离散动力学构造的树结构算法来计算的。这样就无需构建固定的空间三角网并在其上投影。该树将确保与离散动力学完美匹配,并降低空间插值的成本,从而解决高维问题。数值试验将证明该方法的有效性。

MSC公司:

49升20 最优控制与微分对策中的动态规划
49甲15 常微分方程最优控制问题的存在性理论
49J20型 偏微分方程最优控制问题的存在性理论
93B52号 反馈控制

软件:

布伦特
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] E.G.Al’brekht,关于非线性系统的最优镇定,J.应用。数学。机械。,25(1961),第254-266页。
[2] A.Alla、M.Falcone和D.Kalise,动态规划方程的一种有效策略迭代算法,SIAM J.科学。计算。,37(2015),第181-200页·Zbl 1327.65259号
[3] A.Alla、M.Falcone和S.Volkwein,基于动态规划方法的无限时域问题POD逼近误差分析SIAM J.控制优化。,55(2017),第3091-3115页·Zbl 1378.49025号
[4] M.Bardi和I.Capuzzo-Dolectta,Hamilton-Jacobi-Bellman方程的最优控制和粘性解,Birkha¨user,巴塞尔,1997年·Zbl 0890.49011号
[5] R.Bellman,动态编程,普林斯顿大学出版社,新泽西州普林斯顿,1957年·Zbl 0077.13605号
[6] V.G.Boltyanskii、R.V.Gamkrelidze和L.S.Pontryagin,走向最佳过程理论,美国学术代表。科学。苏联,110(1956)(俄语)·Zbl 0071.18203号
[7] R.P.Brent,无导数最小化算法《普伦蒂斯·霍尔,恩格尔伍德克利夫斯,新泽西州》,1973年·Zbl 0245.65032号
[8] S.Cacase、E.Cristiani、M.Falcone和A.Picarelli,一类Hamilton-Jacobi-Bellman方程的补丁动态规划方案,SIAM J.科学。计算。,34(2012年),第A2625-A2649页·Zbl 1259.65097号
[9] E.Carlini、M.Falcone和R.Ferretti,高维Hamilton-Jacobi方程的一种有效算法,计算。视觉。科学。,7(2004年),第15-29页·Zbl 1070.65072号
[10] F.Camilli、M.Falcone、P.Lanucara和A.Seghini,Bellman方程的区域分解方法《科学与工程计算中的区域分解方法》,D.E.Keyes和J.Xu主编,Contemp。数学。180,美国数学学会,普罗维登斯,RI,1994年,第477-483页·Zbl 0817.65055号
[11] C.L.Evans,偏微分方程,美国数学学会,普罗维登斯,RI,2010·Zbl 1194.35001号
[12] M.Falcone和R.Ferretti,线性方程和Hamilton-Jacobi方程的半拉格朗日近似格式,SIAM,费城,2013年·Zbl 1335.65001号
[13] M.Falcone和T.Giorgi,演化Hamilton-Jacobi方程的一种近似格式《随机分析、控制、优化和应用》,W.M.McEneaney、G.Yin和Q.Zhang主编,Birkha用户,巴塞尔,1999年,第289-303页·Zbl 0931.65067号
[14] M.Falcone、P.Lanucara和A.Seghini,Hamilton-Jacobi-Bellman方程的分裂算法,申请。数字。数学。,15(1994年),第207-218页·Zbl 0812.65050号
[15] A.费斯塔,一类Hamilton-Jacobi方程独立子域的重构及其在并行计算中的应用,ESAIM数学。模型。数字。分析。,4(2016),第1223-1240页·Zbl 1347.49044号
[16] A.费斯塔,基于区域分解的并行Howard算法,数学。计算。《模拟》,第147页(2018年),第121-139页·Zbl 07316204号
[17] W.H.Fleming和H.M.Soner,受控马尔可夫过程与粘度解纽约施普林格出版社,1993年·Zbl 0773.60070号
[18] J.Garcke和A.Kroöner,基于自适应稀疏网格求解HJB方程的偏微分方程次优反馈控制,《科学杂志》。计算。,70(2017),第1-28页·Zbl 1434.49020号
[19] R.A.Howard,动态规划与马尔可夫过程,威利,纽约,1960年·Zbl 0091.16001号
[20] M.Hinze、R.Pinnau、M.Ulbrich和S.Ulbich,基于PDE约束的优化,数学。模型。理论应用。23,Springer,纽约,2009年·Zbl 1167.49001号
[21] I.T.Jolliffe,主成分分析第二版,Springer Ser。统计人员。,施普林格,纽约,2002年·Zbl 1011.62064号
[22] D.Kalise、A.Kroener和K.Kunisch,动态规划方程的局部极小化算法,SIAM J.科学。计算。,38(2016),第A1587-A1615页·Zbl 1339.65084号
[23] D.Kalise和K.Kunisch,高维Hamilton-Jacobi-Bellman方程的多项式逼近及其在半线性抛物型偏微分方程反馈控制中的应用,SIAM J.科学。计算。,40(2018年),第A629-A652页·Zbl 1385.49022号
[24] K.Kunisch、S.Volkwein和L.Xie,基于HJB-POD的进化问题最优控制反馈设计,SIAM J.应用。戴恩。系统。,4(2004),第701-722页·Zbl 1058.35061号
[25] C.Navasca和A.J.Krener,Hamilton-Jacobi-Bellman偏微分方程的斑块解,《建模、估计和控制》,A.Chiuso等人编辑,《控制信息讲义》。科学。,364(2007),第251-270页·Zbl 1354.93071号
[26] S.Osher和R.Fedkiw,水平集方法与动态隐式曲面,Springer,纽约,2003年·Zbl 1026.76001号
[27] K.皮尔逊,关于与空间点系最接近的直线和平面,菲洛斯。Mag.,2(1901),第559-572页·JFM 32.0710.04号
[28] L.S.Pontryagin、V.G.Boltyanskii、R.V.Gamkrelidze和E.F.Mishchenko,最优过程的数学理论《跨科学》,纽约,1962年·Zbl 0102.32001号
[29] A.Quarteroni和A.Valli,偏微分方程的区域分解方法,牛津大学出版社,牛津,1999年·Zbl 0931.65118号
[30] L.Saluzzi、A.Alla和M.Falcone,动态规划方程树结构算法的误差估计,arXiv:1812.111942018年。
[31] J.A.Sethian,水平集方法和快速行进方法,剑桥大学出版社,剑桥,1999年·Zbl 0926.65106号
[32] F.Troéltzsch,偏微分方程的最优控制:理论、方法和应用,美国数学学会,普罗维登斯,RI,2010年·Zbl 1195.49001号
[33] S.Volkwein,基于适当正交分解的模型约简,康斯坦茨大学讲稿,2013年。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。