×

构造凸最优控制问题子解的算法。 (英语) Zbl 1503.90152号

摘要:我们提出了一种算法,该算法可以为一类最优控制问题生成一个非递减的子解序列,该最优控制问题以相关的Bellman算子保持凸性为特征。除了理论讨论和收敛性证明外,还通过数值实验说明了该方法的可行性。

MSC公司:

90立方厘米 动态编程
93年20日 最优随机控制
49升20 最优控制与微分对策中的动态规划
49平方米25 最优控制中的离散逼近

软件:

卡萨迪
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] J.A.Andersson、J.Gillis、G.Horn、J.B.Rawlings和M.Diehl,CasADi:非线性优化和最优控制的软件框架,数学。程序。计算。,11(2019),第1-36页·Zbl 1411.90004号
[2] A.Bachouch、C.Hureí、N.Langreneí和H.Pham,有限水平随机控制问题的深度神经网络算法:数值应用,Methodol。计算。申请。可能性。,24(2022),第143-178页·Zbl 1496.93112号
[3] G.Barles和E.R.Jakobsen,抛物Hamilton-Jacobi-Bellman方程单调逼近格式的误差界,数学。公司。,76(2007),第1861-1893页·Zbl 1123.65096号
[4] D.Belomestny、A.Kolodko和J.Schoenmakers,随机控制问题的回归方法及其收敛性分析,SIAM J.控制优化。,48(2010),第3562-3588页,https://doi.org/10.1137/090752651。 ·Zbl 1205.60087号
[5] D.P.Bertsekas,凸优化算法,Athena Scientific,马萨诸塞州贝尔蒙特,2015年·Zbl 1347.90001号
[6] D.P.Bertsekas和S.Shreve,《随机最优控制:离散时间案例》,雅典娜科学出版社,马萨诸塞州贝尔蒙特,1996年·Zbl 0471.93002号
[7] Bismut,最优随机控制中的共轭凸函数,数学杂志。分析。申请。,44(1973),第384-404页·兹伯利0276.93060
[8] P.Briand和C.Labart,用Wiener混沌展开模拟BSDEs,Ann.Appl。可能性。,24(2014),第1129-1171页·Zbl 1311.60077号
[9] I.Capuzzo-Dolcetta和M.Falcone,《Bellman方程的离散动态规划和粘度解》,Ann.Inst.H.PoincareíC Anal。《非线形》,6(1989),第161-183页·Zbl 0674.49028号
[10] J.Darbon、G.P.Langlois和T.Meng,通过神经网络架构克服某些Hamilton-Jacobi偏微分方程的维数灾难,Res.Math。科学。,7 (2020), 20. ·Zbl 1445.35119号
[11] J.Darbon和T.Meng,关于能够表示某些高维Hamilton-Jacobi偏微分方程粘性解的一些神经网络结构,J.Compute。物理。,425 (2021), 109907. ·Zbl 07508503号
[12] W.E、J.Han和A.Jentzen,《求解高维偏微分方程的算法:从非线性蒙特卡罗到机器学习》,《非线性》,35(2022),第278-310页·Zbl 1490.60202号
[13] M.Falcone和R.Ferretti,线性方程和Hamilton-Jacobi方程的半拉格朗日近似格式,SIAM,费城,2013,https://doi.org/10.1137/1.9781611973051。 ·Zbl 1335.65001号
[14] S.Feícamp、J.Mikael和X.Warin,《基于机器学习算法的风险管理》,预印本,https://arxiv.org/abs/1902.05287, 2019.
[15] M.Fischer,构造离散最优控制问题子解的迭代过程,SIAM J.control Optim。,49(2011),第2608-2626页,https://doi.org/10.1137/100803493。 ·Zbl 1244.49057号
[16] W.H.Fleming和H.M.Soner,受控马尔可夫过程和粘度解,第二版,斯托克出版社。模型。申请。普罗巴伯。25,Springer-Verlag,纽约,2006年·Zbl 1105.60005号
[17] C.Geiss和C.Labart,用Wiener混沌展开法模拟BSDEs的跳跃,随机过程。申请。,126(2016),第2123-2162页·Zbl 1336.60138号
[18] M.Germain、H.Pham和X.Warin,基于神经网络的随机控制算法和金融PDE,预印本,https://arxiv.org/abs/2101.08068, 2021. ·Zbl 07341723号
[19] L.Gruíne,《系统与控制百科全书:非线性最优控制问题的数值方法》,J.Baillieul和T.Samad编辑,Springer,伦敦,2013年。
[20] J.Hall、A.Nurkanovicí、F.Messerer和M.Diehl,解决具有线性互补约束的二次规划和最优控制问题的序列凸规划方法,IEEE控制系统。莱特。,6(2021年),第536-541页。
[21] J.Han和W.E,随机控制问题的深度学习近似,预印本,https://arxiv.org/abs/1611.07422, 2016.
[22] O.Hernaández-Lerma和J.B.Lasserre,离散时间马尔可夫控制过程:基本最优准则,应用。数学。(纽约)30,施普林格出版社,纽约,1996年·Zbl 0840.93001号
[23] J.-B.Hiriart-Urruti和C.Lemareíchal,《凸分析的基本原理》,斯普林格-Verlag出版社,柏林,2001年·Zbl 0998.49001号
[24] C.Hureí,H.Pham,A.Bachouch,and N.Langreneí,有限水平随机控制问题的深度神经网络算法:收敛分析,SIAM J.Numer。分析。,59(2021),第525-557页,https://doi.org/10.1137/20M1316640。 ·Zbl 1466.65007号
[25] J.E.Kelley,Jr.,求解凸规划的切割平面方法,印度工业大学。申请。数学。,8(1960年),第703-712页·Zbl 0098.12104号
[26] H.J.Kushner和P.Dupuis,连续时间随机控制问题的数值方法,第2版,应用。数学。(纽约)24,Springer-Verlag,纽约,2001年·Zbl 0968.93005号
[27] J.B.Lasserre、D.Henrion、C.Prieur和E.Treílat,通过占用测度和LMI松弛实现非线性最优控制,SIAM J.control Optim。,47(2008),第1643-1666页,https://doi.org/10.1137/070685051。 ·兹比尔1188.90193
[28] W.M.McEneaney,非线性控制和估计的Max-Plus方法,Birkha¨user,波士顿,2006年·Zbl 1103.93005号
[29] A.Picarelli和C.Reisinger,最优投资问题某些近似方案的基于对偶的后验误差估计,计算。数学。申请。,79(2020),第2099-2118页·Zbl 1453.49017号
[30] W.B.鲍威尔(W.B.Powell),《近似动态规划:解决维数的诅咒》(Approximate Dynamic Programming:Solving the Curses of Dimensionality),第二版,约翰·威利父子出版社,新泽西州霍博肯,2011年·Zbl 1242.90002号
[31] J.Yong和X.Y.Zhou,《随机控制:哈密顿系统和HJB方程》,应用。数学。(纽约)43,Springer-Verlag,纽约,1999年·Zbl 0943.93002号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。