×

随机最优控制和线性规划方法。 (英语) Zbl 1226.93137号

摘要:我们研究了一个具有约束和贴现收益的经典随机最优控制问题。本文的主要结果在于,证明了该最优控制问题与在适当的概率测度空间上描述的线性优化问题具有相同的值。这使得我们能够推导出一个对偶公式,该公式似乎与合适的哈密尔顿-雅可比-贝尔曼方程的(粘度子)解的概念密切相关。我们还讨论了与长期平均问题的关系。

MSC公司:

93E20型 最优随机控制
90C05(二氧化碳) 线性规划
60 H10型 随机常微分方程(随机分析方面)
第49页第25页 最优控制和微分对策中Hamilton-Jacobi方程的粘性解
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Barles,G.,Jakobsen,E.R.:关于Hamilton-Jacobi-Bellman方程近似格式的收敛速度。M2AN数学。模型。数字。分析。36(1), 33–54 (2002) ·Zbl 0998.65067号 ·doi:10.1051/m2an:20002年
[2] Basak,G.K.,Borkar,V.S.,Ghosh,M.K.:退化扩散的遍历控制。斯托克。分析。申请。15, 1–17 (1997) ·Zbl 0872.93079号 ·doi:10.1080/07362999708809460
[3] Bhatt,A.G.,Borkar,V.S.:受控马尔可夫过程的占用度量:表征和优化。安·普罗巴伯。1531-1562年(1996年)·Zbl 0863.93086号 ·doi:10.1214/aop/1065725192
[4] Borkar,V.,Gaitsgory,V.:受控随机微分方程的极限职业测量集的存在性。SIAM J.控制优化。44(4), 1436–1473 (2005) ·Zbl 1109.93033号 ·doi:10.1137/S0363012904443476
[5] Buckdahn,R.,Peng,S.,Quincampoix,M.,Rainer,C.:状态约束下随机控制的存在性。C.R.学院。科学。Ser.巴黎。一、 数学。327, 17–22 (1998) ·Zbl 1036.49026号 ·doi:10.1016/S0764-4442(98)80096-7
[6] Crandall,M.G.,Lions,P.L.:哈密尔顿-雅可比方程的粘度解。事务处理。美国数学。Soc.253,1-42(1983年)·兹比尔0599.35024 ·doi:10.1090/S0002-9947-1983-0690039-8
[7] Crandall,M.,Ishii,H.,Lions,P.L.:二阶偏微分方程粘度解的用户指南。牛市。AMS 27,1–67(1992)·Zbl 0755.35015号 ·doi:10.1090/S0273-0979-1992-00266-5
[8] Finlay,L.,Gaitsgory,V.,Lebedev,I.:与最优控制的长期平均问题相关的线性规划问题的对偶性。SIAM J.控制优化。47(4), 1667–1700 (2008) ·Zbl 1167.49032号 ·数字对象标识代码:10.1137/060676398
[9] Fleming,W.,Soner,H.M.:受控马尔可夫过程和粘度解。施普林格,纽约(1993)·Zbl 0773.60070号
[10] Gaitsgory,V.,Quincampoix,M.:确定性无限期最优控制问题的线性规划分析(折扣和时间平均情况)。SIAM J.控制优化。48(4), 2480–2512 (2009) ·Zbl 1201.49040号 ·数字对象标识代码:10.1137/070696209
[11] Gaitsgory,V.,Rossomakhine,S.:最优控制确定性长期平均问题的线性规划方法。SIAM J.控制优化。44(6), 2006–2037 (2006) ·Zbl 1109.93017号 ·doi:10.1137/040616802
[12] Grüne,L.:非线性控制系统在奇异点的渐近可控性和指数镇定。SIAM J.控制优化。36(5), 1485–1503 (1998) ·Zbl 0910.93063号 ·doi:10.1137/S0363012997315919
[13] Grüne,L.:关于折扣和平均最优值函数之间的关系。J.差异。埃克。148, 65–99 (1998) ·兹比尔0918.49002 ·doi:10.1006/jdeq.1998.3451
[14] Hernandez-Lerma,O.,Lasserre,J.B.:马尔可夫链和不变概率。Birkhauser,巴塞尔(2003)·Zbl 1036.60003号
[15] Kurtz,T.G.,Stockbridge,R.H.:马尔可夫控制的存在性和最优马尔可夫控制器的特征。SIAM J.控制优化。36(2),609–653(1998年)·Zbl 0935.93064号 ·doi:10.1137/S03630129952516
[16] Lasserre,J.B.,Henrion,D.,Prieur,C.,Trélat,E.:通过占用测度和LMI松弛的非线性最优控制。SIAM J.控制优化。47(4), 1643–1666 (2008) ·Zbl 1188.90193号 ·doi:10.1137/070685051
[17] Lions,P.L.:关于Hamilton-Jacobi-Bellman方程。《应用学报》。数学。1, 17–41 (1983) ·Zbl 0594.93069号 ·doi:10.1007/BF02433840
[18] Llavona,J.G.:《连续可微函数的逼近》,《数学研究》,第130卷。北荷兰,阿姆斯特丹(1986)·Zbl 0642.41001号
[19] Stockbridge,R.H.:鞅问题的时间平均控制。平稳解的存在性。安·普罗巴伯。18, 190–205 (1990) ·Zbl 0699.49018号 ·doi:10.1214/aop/1176990944
[20] Yin,G.G.,Zhang,Q.:连续时间马尔可夫链及其应用。奇异摄动方法。施普林格,纽约(1997)·Zbl 0896.60039号
[21] Yong,J.,Zhou,X.Y.:随机控制(哈密顿系统和HJB方程)。柏林施普林格(1999)·Zbl 0943.93002号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。