文件Zbl 1505.93282-zbMATH Open

带切换的松弛控制问题的随机最大值原理。（英语） Zbl 1505.93282号

系统。控制Lett。 169，文章ID 105391，第11页（2022）.

摘要：我们研究了一个带有区域切换的随机松弛控制问题，其中控制同时进入漂移系数和扩散系数。目的是用凸变分方法建立该问题的随机最大值原理和验证定理。A类倒向随机微分方程将具有区域切换的（BSDE）作为伴随方程，其鞅项由布朗运动和马尔可夫链生成。还显式求解了松弛公式中的线性二次型示例。

MSC公司：

93E20型	最优随机控制
60华氏30	随机分析的应用（PDE等）
60J20型	马尔可夫链和离散时间马尔可夫过程在一般状态空间（社会流动、学习理论、工业过程等）上的应用

关键词：

随机最大值原理;马尔可夫链;放松控制

PDF格式 BibTeX公司 XML格式引用

全文： DOI程序

参考文献：

[1]	库什纳，H.J。；Schweppe，F.C.，《随机控制系统的最大值原理》，J.Math。分析。申请。，8, 287-302 (1964) ·Zbl 0126.33401号
[2]	Kushner，H.J.，连续参数随机优化问题的必要条件，SIAM J.控制优化。，10, 550-565 (1972) ·Zbl 0242.93063号
[3]	Haussmann，U.G.，随机系统最优控制的一般必要条件，（随机系统：建模、识别和优化，II（1976），Springer），30-48·Zbl 0369.93048号
[4]	Haussmann，U.G.，扩散最优控制的随机最大值原理，（Pitman Research Notes in Math Series，第151卷（1986），John Wiley&Son:John Wiley&Son，纽约）·Zbl 0616.93076号
[5]	Bensoussan，A.，随机控制讲座，（非线性滤波和随机控制（1982），施普林格：施普林格柏林，海德堡），1-62·Zbl 0505.93078号
[6]	Elliott，R.J.，《扩散的最佳控制》，应用。数学。最佳。，22, 229-240 (1990) ·Zbl 0718.49013号
[7]	Peng，S.，最优控制问题的一般随机最大值原理，SIAM J.control Optim。，28, 966-979 (1990) ·Zbl 0712.93067号
[8]	Becker，H.，《关于最优随机控制的存在性》，J.Math。机械。，18, 1151-1166 (1969) ·Zbl 0211.46303号
[9]	英国豪斯曼。；Lepeltier，J.P.，关于最优控制的存在性，SIAM J.Control Optim。，28, 851-902 (1990) ·Zbl 0712.49013号
[10]	Young，L.C.，《变分法和最优控制理论讲座》（1969年），W.B.Saunders:W.B.Sounders Philadelphia·Zbl 0177.37801号
[11]	Fleming，W.H.，最优随机控制中的广义解，Differ。游戏控制理论：III，30，147-165（1977）·Zbl 0367.93029号
[12]	El Karoui，N。；Nguyen，D。；Jeanblanc-Picqué，M.，《退化扩散控制中的紧致化方法：最优控制的存在性》，《随机》，20169-219（1987）·Zbl 0613.60051号
[13]	Bahlali，S.，放松和严格控制问题的必要和充分最优性条件，SIAM J.控制优化。，47, 2078-2095 (2008) ·Zbl 1167.49024号
[14]	Bahlali，S。；梅泽迪，B。；Djehiche，B.，松弛随机控制问题中的逼近和最优必要条件，J.Appl。数学。斯托克。分析。，2006, 1-23 (2006) ·Zbl 1119.49027号
[15]	Bahlali，K。；梅泽迪，M。；Mezerdi，B.，关于松弛平均场随机控制问题，Stoch。动态。，第18条，第1850024页（2018年）·Zbl 1391.93293号
[16]	艾哈迈德，联合国。；Charalambous，C.D.，部分观测系统的随机最小值原理，受连续和跳跃扩散过程影响，并由放松控制驱动，SIAM J.Control Optim。，51, 3235-3257 (2013) ·Zbl 1290.49034号
[17]	毛，X。；袁，C.，《带马尔可夫变换的随机微分方程》（2006），帝国理工大学出版社·邮编1126.60002
[18]	Crépey，S。；Matoussi，A.，带跳跃的反射和双重反射BSDE：先验估计和比较，Ann.Appl。概率。，18, 2041-2069 (2008) ·Zbl 1158.60021号
[19]	陶，R。；吴，Z。；Zhang，Q.，《带状态切换的BSDEs：弱收敛和应用》，J.Math。分析。申请。，407, 97-111 (2013) ·Zbl 1306.60080号
[20]	吕，S。；陶，R。；Wu，Z.，带状态切换的预期前向随机微分时滞系统最优控制的最大值原理，Optim。控制应用程序。方法，37154-175（2016）·Zbl 1333.93261号
[21]	陶，R。；Wu，Z.，前向-反向区域切换系统最优控制问题的最大值原理及其应用，系统控制快报。，61, 911-917 (2012) ·Zbl 1271.49018号
[22]	Cardaliaguet，P.，《关于平均场比赛的笔记》（摘自P.L.Lions在法国大学的演讲笔记（2012））
[23]	卡莫纳，R。；Delarue，F.，前向随机微分方程和受控Mckean-Vlasov动力学，Ann.Appl。概率。，43, 2647-2700 (2015) ·Zbl 1322.93103号
[24]	卡莫纳，R。；Delarue，F.，Mean-Field博弈的概率理论及其应用（2018），Springer·Zbl 1422.91014号
[25]	阿西亚奥，B。；Backhof-Veraguas，J。；Carmona，R.，《扩展平均场控制问题：随机最大值原理和传输观点》，SIAM J.控制优化。，57, 3666-3693 (2019) ·Zbl 1426.93364号
[26]	Buckdahn，R。；李，J。；彭，S。；Rainer，C.，Mean-field随机微分方程及相关偏微分方程，Ann.Probab。，45, 824-878 (2017) ·Zbl 1402.60070号
[27]	聂，T。；Yan，K.，部分观测的扩展平均场控制问题，ESAIM控制优化。计算变量，28，1-43（2022）·Zbl 1485.93638号
[28]	Protter，P.E.，《随机积分与微分方程》（2005），Springer
[29]	Yong，J。；Zhou，X.，《随机控制：哈密顿系统和HJB方程》，第43卷（1999），Springer科学与商业媒体·Zbl 0943.93002号

此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配，可能包含数据转换错误。在某些情况下，zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献，而不要求完整或完全匹配。

任何	在任何地方
一个	内部文档标识符
澳大利亚	作者、编辑
人工智能	内部作者标识符
钛	标题
洛杉矶	语言
所以	来源
ab公司	回顾，摘要
第页	出版年份
车辆	评审员
复写的副本	MSC代码
美国犹他州	关键字
日期	文档类型(j个：期刊文章；b条：book；一：书籍文章）

一&b条	逻辑和
一\|b条	逻辑或
!ab公司	逻辑不
美国广播公司*	右通配符
"ab c公司"	短语
(ab c公司)	圆括号

示例

领域

操作员

带切换的松弛控制问题的随机最大值原理。（英语） Zbl 1505.93282号

MSC公司：

关键词：

参考文献：

示例

领域

操作员

带切换的松弛控制问题的随机最大值原理。 （英语） Zbl 1505.93282号

MSC公司：

关键词：

参考文献：

带切换的松弛控制问题的随机最大值原理。（英语） Zbl 1505.93282号