×

带切换的松弛控制问题的随机最大值原理。 (英语) Zbl 1505.93282号

摘要:我们研究了一个带有区域切换的随机松弛控制问题,其中控制同时进入漂移系数和扩散系数。目的是用凸变分方法建立该问题的随机最大值原理和验证定理。A类倒向随机微分方程将具有区域切换的(BSDE)作为伴随方程,其鞅项由布朗运动和马尔可夫链生成。还显式求解了松弛公式中的线性二次型示例。

MSC公司:

93E20型 最优随机控制
60华氏30 随机分析的应用(PDE等)
60J20型 马尔可夫链和离散时间马尔可夫过程在一般状态空间(社会流动、学习理论、工业过程等)上的应用
PDF格式BibTeX公司 XML格式引用
全文: DOI程序

参考文献:

[1] 库什纳,H.J。;Schweppe,F.C.,《随机控制系统的最大值原理》,J.Math。分析。申请。,8, 287-302 (1964) ·Zbl 0126.33401号
[2] Kushner,H.J.,连续参数随机优化问题的必要条件,SIAM J.控制优化。,10, 550-565 (1972) ·Zbl 0242.93063号
[3] Haussmann,U.G.,随机系统最优控制的一般必要条件,(随机系统:建模、识别和优化,II(1976),Springer),30-48·Zbl 0369.93048号
[4] Haussmann,U.G.,扩散最优控制的随机最大值原理,(Pitman Research Notes in Math Series,第151卷(1986),John Wiley&Son:John Wiley&Son,纽约)·Zbl 0616.93076号
[5] Bensoussan,A.,随机控制讲座,(非线性滤波和随机控制(1982),施普林格:施普林格柏林,海德堡),1-62·Zbl 0505.93078号
[6] Elliott,R.J.,《扩散的最佳控制》,应用。数学。最佳。,22, 229-240 (1990) ·Zbl 0718.49013号
[7] Peng,S.,最优控制问题的一般随机最大值原理,SIAM J.control Optim。,28, 966-979 (1990) ·Zbl 0712.93067号
[8] Becker,H.,《关于最优随机控制的存在性》,J.Math。机械。,18, 1151-1166 (1969) ·Zbl 0211.46303号
[9] 英国豪斯曼。;Lepeltier,J.P.,关于最优控制的存在性,SIAM J.Control Optim。,28, 851-902 (1990) ·Zbl 0712.49013号
[10] Young,L.C.,《变分法和最优控制理论讲座》(1969年),W.B.Saunders:W.B.Sounders Philadelphia·Zbl 0177.37801号
[11] Fleming,W.H.,最优随机控制中的广义解,Differ。游戏控制理论:III,30,147-165(1977)·Zbl 0367.93029号
[12] El Karoui,N。;Nguyen,D。;Jeanblanc-Picqué,M.,《退化扩散控制中的紧致化方法:最优控制的存在性》,《随机》,20169-219(1987)·Zbl 0613.60051号
[13] Bahlali,S.,放松和严格控制问题的必要和充分最优性条件,SIAM J.控制优化。,47, 2078-2095 (2008) ·Zbl 1167.49024号
[14] Bahlali,S。;梅泽迪,B。;Djehiche,B.,松弛随机控制问题中的逼近和最优必要条件,J.Appl。数学。斯托克。分析。,2006, 1-23 (2006) ·Zbl 1119.49027号
[15] Bahlali,K。;梅泽迪,M。;Mezerdi,B.,关于松弛平均场随机控制问题,Stoch。动态。,第18条,第1850024页(2018年)·Zbl 1391.93293号
[16] 艾哈迈德,联合国。;Charalambous,C.D.,部分观测系统的随机最小值原理,受连续和跳跃扩散过程影响,并由放松控制驱动,SIAM J.Control Optim。,51, 3235-3257 (2013) ·Zbl 1290.49034号
[17] 毛,X。;袁,C.,《带马尔可夫变换的随机微分方程》(2006),帝国理工大学出版社·邮编1126.60002
[18] Crépey,S。;Matoussi,A.,带跳跃的反射和双重反射BSDE:先验估计和比较,Ann.Appl。概率。,18, 2041-2069 (2008) ·Zbl 1158.60021号
[19] 陶,R。;吴,Z。;Zhang,Q.,《带状态切换的BSDEs:弱收敛和应用》,J.Math。分析。申请。,407, 97-111 (2013) ·Zbl 1306.60080号
[20] 吕,S。;陶,R。;Wu,Z.,带状态切换的预期前向随机微分时滞系统最优控制的最大值原理,Optim。控制应用程序。方法,37154-175(2016)·Zbl 1333.93261号
[21] 陶,R。;Wu,Z.,前向-反向区域切换系统最优控制问题的最大值原理及其应用,系统控制快报。,61, 911-917 (2012) ·Zbl 1271.49018号
[22] Cardaliaguet,P.,《关于平均场比赛的笔记》(摘自P.L.Lions在法国大学的演讲笔记(2012))
[23] 卡莫纳,R。;Delarue,F.,前向随机微分方程和受控Mckean-Vlasov动力学,Ann.Appl。概率。,43, 2647-2700 (2015) ·Zbl 1322.93103号
[24] 卡莫纳,R。;Delarue,F.,Mean-Field博弈的概率理论及其应用(2018),Springer·Zbl 1422.91014号
[25] 阿西亚奥,B。;Backhof-Veraguas,J。;Carmona,R.,《扩展平均场控制问题:随机最大值原理和传输观点》,SIAM J.控制优化。,57, 3666-3693 (2019) ·Zbl 1426.93364号
[26] Buckdahn,R。;李,J。;彭,S。;Rainer,C.,Mean-field随机微分方程及相关偏微分方程,Ann.Probab。,45, 824-878 (2017) ·Zbl 1402.60070号
[27] 聂,T。;Yan,K.,部分观测的扩展平均场控制问题,ESAIM控制优化。计算变量,28,1-43(2022)·Zbl 1485.93638号
[28] Protter,P.E.,《随机积分与微分方程》(2005),Springer
[29] Yong,J。;Zhou,X.,《随机控制:哈密顿系统和HJB方程》,第43卷(1999),Springer科学与商业媒体·Zbl 0943.93002号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。