×

具有跳跃的全耦合前向-后向随机系统最优控制问题的一个充分条件:状态约束控制方法。 (英语) Zbl 1531.93450号

摘要:我们研究了具有跳跃扩散的全耦合前向随机微分方程(FBSDE)的随机最优控制问题。此类问题的一个主要技术挑战来自(正向)扩散项对反向SDE的依赖性以及跳跃扩散的存在。以前,这类问题只通过随机最大值原理来解决,该原理只保证了最优性的必要条件,并且需要识别相应变分不等式中的未知参数。本文提供了另一种方法,它构成了最优性的充分条件。具体来说,最初的全耦合FBSDE控制问题(称为(P(P)))被转换为终端状态约束的正向随机控制问题(称为\(({mathbf{P}}^{prime})),其中包括额外的(可能是无界的)控制变量。然后通过后向可达性分析求解(({\mathbf{P}}^{prime}),通过后向可及性分析将({\mathbf{P}}^{prime{)的值函数表示为辅助无约束(正向)控制问题的值函数的零级集(称为({\methbf{P}}^{prime}))。与(({mathbf{P}}^{prime})不同,(({mathbf}P}}^{prime))是一个无约束问题,由于鞅表示定理,它包含了额外的控制变量。我们证明了({mathbf{P}}^{prime\prime})的值函数是相关积分型Hamilton-Jacobi-Bellman(HJB)方程的唯一粘性解。由于哈密顿最大化中的附加控制变量以及(奇异)Lévy测度中非局部积分算子的存在,本文提出的粘性解分析需要一种新的技术。解决原始问题(P(P)),我们改变了做法。具体来说,我们首先使用验证定理和HJB方程的粘性解求解\({\mathbf{P}}^{\prime\prime})\,以获得值函数。然后通过刻划(({mathbf{P}}^{prime})的值函数的零级集来求解(({mathbf}P}}^{prime)}),从中可以得到(P(P))可以构造。为了说明本文的理论结果,还介绍了在带跳跃的全耦合FBSDE线性二次问题中的应用。
©2022 John Wiley&Sons有限公司。

MSC公司:

93年20日 最优随机控制
60华氏30 随机分析的应用(PDE等)
45K05型 积分-部分微分方程
49升12 最优控制和微分对策中的Hamilton-Jacobi方程
49升25 最优控制和微分对策中Hamilton-Jacobi方程的粘性解
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 彭斯,WZ。全耦合正倒向随机微分方程及其在最优控制中的应用。SIAM J控制优化。1999;37(3):825‐843. ·Zbl 0931.60048号
[2] 李杰(LiJ)、魏强(WeiQ)。带跳跃的全耦合FBSDE的L^p估计。堆垛工艺应用。2014;124:1582‐1611. ·Zbl 1296.60153号
[3] 永嘉。具有随机系数的线性正倒向随机微分方程。概率论相关领域。2006;135:53‐83. ·Zbl 1120.60058号
[4] 李杰(LiJ)、魏强(WeiQ)。带跳跃的完全耦合FBSDE的随机微分对策。应用数学优化。2015;71:411‐448. ·Zbl 1328.49037号
[5] WuZ公司。具有布朗运动和泊松过程的正倒向随机微分方程。数学应用学报。1999;15:433‐443. ·Zbl 1009.60050号
[6] 德拉鲁埃夫。非退化情形下FBSDE解的存在唯一性。堆垛工艺应用。2002;99:209‐286. ·Zbl 1058.60042号
[7] WuZ公司。完全耦合FBSDE与布朗运动和泊松过程的停止时间。澳大利亚数学学会期刊,2003年;第74:249‐266页·Zbl 1029.60047号
[8] 阿普勒巴姆D。莱维过程与随机微积分。第二版,剑桥大学出版社;2009. ·Zbl 1200.60001号
[9] ØksendalB,SulemA。跳跃扩散的应用随机控制。第二版Springer;2006
[10] FujiwaraT、KunitaH。微分同态群中跳跃型和Lévy过程的随机微分方程。京都数学杂志。1985;25(1):71‐106. ·Zbl 0575.60065号
[11] BuckdahnR、HuY、LiJ。Isaacs型积分-偏微分方程解的随机表示。堆垛工艺应用。2011;121:2715‐2750. ·Zbl 1243.91011号
[12] 铋JM。最优随机控制中对偶性的介绍方法。SIAM修订版1978;20(1):62‐78. ·Zbl 0378.93049号
[13] 铋JM。随机系数线性二次最优静态控制。SIAM J控制优化。1976;14(3):419‐444. ·Zbl 0331.93086号
[14] 张杰。倒向随机微分方程:从线性到完全非线性理论。施普林格;2017. ·Zbl 1390.60004号
[15] MaJ,YongJ。正倒向随机微分方程及其应用。Springer‐Verlag;1999. ·Zbl 0927.60004号
[16] El‐KarouiN、PengS、QueezMC。金融学中的倒向随机微分方程。数学金融。1997;7(1):1‐71. ·兹比尔0884.90035
[17] PardouxE,拉斯卡努A。随机微分方程,反向SDE,偏微分方程。施普林格;2014. ·Zbl 1321.60005号
[18] YongJ,周XY。随机控制:哈密顿系统和HJB方程。施普林格;1999. ·Zbl 0943.93002号
[19] 王S、小H。大种群正向随机控制问题中的个体和群体行为:集中和
[(纳什\]\)平衡溶液。光电控制应用方法。2021;42:1269‐1292. ·Zbl 1472.93202号
[20] 月亮J。随机微分时滞方程风险敏感最优控制与微分对策的充要条件。国际J鲁棒非线性控制。2019;29:4812‐4827. ·Zbl 1426.93117号
[21] 月亮J。平均场型随机最优控制的风险敏感最大值原理
[(马尔可夫\]\)体制转换跳跃扩散系统。国际J鲁棒非线性控制。2021;31:2141‐2167. ·Zbl 1526.93280号
[22] CaraballT,MchiriL.η无限时滞混合中立型随机微分方程的稳定性。国际J鲁棒非线性控制。2021;32:1973‐1989.
[23] 月亮J。广义风险敏感最优控制和Hamilton‐Jacobi‐Bellman方程。IEEE Trans Automat控制。2021;66(5):2319‐2325. ·Zbl 07352156号
[24] 德拉鲁埃夫·卡莫纳。平均场博弈的概率分析。SIAM J控制优化。2013;51(4):2705‐2734. ·Zbl 1275.93065号
[25] 德拉鲁埃·卡莫纳。平均场对策的概率理论及其应用I.Springer;2018. ·Zbl 1422.91014号
[26] 穆恩杰,巴什阿尔特。基于随机最大值原理的风险敏感平均场博弈。Dyn游戏应用程序。2019;9:1100‐1125. ·兹比尔1431.91027
[27] 张杰。健康的
[(FBSDE公司\]\). Disc Contin Dyn Syst Ser B.2006年;6(4):927‐940. ·Zbl 1132.60315号
[28] MaJ、WuZ、Zhang D、ZhangJ。前向-后向SDEs的适定性——一种统一方法。Ann Appl概率。2015;25(4):2168‐2214. ·Zbl 1319.60132号
[29] WuS、ShuL。利用后向分离方法求解部分可观测线性二次时滞控制问题。光电控制应用方法。2017;38:814‐828. ·Zbl 1373.93387号
[30] GuerdouhD、KhelfallahN、MezerdiB。关于由Teugels鞅驱动的耦合前向随机微分方程的适定性。数学方法应用科学。2020;43:10296‐10318. ·Zbl 1456.60146号
[31] WuZ公司。正倒向随机微分方程、线性二次型随机最优控制和非零和微分对策。系统科学综合杂志。2005;18(2):179‐192. ·Zbl 1156.93409号
[32] ShiJT、WuZ。一类具有随机跳跃的完全耦合线性二次型随机控制问题。自动犯罪学报。2009年;35(1):92‐97。
[33] YuZ LiN。具有随机跳跃的递归随机线性二次最优控制和非零和微分对策问题。高级差异Equ。2015;144:1‐19. ·Zbl 1422.60098号
[34] 月亮J。受控正向随机微分方程的风险敏感最大值原理。自动化。2020;120:1‐14. ·兹比尔1448.93349
[35] 黄赫、王X、胡特、徐莉。与lévy过程相关的正倒向随机控制系统的线性二次随机最优控制。数学问题英语2017;2541687:1‐11. ·Zbl 1426.93365号
[36] 月亮J。跳跃扩散系统的线性二次随机stackelberg微分对策。SIAM J控制优化。2021;59(2):954‐976. ·Zbl 1460.91028号
[37] 月亮J。随机跳跃扩散系统的线性二次平均场型Stackelberg微分对策。数学控件相关字段。2021;12(2):371‐404. ·Zbl 1484.91095号
[38] 永嘉。一个主从随机线性二次微分对策。SIAM J控制优化。2002;41(4):1015‐1041. ·Zbl 1039.93070号
[39] 明尼苏达州LiW。具有跳跃和相关最优控制问题的完全耦合平均场FBSDE。光电控制应用方法。2021;42:305‐329. ·Zbl 1469.93118号
[40] 王刚、肖赫。全耦合前向随机微分方程最优性的Arrow充分条件及其在金融中的应用。最优化理论应用杂志。2015;165:639‐656. ·Zbl 1312.93106号
[41] 永嘉。具有混合始端条件的受控前向-后向随机微分方程的最优性变分原理。SIAM J控制优化。2010;48(6):4119‐4156. ·Zbl 1202.93180号
[42] SongT、LiuB。平均场型全耦合受控正向随机差分系统的最大值原理。高级差异Equ。2020;188:1‐24. ·Zbl 1482.60081号
[43] 用递归效用进行优化的随机全局最大值原理。概率不确定数量风险。2017;2(1):1-20·Zbl 1432.93380号
[44] JiS和WeiQ。具有终端状态约束的全耦合前向-后向随机控制系统的最大值原理。数学分析应用杂志。2013;407:200‐210·Zbl 1306.49041号
[45] WuZ公司。前向-后向随机系统最优控制的一般最大值原理。自动化。2013;49(5):1473‐1480. ·Zbl 1321.49041号
[46] 哼,吉S,薛X。全耦合前向随机系统的全局随机最大值原理。SIAM J控制优化。2018;56(6):4309‐4335. ·Zbl 1403.93197号
[47] ShiJT公司。具有随机跳跃的前向-后向随机系统最优控制的必要条件。国际J Stoch分析。2012;258674:1‐50. ·Zbl 1239.93132号
[48] HafayedM、TabetM、BoukafS。具有跳跃的前向随机系统最优控制的平均场最大值原理及其在均值方差投资组合问题中的应用。2015年公共数学统计;3:163‐186. ·Zbl 1317.93270号
[49] 张华。前向-后向随机系统的混合最优控制。光电控制应用方法。2021;42:833‐847. ·Zbl 1478.93747号
[50] MaH、WangW。平均场正倒向随机微分方程部分可观测风险敏感最优控制问题的随机最大值原理。光电控制应用方法。2021;43:532‐553. ·Zbl 1531.93437号
[51] ØksendalB,SulemA。具有跳跃的前向-后向随机微分方程最优控制的最大值原理。SIAM J控制优化。2009年;48(5):2945‐2976. ·Zbl 1207.93115号
[52] ShiJT、WuZ。跳跃扩散随机最优控制问题的MP和DPP之间的关系。应用数学优化。2011;63:151‐189. ·Zbl 1216.49024号
[53] BarlesG、BuckdahnR、PardouxE。倒向随机微分方程和积分-偏微分方程。Stoch Stoch Rep.1997;60分57秒至83秒·Zbl 0878.60036号
[54] ImbertC BarlesG公司。二阶椭圆积分微分方程:粘度解的理论回顾。《亨利·庞加莱学院年鉴》(Annales de l’Institut Henri Poincare)(C)非线性。分析。2008;25(3):567‐585. ·Zbl 1155.45004号
[55] 奥尔斯代尔巴沙尔。动态非合作博弈论。第二版SIAM;1999. ·Zbl 0946.91001号
[56] 张飞、董毅、孟强。带有跳跃的倒向随机Riccati方程与带有跳跃和随机系数的随机线性二次型最优控制相关联。SIAM J控制优化。2020;58(1):393‐424. ·Zbl 1435.93181号
[57] 邓肯·蒙杰。具有随机系数的不确定线性二次随机最优控制的简单证明。IEEE Trans Automat控制。2020;65(12):5422‐5428. ·Zbl 07320114号
[58] 具有受控跳跃的跳跃扩散:存在性和数值方法。数学分析应用杂志。2000;249:179‐198. ·Zbl 0973.93059号
[59] CrandallMG、石井、狮狮。二阶偏微分方程粘度解的用户指南。1992年美国数学学会;27:1‐67. ·Zbl 0755.35015号
[60] 彭斯,朱欣。受控跳跃扩散过程的生存性。表演数学罪。2008;24(8):1351‐1368. ·Zbl 1156.60317号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。