×

部分观测平均场随机系统马尔可夫链递进最优控制的一般最大值原理。 (英语) Zbl 1521.93202号

摘要:本文研究了具有马尔可夫链递进结构的部分观测平均场型随机控制系统的最优控制问题。允许控制变量进入状态过程的扩散项和观测过程的漂移项。控制域不必是凸的。在我们的模型中,成本函数和观测值也是平均场类型。通过一种特殊的尖峰变化,得到了相关的随机最大值原理。递进结构中的随机最大值原理与经典情况有本质区别。

MSC公司:

93年20日 最优随机控制
49号30 信息不完整的问题(优化)
49N80型 平均场游戏和控制
第93页第41页 信息不完整的控制/观测系统
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] B.Acciaio、J.Backhoff-Veraguas和R.Carmona,《扩展平均场控制问题:随机最大值原理和输运观点》。SIAM J.控制优化。57 (2019) 3666-3693. ·兹比尔1426.93364 ·doi:10.137/18M1196479
[2] D.Andersson和B.Djehiche,平均场类型SDE的最大值原理。申请。数学。最佳方案。63 (2011) 341-356. ·Zbl 1215.49034号
[3] A.Bensoussan,部分观测扩散最优控制的最大值原理和动态规划方法。《随机学》9(1983)169-222·Zbl 0516.60072号 ·doi:10.1080/1744250830833253
[4] J.Bismut,最优随机控制中对偶性的介绍方法。SIAM修订版20(1978)62-78·Zbl 0378.93049号 ·数字对象标识代码:10.1137/1020004
[5] R.Buckdahn、B.Djehiche和J.Li,平均场型SDE的一般随机最大值原理。申请。数学。最佳方案。64 (2011) 197-216. ·Zbl 1245.49036号
[6] 陈涛(T.Chen)和吴振华(Z.Wu),渐进结构中具有随机跳跃的部分观测平均场随机系统的一般最大值原理。数学。控制关系。字段13(2023)664-694·Zbl 1518.93153号 ·doi:10.3934/mcrf.2022012年
[7] 陈振东,宋义松,吴振中,递进结构中马尔可夫链随机控制问题的最大值原理。系统。控制信函。166 (2022) 105303. ·Zbl 1498.93773号 ·doi:10.1016/j.sysconle.2022.105303
[8] C.Donnelly,区域切换扩散模型中的充分随机最大值原理。申请。数学。最佳方案。64 (2011) 155-169. ·Zbl 1245.49037号 ·doi:10.1007/s00245-010-9130-9
[9] R.J.Elliott、T.K.Siu和A.Badescu,关于具有反馈效应的区域转换模型中的定价和对冲期权。《经济学杂志》。动态。控制35(2011)694-713·Zbl 1209.91156号 ·doi:10.1016/j.jedc.2010.12.014
[10] U.G.Haussmann,部分信息扩散最优控制的最大值原理。SIAM J.控制优化。25 (1987) 341-361. ·Zbl 0617.93077号 ·doi:10.1137/0325021
[11] 何顺生,王建中,严建中,《半鞅理论与随机演算》。劳特利奇(2019)·兹比尔0781.60002
[12] M.Hu,递归效用优化的随机全局最大值原理。可能性。不确定。数量。风险2(2017)1-20·Zbl 1432.93380号 ·doi:10.1186/s41546-017-0014-7
[13] 黄建华,李晓霞,杨建勇,无限时域平均场随机微分方程的线性二次型最优控制问题。数学。控制关系。字段5(2015)97-139·Zbl 1326.49051号 ·doi:10.3934/mrf.2015年5月97日
[14] M.Huang、R.P.Malhamé和P.E.Caines,大种群随机动态博弈:闭环McKean-Vlasov系统和Nash确定性等价原理。Commun公司。信息系统。6 (2006) 221-252. ·Zbl 1136.91349号 ·doi:10.4310/CIS.2006.v6.n3.a5
[15] J.M.Lasry和P.L.Lions,平均场比赛。日本。数学杂志。2 (2007) 229-260. ·Zbl 1156.91321号 ·doi:10.1007/s11537-007-0657-8
[16] R.Li和F.Fu,平均场FBSDE部分观测最优控制问题的最大值原理。《国际期刊控制》92(2019)2463-2472·Zbl 1423.93418号 ·doi:10.1080/00207179.2018.1441555
[17] X.Li,J.Sun和J.Yong,Mean-field随机线性二次型最优控制问题:闭环可解性。可能性。不确定。数量。风险1(2016)1-24·Zbl 1433.49050号 ·doi:10.1186/s41546-016-0001-4
[18] X.Li和S.Tang,部分可观测最优随机控制的一般必要条件。J.应用。可能性。32 (1995) 1118-1137. ·Zbl 0844.93076号 ·doi:10.2307/3215225
[19] T.Meyer-Brandis、B.Øksendal和X.Y.Zhou,通过Malliavin演算的平均场随机最大值原理。《随机学》84(2012)643-666·Zbl 1252.49039号 ·doi:10.1080/174425082011.651619
[20] S.Peng,最优控制问题的一般随机最大值原理。SIAM J.控制优化。28 (1990) 966-979. ·Zbl 0712.93067号
[21] 沈义勇,孟庆庆,石培生,平均场跳跃扩散随机时滞微分方程的最大值原理及其在金融中的应用。Automatica 50(2014)1565-1579·Zbl 1296.93205号
[22] 沈永康(Y.Shen)和萧天凯(T.K.Siu),跳跃-扩散平均场模型的最大值原理及其在均值-方差问题中的应用。非线性分析-理论方法应用。86 (2013) 58-73. ·兹伯利1279.49015 ·doi:10.1016/j.na.2013.02.029
[23] 宋彦,汤三生,吴振华,随机跳跃递进最优随机控制问题的最大值原理。SIAM J.控制优化。58 (2020) 2171-2187. ·Zbl 1447.93378号 ·doi:10.1137/19M1292308
[24] 宋毅和吴振华,马尔可夫切换递进最优随机控制问题的一般最大值原理。ESAIM-控制优化。计算变量28(2022)61·Zbl 1503.93051号 ·doi:10.1051/cocv/2022054
[25] 孙建华,王浩,吴振华,Mean-field线性二次随机微分对策。J.差异。埃克。296 (2021) 299-334. ·Zbl 1479.91032号 ·doi:10.1016/j.jde.2021.06.004
[26] Z.Sun和O.Menoukeu-Pamen,马尔可夫寄存器切换跳跃扩散系统部分可观测风险敏感最优控制的最大值原理。斯托克。分析。申请。36 (2018) 782-811. ·Zbl 1407.93434号 ·doi:10.1080/07362994.2018.1465824
[27] 唐三生,李晓霞,随机跳跃随机系统最优控制的必要条件。SIAM J.控制优化。32 (1994) 1447-1475. ·Zbl 0922.49021号 ·doi:10.137/S03630129922233858
[28] 陶仁浩,吴振中,前向-后向区域切换系统最优控制问题的最大值原理及其应用。系统。控制信函。61 (2012) 911-917. ·Zbl 1271.49018号 ·doi:10.1016/j.sysconle.2012.06.06
[29] B.C.Wang,H.Zhang和J.F.Zhang.,平均场线性二次控制:一致稳定和社会最优。自动化121(2020)109088·兹比尔1448.91028 ·doi:10.1016/j.automatica.2020.109088
[30] G.Wang和Z.Wu,部分信息下随机递归最优控制问题的最大值原理。IEEE传输。自动。控制54(2009)1230-1242·Zbl 1367.93725号 ·doi:10.1109/TAC.2009.2019794年
[31] 吴志伟,前向随机控制系统部分可观测最优控制的最大值原理。科学。中国国际科学院。53 (2010) 2205-2214. ·兹比尔1227.93116 ·doi:10.1007/s11432-010-4094-6
[32] 吴志伟,前向-后向随机系统最优控制的一般最大值原理。Automatica 49(2013)1473-1480·Zbl 1321.49041号 ·doi:10.1016/j.automatica.2013.02.005
[33] J.Yong,平均场随机微分方程的线性二次最优控制问题。SIAM J.控制优化。51 (2013) 2809-2838. ·Zbl 1275.49060号
[34] 问:张,股票交易:一个最优销售规则。SIAM J.控制优化。40 (2001) 64-87. ·Zbl 0990.91014号 ·doi:10.1137/S0363012999356325
[35] X.Zhang,Z.Sun和J.Xiong,平均场型马尔可夫状态切换跳跃扩散模型的一般随机最大值原理。SIAM J.控制优化。56 (2018) 2563-2592. ·Zbl 1391.93302号
[36] 周晓勇,关于随机偏微分方程最优控制的必要条件。SIAM J.控制优化。31 (1993) 1462-1478. ·Zbl 0795.93104号 ·数字对象标识代码:10.1137/0331068
[37] 周晓云和尹国荣,马科维茨的带制度转换的均值-方差投资组合选择:一个连续时间模型。SIAM J.控制优化。42 (2003) 1466-1482. ·Zbl 1175.91169号 ·doi:10.1137/S0363012902405583
[38] 周勤,任毅,吴伟,关于部分信息下带跳的平均场前向随机系统的最优平均场控制问题。J.系统。科学。复杂。30 (2017) 828-856. ·Zbl 1381.93106号 ·doi:10.1007/s11424-016-5237-7
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。