×

马尔可夫区域切换系统平均场随机线性二次型最优控制问题的开放可解性。 (英语) Zbl 1513.49078号

摘要:本文研究马尔可夫状态切换系统(简称M-MF-SLQ)的平均场随机线性二次型最优控制问题。利用算子技术导出了M-MF-SLQ的成本泛函表示。证明了代价泛函的凸性对于M-MF-SLQ问题的有限性是必要的,而代价泛函一致凸性对于问题的开环可解性是充分的。通过考虑一类一致凸代价泛函,给出了问题有限性的一个刻画,并构造了一个收敛性等价于问题开环可解性的极小化序列。我们通过几个例子证明,我们的结果可以用于解决一些财务问题,例如均值-方差投资组合选择问题。

MSC公司:

49甲10 线性二次型最优控制问题
49号35 最优反馈综合
93E20型 最优随机控制
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] D.安德森;B.Djehiche,平均场类型SDE的最大值原理,应用数学与优化,63,341-356(2011)·Zbl 1215.49034号 ·doi:10.1007/s00245-010-9123-8
[2] J.-M.Bismut,随机系数线性二次最优随机控制,SIAM控制与优化杂志, 14 (1976), 419-444. ·Zbl 0331.93086号
[3] R.巴克达恩;B.Djehiche;J.Li,平均场类型SDE的一般随机最大值原理,应用数学与优化,64,197-216(2011)·Zbl 1245.49036号 ·doi:10.1007/s00245-011-9136-y
[4] R.Buckdahn;B.Djehiche;J.Li;S.Peng,Mean-field倒向随机微分方程:极限方法,《概率年鉴》,371524-1565(2009)·Zbl 1176.60042号 ·doi:10.1214/08-AOP442
[5] X.Cui,X.Li和D.Li,最优多周期均值-方差投资组合选择的平均场公式统一框架,IEEE自动控制汇刊, 59 (2014), 1833-1844. ·Zbl 1360.91133号
[6] C.Donnelly,区域切换扩散模型中的充分随机最大值原理,应用数学与优化,64,155-169(2011)·Zbl 1245.49037号 ·doi:10.1007/s00245-010-9130-9
[7] C.Donnelly和A.J.Heunis,带投资组合约束的体制转换模型中的二次风险最小化,SIAM控制与优化杂志, 50 (2012), 2431-2461. ·Zbl 1252.93132号
[8] R.J.Elliott、L.Aggoun和J.B.Moore,隐马尔可夫模型:估计与控制,数学应用纽约:Springer-Verlag出版社,1995年·Zbl 0819.60045号
[9] R.Elliott;十、李;Y.-H.Ni,离散时间平均场随机线性二次最优控制问题,Automatica,49,3222-3233(2013)·Zbl 1358.93189号 ·doi:10.1016/j.automatica.2013.08.017
[10] 黄光裕;十、李;J.Yong,无限域中平均场随机微分方程的线性二次最优控制问题,数学控制与相关领域,5,97-139(2015)·Zbl 1326.49051号 ·doi:10.3934/mcrf.2015.5.97
[11] M.Kac,动力学理论基础,第三届伯克利数理统计与概率研讨会论文集,3171-197(1956)·Zbl 0072.42802号
[12] H.Kushner,最优随机控制,IRE自动控制事务, 7 (1962), 120-122.
[13] 十、李;X.Y.Zhou,有限时间范围内具有马尔可夫跳的不确定随机LQ控制,信息与系统通信,2265-282(2002)·兹比尔1119.93418 ·doi:10.4310/CIS.2002.v2.n3.a4
[14] X.Li,J.Sun,J.Yong,Mean-field随机线性二次型最优控制问题:闭环可解性,概率、不确定性和定量风险,1(2016),第2号论文,24页·Zbl 1433.49050号
[15] 十、李;X.Y.Zhou;M.Ait Rami,无限时间范围内具有马尔可夫跳跃的不确定随机线性二次控制,《全局优化杂志》,27149-175(2003)·Zbl 1031.93155号 ·doi:10.1023/A:1024887007165
[16] 十、李;X.Y.Zhou,连续时间均值-方差效率:80·Zbl 1132.91472号 ·doi:10.1214/105051606000000349
[17] 刘毅(Y.Liu);G.阴;周晓勇,具有不确定控制权成本的随机切换LQ问题的近最优控制,Automatica,411063-1070(2005)·Zbl 1091.93019号 ·doi:10.1016/j.automatica.2005.01.002
[18] R.Penrose,矩阵的广义逆,剑桥哲学学会数学学报,51,406-413(1955)·Zbl 0065.24603号 ·doi:10.1017/S0305004100030401
[19] J.Sun;J.Yong,线性二次随机微分对策:开环和闭环鞍点,SIAM控制与优化杂志,524082-4121(2014)·Zbl 1307.93466号 ·doi:10.1137/140953642
[20] J.Sun,X.Li和J.Yong,随机线性二次型最优控制问题的开环和闭环可解性,SIAM控制与优化杂志, 54 (2016), 2274-2308. ·Zbl 1347.49033号
[21] J.Sun,平均场随机线性二次最优控制问题:开环可解性,ESAIM:控制、优化和变分微积分,23909-1127(2017)·Zbl 1393.49024号 ·doi:10.1051/cocv/2016023
[22] R.Tao;Z.Wu,前向-反向寄存器切换系统最优控制问题的最大值原理及其应用,《系统与控制快报》,61911-917(2012)·Zbl 1271.49018号 ·doi:10.1016/j.sysconle.2012.06.06
[23] W.M.Wonham,关于随机控制的矩阵Riccati方程,SIAM控制杂志, 6 (1968), 681-697. ·Zbl 0182.20803号
[24] 吴宗宪;X.-R.Wang,基于泊松过程的FBSDE及其在随机跳跃线性二次型随机最优控制问题中的应用,自动化学报,29821-826(2003)·Zbl 1498.93793号
[25] G.G.Yin和Q.Zhang,连续时间马尔可夫链及其应用:一种双时间尺度方法第2版,施普林格,纽约,2013年·Zbl 1277.60127号
[26] K.-F.C.Yiu;J.Liu;T.K.Siu;W.-K.Ching,《具有制度转换和价值-风险约束的最优投资组合》,Automatica,46,979-989(2010)·Zbl 1189.911199号 ·doi:10.1016/j.automatica.2010.02.027
[27] J.Yong和X.Y.Zhou,随机控制:哈密顿系统和HJB方程纽约施普林格出版社,1999年·Zbl 0943.93002号
[28] J.Yong,平均场随机微分方程的线性二次最优控制问题,SIAM控制与优化杂志,51,2809-2838(2013)·Zbl 1275.49060号 ·数字对象标识代码:10.1137/120892477
[29] 于志明,无限时域跳跃-扩散前向随机微分方程及其在后向线性二次型问题中的应用,ESAIM:控制、优化和变分计算, 23 (2017), 1331-1359. ·Zbl 1306.90153号
[30] X.Zhang、R.J.Elliott、T.K.Siu和J.Guo,使用附加马尔可夫跳跃资产的马尔可夫区域切换市场完成,IMA管理数学杂志, 23 (2012), 283-305. ·Zbl 1280.91078号
[31] X.Zhang和X.Li,马尔可夫切换系统随机线性二次型最优控制问题的开环和闭环可解性,arXiv:1809.018912018。
[32] X.Zhang,Z.Sun和J.Xiong,平均场型马尔可夫状态切换跳跃扩散模型的一般随机极大值原理,SIAM控制与优化杂志, 56 (2018), 2563-2592. ·Zbl 1391.93302号
[33] X.Y.Zhou;G.Yin,Markowitz的带制度转换的均值-方差投资组合选择:一个连续时间模型,SIAM控制与优化杂志,421466-1482(2003)·Zbl 1175.91169号 ·doi:10.1137/S0363012902405583
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。