×

离散时间随机最优控制问题和随机对策的最大值原理。 (英语) Zbl 1485.93641号

摘要:本文首先研究了一类具有凸控制域的离散时间随机最优控制问题,导出了其Pontryagin最大值原理形式的必要条件和最优性的充分条件。然后将结果推广到两类离散时间随机对策。研究了两个示例,给出了显式优化策略。本文简明扼要地建立了离散时间随机最大值原理的严格形式,为进一步研究相关课题铺平了道路。

MSC公司:

93E20型 最优随机控制
93C55美元 离散时间控制/观测系统
91A15型 随机对策,随机微分对策
91克99 精算科学和数学金融
PDF格式BibTeX公司 XML格式引用
全文: DOI程序

参考文献:

[1] T.T.K.安;B.Øksendal,部分信息随机微分对策的最大值原理,J.Optim。理论应用。,139, 463-483 (2008) ·Zbl 1159.91321号 ·doi:10.1007/s10957-008-9398-y
[2] A.贝吉;D.D’Alessandro,带控制相关噪声和广义Riccati差分方程的离散时间最优控制,Automatica,341031-1034(1998)·Zbl 0944.93032号 ·doi:10.1016/S0005-1098(98)00044-2
[3] L.Chen;于志勇,时滞非零和随机微分对策的最大值原理,IEEE Trans。自动化。控制,60,1422-1426(2015)·Zbl 1360.91020号 ·doi:10.1109/TAC.2014.2352731
[4] S.N.Cohen;R.J.Elliott,有限状态倒向随机差分方程的一般理论,Stoch。程序。申请。,120, 442-466 (2010) ·Zbl 1205.60111号 ·doi:10.1016/j.spa.2010.01.004
[5] S.N.Cohen;R.J.Elliott,倒向随机差分方程和几乎时间一致的非线性期望,SIAM J.控制优化。,49125-139(2011年)·Zbl 1225.60092号 ·数字对象标识代码:10.1137/090763688
[6] O.L.V.科斯塔;A.de Oliveira,带马尔可夫跳跃和乘性噪声的离散线性系统的最优均值-方差控制,Automatica,48,304-315(2012)·Zbl 1260.93173号 ·doi:10.1016/j.自动2011.11.009
[7] 杜克强;孟庆霞,随机发展方程最优控制的最大值原理,SIAM J.控制优化。,51, 4343-4362 (2013) ·Zbl 1285.49018号 ·数字对象标识代码:10.1137/120882433
[8] R.J.Elliott;十、李;Y.H.Ni,离散时间平均场随机线性二次最优控制问题,Automatica,49,3222-3233(2013)·兹比尔1358.93189 ·doi:10.1016/j.automatica.2013.08.017
[9] H.Halkin,非线性差分方程描述系统的pontryagin型最大值原理,SIAM J.控制优化。,1990年至111年(1966年)·Zbl 0152.09301号 ·数字对象标识代码:10.1137/0304009
[10] Y.C.Han;S.G.Peng;吴志伟,具有应用的后向双随机控制系统的最大值原理,SIAM J.控制优化。,48, 4224-4241 (2010) ·Zbl 1222.49040号 ·doi:10.1137/080743561
[11] 许永昌;肖浩,前向随机系统微分对策的最大值原理及其应用,J.Math。分析。申请。,386, 412-427 (2012) ·Zbl 1233.91041号 ·doi:10.1016/j.jmaa.2011.08.009
[12] R.Isaacs,差异游戏约翰·威利父子公司,纽约,1965年·兹标0125.38001
[13] 季S.L.和刘H.D.,前向随机差分系统随机最优控制问题的最大值原理,国际J.控制, (2021).
[14] X.S.Jiang;田圣培;张天乐;张文华,非线性离散随机系统的稳定性与镇定,国际鲁棒非线性力学杂志。,29, 6419-6437 (2019) ·Zbl 1447.93361号 ·doi:10.1002/rnc.4733
[15] D.李;C.W.Schmidt,离散时间线性二次控制中的成本平滑,Automatica,33,447-452(1997)·Zbl 0868.49023号 ·doi:10.1016/S0005-1098(96)00171-9
[16] X.Y.Lin;张文华,乘性噪声离散随机系统最优控制的最大值原理,IEEE Trans。自动化。控制,60,1121-1126(2015)·Zbl 1360.93395号 ·doi:10.1109/TAC.2014.2345243
[17] Q.Lü和X.Zhang,广义Pontryagin型随机极大值原理与无穷维倒向随机发展方程《施普林格数学简报》。施普林格,查姆,2014年·Zbl 1316.49004号
[18] J.B.摩尔;X.Y.Zhou;A.E.B.Lim,具有控制相关噪声的离散时间LQG控制,系统。对照Lett。,36, 199-206 (1999) ·Zbl 0913.93076号 ·doi:10.1016/S0167-6911(98)00092-9
[19] Y.H.Ni;R.J.Elliott;X.Li,离散平均场随机线性二次型最优控制问题,Ⅱ:无限时域情形,Automatica,57,65-77(2015)·Zbl 1330.93244号 ·doi:10.1016/j.automatica.2015.04.002
[20] M.Pachter;Pham,离散时间线性二次动态博弈,J.Optim。理论应用。,146, 151-179 (2010) ·Zbl 1200.91045号 ·数字对象标识代码:10.1007/s10957-010-9661-x
[21] P.Paruchuri;D.Chatterjee,状态作用频率约束下的离散时间pontryagin最大值原理,IEEE Trans。自动化。控制,64,4202-4208(2019)·兹比尔1482.93355 ·doi:10.1109/TAC.2019.2893160
[22] 彭胜国,最优控制问题的一般随机最大值原理,SIAM J.控制优化。,28, 966-979 (1990) ·Zbl 0712.93067号 ·doi:10.1137/0328054
[23] M.A.Rami;X.陈;周晓勇,含状态和控制相关噪声的离散不定LQ控制,全局优化。,23, 245-265 (2002) ·Zbl 1035.49024号 ·doi:10.1023/A:1016578629272
[24] 孙洪云(H.Y.Sun);L.Y.Jiang;张文华,离散随机系统的无限时域线性二次微分对策,J.Optim。理论应用。,10, 391-396 (2012) ·doi:10.1007/s11768-012-1004-z
[25] G.C.Wang;于振英,BSDE非零和微分对策的庞特里亚金最大值原理及其应用,IEEE Trans。自动化。控制,551742-1747(2010)·Zbl 1368.91035号 ·doi:10.1109/TAC.2010.2048052
[26] 王海霞、张海山和王海霞,多输入时滞随机离散系统的最优控制程序。第十届世界智能控制与自动化大会,北京,(2012),1529-1534。
[27] 吴忠,前向随机系统最优控制的一般最大值原理,Automatica,49,1473-1480(2013)·Zbl 1321.49041号 ·doi:10.1016/j.automatica.2013.02.005
[28] H.S.Zhang;X.Zhang,随机最优控制问题的二阶必要条件,SIAM Rev.,60,139-178(2018)·Zbl 1380.93294号 ·doi:10.1137/17M1148773
[29] W.H.Zhang;黄玉良;H.S.Zhang,具有状态和扰动相关噪声的离散时间系统的随机(H_2/H_infty)控制,Automatica,43,513-521(2007)·Zbl 1137.93057号 ·doi:10.1016/j.automatica.2006.09.015
[30] X.Zhang;R.J.Elliott;T.K.Siu,马尔可夫切换跳-扩散模型的随机最大值原理及其在金融中的应用,SIAM J.Control Optim。,50, 964-990 (2012) ·兹比尔1244.93180 ·数字对象标识代码:10.1137/10839357
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。