文件Zbl 1485.93641-zbMATH Open

离散时间随机最优控制问题和随机对策的最大值原理。（英语） Zbl 1485.93641号

数学。控制关系。领域 12，编号2，475-493（2022）.

摘要：本文首先研究了一类具有凸控制域的离散时间随机最优控制问题，导出了其Pontryagin最大值原理形式的必要条件和最优性的充分条件。然后将结果推广到两类离散时间随机对策。研究了两个示例，给出了显式优化策略。本文简明扼要地建立了离散时间随机最大值原理的严格形式，为进一步研究相关课题铺平了道路。

引用于7文件

MSC公司：

93E20型	最优随机控制
93C55美元	离散时间控制/观测系统
91A15型	随机对策，随机微分对策
91克99	精算科学和数学金融

关键词：

最大值原理;随机最优控制;随机博弈;离散时间系统;最优投资/消费选择

PDF格式 BibTeX公司 XML格式引用

全文： DOI程序

参考文献：

[1]	T.T.K.安；B.Øksendal，部分信息随机微分对策的最大值原理，J.Optim。理论应用。，139, 463-483 (2008) ·Zbl 1159.91321号 ·doi:10.1007/s10957-008-9398-y
[2]	A.贝吉；D.D’Alessandro，带控制相关噪声和广义Riccati差分方程的离散时间最优控制，Automatica，341031-1034（1998）·Zbl 0944.93032号 ·doi:10.1016/S0005-1098（98）00044-2
[3]	L.Chen；于志勇，时滞非零和随机微分对策的最大值原理，IEEE Trans。自动化。控制，60，1422-1426（2015）·Zbl 1360.91020号 ·doi:10.1109/TAC.2014.2352731
[4]	S.N.Cohen；R.J.Elliott，有限状态倒向随机差分方程的一般理论，Stoch。程序。申请。，120, 442-466 (2010) ·Zbl 1205.60111号 ·doi:10.1016/j.spa.2010.01.004
[5]	S.N.Cohen；R.J.Elliott，倒向随机差分方程和几乎时间一致的非线性期望，SIAM J.控制优化。，49125-139（2011年）·Zbl 1225.60092号 ·数字对象标识代码：10.1137/090763688
[6]	O.L.V.科斯塔；A.de Oliveira，带马尔可夫跳跃和乘性噪声的离散线性系统的最优均值-方差控制，Automatica，48，304-315（2012）·Zbl 1260.93173号 ·doi:10.1016/j.自动2011.11.009
[7]	杜克强；孟庆霞，随机发展方程最优控制的最大值原理，SIAM J.控制优化。，51, 4343-4362 (2013) ·Zbl 1285.49018号 ·数字对象标识代码：10.1137/120882433
[8]	R.J.Elliott；十、李；Y.H.Ni，离散时间平均场随机线性二次最优控制问题，Automatica，49，3222-3233（2013）·兹比尔1358.93189 ·doi:10.1016/j.automatica.2013.08.017
[9]	H.Halkin，非线性差分方程描述系统的pontryagin型最大值原理，SIAM J.控制优化。，1990年至111年（1966年）·Zbl 0152.09301号 ·数字对象标识代码：10.1137/0304009
[10]	Y.C.Han；S.G.Peng；吴志伟，具有应用的后向双随机控制系统的最大值原理，SIAM J.控制优化。，48, 4224-4241 (2010) ·Zbl 1222.49040号 ·doi:10.1137/080743561
[11]	许永昌；肖浩，前向随机系统微分对策的最大值原理及其应用，J.Math。分析。申请。，386, 412-427 (2012) ·Zbl 1233.91041号 ·doi:10.1016/j.jmaa.2011.08.009
[12]	R.Isaacs，差异游戏约翰·威利父子公司，纽约，1965年·兹标0125.38001
[13]	季S.L.和刘H.D.，前向随机差分系统随机最优控制问题的最大值原理，国际J.控制, (2021).
[14]	X.S.Jiang；田圣培；张天乐；张文华，非线性离散随机系统的稳定性与镇定，国际鲁棒非线性力学杂志。，29, 6419-6437 (2019) ·Zbl 1447.93361号 ·doi:10.1002/rnc.4733
[15]	D.李；C.W.Schmidt，离散时间线性二次控制中的成本平滑，Automatica，33，447-452（1997）·Zbl 0868.49023号 ·doi:10.1016/S0005-1098（96）00171-9
[16]	X.Y.Lin；张文华，乘性噪声离散随机系统最优控制的最大值原理，IEEE Trans。自动化。控制，60，1121-1126（2015）·Zbl 1360.93395号 ·doi:10.1109/TAC.2014.2345243
[17]	Q.Lü和X.Zhang，广义Pontryagin型随机极大值原理与无穷维倒向随机发展方程《施普林格数学简报》。施普林格，查姆，2014年·Zbl 1316.49004号
[18]	J.B.摩尔；X.Y.Zhou；A.E.B.Lim，具有控制相关噪声的离散时间LQG控制，系统。对照Lett。，36, 199-206 (1999) ·Zbl 0913.93076号 ·doi:10.1016/S0167-6911（98）00092-9
[19]	Y.H.Ni；R.J.Elliott；X.Li，离散平均场随机线性二次型最优控制问题，Ⅱ：无限时域情形，Automatica，57，65-77（2015）·Zbl 1330.93244号 ·doi:10.1016/j.automatica.2015.04.002
[20]	M.Pachter；Pham，离散时间线性二次动态博弈，J.Optim。理论应用。，146, 151-179 (2010) ·Zbl 1200.91045号 ·数字对象标识代码：10.1007/s10957-010-9661-x
[21]	P.Paruchuri；D.Chatterjee，状态作用频率约束下的离散时间pontryagin最大值原理，IEEE Trans。自动化。控制，64，4202-4208（2019）·兹比尔1482.93355 ·doi:10.1109/TAC.2019.2893160
[22]	彭胜国，最优控制问题的一般随机最大值原理，SIAM J.控制优化。，28, 966-979 (1990) ·Zbl 0712.93067号 ·doi:10.1137/0328054
[23]	M.A.Rami；X.陈；周晓勇，含状态和控制相关噪声的离散不定LQ控制，全局优化。，23, 245-265 (2002) ·Zbl 1035.49024号 ·doi:10.1023/A:1016578629272
[24]	孙洪云（H.Y.Sun）；L.Y.Jiang；张文华，离散随机系统的无限时域线性二次微分对策，J.Optim。理论应用。，10, 391-396 (2012) ·doi:10.1007/s11768-012-1004-z
[25]	G.C.Wang；于振英，BSDE非零和微分对策的庞特里亚金最大值原理及其应用，IEEE Trans。自动化。控制，551742-1747（2010）·Zbl 1368.91035号 ·doi:10.1109/TAC.2010.2048052
[26]	王海霞、张海山和王海霞，多输入时滞随机离散系统的最优控制程序。第十届世界智能控制与自动化大会，北京，（2012），1529-1534。
[27]	吴忠，前向随机系统最优控制的一般最大值原理，Automatica，49，1473-1480（2013）·Zbl 1321.49041号 ·doi:10.1016/j.automatica.2013.02.005
[28]	H.S.Zhang；X.Zhang，随机最优控制问题的二阶必要条件，SIAM Rev.，60，139-178（2018）·Zbl 1380.93294号 ·doi:10.1137/17M1148773
[29]	W.H.Zhang；黄玉良；H.S.Zhang，具有状态和扰动相关噪声的离散时间系统的随机（H_2/H_infty）控制，Automatica，43，513-521（2007）·Zbl 1137.93057号 ·doi:10.1016/j.automatica.2006.09.015
[30]	X.Zhang；R.J.Elliott；T.K.Siu，马尔可夫切换跳-扩散模型的随机最大值原理及其在金融中的应用，SIAM J.Control Optim。，50, 964-990 (2012) ·兹比尔1244.93180 ·数字对象标识代码：10.1137/10839357

此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配，可能包含数据转换错误。在某些情况下，zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献，而不要求完整或完全匹配。

任何	在任何地方
一个	内部文档标识符
澳大利亚	作者、编辑
人工智能	内部作者标识符
钛	标题
洛杉矶	语言
所以	来源
ab公司	回顾，摘要
第页	出版年份
车辆	评审员
复写的副本	MSC代码
美国犹他州	关键字
日期	文档类型(j个：期刊文章；b条：书本；一：图书文章）

一&b条	逻辑和
一\|b条	逻辑或
!ab公司	逻辑不
美国广播公司*	右通配符
"ab c公司"	短语
(ab c公司)	括号

示例

领域

操作员

离散时间随机最优控制问题和随机对策的最大值原理。 （英语） Zbl 1485.93641号

MSC公司：

关键词：

参考文献：

离散时间随机最优控制问题和随机对策的最大值原理。（英语） Zbl 1485.93641号