×

随机控制和动态博弈之间的联系。 (英语) Zbl 0874.93096号

作者研究了随机控制与博弈问题之间的对偶关系。对于固定概率测度,通过勒让德变换,自由能和相对熵是对偶的。此外,幂函数而不是自由能具有相关关系。利用这些基本的对偶结果,他们以本质上相同的方式,获得了具有连续或离散时间和全部或部分状态信息的原始控制对偶博弈的成本泛函结构。在各种情况下给出了对偶博弈的显式形式。

MSC公司:

93年20日 最优随机控制
91年60日 概率博弈;赌博
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] E.N.Barron和R.Jensen,总风险规避,随机最优控制和微分对策,应用。数学。最佳方案。19 (1989), 313–327. ·Zbl 0830.90144号 ·doi:10.1007/BF01448203
[2] A.Bensoussan和J.H.van Schuppen,具有指数积分性能指标的部分可观测随机系统的最优控制,SIAM J.control Optim。23 (1985), 599–613. ·Zbl 0574.93067号 ·doi:10.1137/0323038
[3] D.P.Bertsekas,《动态规划和随机控制》,学术出版社,伦敦,1976年·Zbl 0549.93064号
[4] M.Boué和P.Dupuis,布朗运动某些泛函的变分表示,LCDS报告#95-7·Zbl 0936.60059号
[5] C.D.Charalambous,信息状态和伴随在关联非线性输出反馈风险敏感控制和动态博弈中的作用,预印本·Zbl 0886.93071号
[6] C.D.Charalambous和R.J.Elliott,具有显式最优控制律的非线性部分可观测随机最优控制问题,预印本·Zbl 0915.93070号
[7] J.D.Deuschel和D.W.Strock,《大偏差》,学术出版社,纽约,1989年。
[8] P.Dupuis和R.S.Ellis,《大偏差理论的弱收敛方法》,LCDS报告#93-6,Brown University,Providence,RI。Wiley即将出版的书·Zbl 0904.60001号
[9] E.Fernández-Gaucherand和S.I.Marcus,隐马尔可夫模型的风险敏感最优控制:案例研究,Proc。第33届疾病预防控制中心,1994年,第1657-1662页。
[10] W.H.Fleming和W.M.McEneany,风险敏感最优控制和微分对策,《随机理论与自适应控制》(T.E.Duncan和B.Pasik Duncan编辑),Springer Verlag,纽约,1992,185–197。
[11] W.H.Fleming和W.M.McEneany,无限期风险敏感控制,SIAM J.control Optim。33 (1995), 1881–1915. ·兹比尔0949.93079 ·doi:10.1137/S0363012993258720
[12] D.H.Jacobson,具有指数性能标准的最优随机线性系统及其与确定性微分对策的关系,IEEE Trans。自动化。控制18(1973),124–131·Zbl 0274.93067号 ·doi:10.1109/TAC.1973.1100265
[13] M.R.James,非线性随机风险敏感控制和微分对策的渐近分析,数学。控制信号系统5(1992),401–417·Zbl 0761.93076号 ·doi:10.1007/BF02134013
[14] M.R.James、J.S.Baras和R.J.Elliott,部分可观测离散非线性系统的风险敏感控制和动态博弈,IEEE Trans。自动化。控制39(1994),780-792·Zbl 0807.93067号 ·doi:10.1109/9.286253
[15] R.S.Lipster和A.N.Shiryaev,《随机过程统计》,第卷。1和2,施普林格出版社,纽约,1988年。
[16] L.Meneghini,Modelli risolvibili per problemi di controllo di sistemi dinamici unreciscise multi-variati,帕多瓦大学论文,1994年。
[17] T.Runolfsson,具有指数积分性能指标的随机系统的无限小时最优控制与随机微分对策的等价性,IEEE Trans。自动化。控制39(1994),1551–1563·Zbl 0930.93084号 ·数字对象标识代码:10.1109/9.310029
[18] P.Whittle,风险敏感性线性二次高斯控制,《应用进展》。普罗巴伯。13 (1981), 764–777. ·Zbl 0489.93067号 ·doi:10.2307/1426972
[19] P.Whittle,风险敏感最优控制,威利,纽约,1990年·Zbl 0718.93068号
[20] P.Whittle,《风险敏感最大值原理:不完美状态观测的情况》,IEEE Trans。自动化。控制36(1991),793–801·Zbl 0752.93079号 ·doi:10.1109/9.85059
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。