×

期望值和恐惧值离散时间控制的分离定理。 (英语) Zbl 0878.93062号

这项工作建立在马斯洛夫的幂等测度理论的基础上。更具体地说,本文包含了Del Moral和Quadrat独立介绍的概率和成本度量之间并行性的有趣应用。
主要目的是展示如何使用这些工具来处理与随机控制完全平行的极小极大控制问题。作者改进了他的早期工作,提出了极大极小和随机分离定理之间的完全平行。
这项研究是自包含的,并提出了一种非常方便的方法来理解极小极大和随机控制问题之间的联系。

MSC公司:

93E20型 最优随机控制
90立方厘米 马尔可夫和半马尔可夫决策过程
PDF格式BibTeX公司 XML格式引用
全文: 内政部 欧洲DML

参考文献:

[1] M.Akian:幂等测度和大偏差的密度,研究报告2534,印度研究所,1995年·Zbl 0934.28005号
[2] M.Akian、J-P.Quadrat和M.Viot:Bellman过程,第十一届系统分析和优化国际会议,法国索菲亚·安蒂波利斯,1994年。Zbl0826.49021号·Zbl 0826.49021号
[3] F.Baccelli、G.Cohen、J-P.Quadrat、G-J.Olsder:《同步与线性》,英国奇切斯特威利出版社,1992年。Zbl0824.93003 MR1204266·兹比尔0824.93003
[4] T.Başar和P.Bernhard:H∞最优控制和相关的极小极大设计问题——博弈论方法,第二版,Birkhauser,Boston,1995年。MR1353236型
[5] J.A.Ball和J.W.Helton:H&#x221E-《非线性植物的控制:与微分对策的联系》,第28届疾病预防控制中心,佛罗里达州坦帕,1989年。
[6] J.A.Ball、J.W.Helton和M.L.Walker:-具有输出反馈的非线性系统的控制,IEEE Trans。自动控制,AC-381993546-559。Zbl0782.93032 MR1220736·Zbl 0782.93032号 ·数字对象标识代码:10.1109/9.250523
[7] P.Bernhard:《非线性部分信息最小最大控制理论概述》,《2020年研究报告》,INRIA,1993年。
[8] P.Bernhard:《离散时间最小确定性等价原理》,《系统与控制快报》,第24期,1995年,第229-234页。Zbl0877.93070 MR1321130号·Zbl 0877.93070号 ·doi:10.1016/0167-6911(94)00027-S
[9] P.Bernhard:《期望值、恐惧值和最优控制》,G-J.Olsder主编:《动态游戏和应用的新趋势》,Birkhauser出版社,1995年。Zbl0853.93093 MR1413973号·Zbl 0853.93093号
[10] P.Bernhard和G.Bellec:《关于最坏情况设计的评估及其在二次合成技术中的应用》,第三届IFAC敏感性、适应性和最佳性研讨会,意大利伊斯基亚,1973年。MR343957型
[11] P.Bernhard和A.Rapaport:Min-max确定性等价原则和微分对策,在鲁棒控制器设计和微分对策研讨会上提交的论文修订版,加州大学旧金山分校,1993年,提交出版。Zbl0857.93033号·Zbl 0857.93033号 ·doi:10.1002/(SICI)1099-1239(199610)6:8<825::AID-RNC193>3.0.CO;2-S型
[12] G.Choquet:《容量理论》,《傅里叶学院年鉴》,格勒诺布尔,第5期,1955年,第131-295页。Zbl0064.35101 MR80760号·Zbl 0064.35101号 ·doi:10.5802/aif.53
[13] G.Didinsky,T.Ba&#x015F;ar和P.Bernhard:非线性H&#x221E中一类微分对策的Minimax策略的结构性质-《控制、系统和控制快报》,21993,433-441。Zbl0804.90151 MR1249922·Zbl 0804.90151号 ·doi:10.1016/0167-6911(93)90048-B
[14] P.Del Moral:非线性估计与优化问题的特殊解决方案,博士论文,保罗·萨巴蒂尔大学,图卢兹,1994年。
[15] P.Del Moral:《马斯洛夫优化理论》,俄罗斯数学物理杂志,即将出版。
[16] A.Isidori:非线性系统的反馈控制,第一届ECC,格勒诺布尔,1991年。
[17] A.Isidori和A.Astolfi:干扰衰减和H&#x221E;非线性系统中通过测量反馈进行控制,IEEE Trans。《自动控制》,AC 37,1992,1283-1293。Zbl0755.93043 MR1183088号·Zbl 0755.93043号 ·doi:10.10109/9.159566
[18] M.James:《确定性等价原理与部分可观测动态博弈的最优控制》,IEEE Trans。《自动控制》,AC 39,1994,2321-2324。Zbl0825.49014 MR1301662号·Zbl 0825.49014号 ·数字对象标识代码:10.1109/9.333786
[19] M.R.James和J.S.Baras:部分可观测微分对策、无限维HJI方程和非线性H&#x221E;控件,以显示。Zbl0853.90133号·Zbl 0853.90133号 ·doi:10.1137/S0363012994273337
[20] M.R.James、J.S.Barras和R.J.Elliott:《连续时间非线性系统的输出反馈风险敏感控制和微分对策》,第32届CDC,圣安东尼奥,1993年。
[21] M.R.James、J.S.Barras和R.J.Elliott:部分可观测离散时间非线性系统的风险敏感控制和动态博弈,IEEE Trans。关于自动控制,AC-391994,780-792。Zbl0807.93067 MR1276773号·Zbl 0807.93067号 ·doi:10.1109/9.286253
[22] V.N.Kolokolstof和V.P.Maslov:数值互补半环中数值连续函数空间内自同态的一般形式(使用运算&#x2295;=max),苏维埃数学。道克。,36, 1988, 55-59. Zbl0655.46020 MR902683号·Zbl 0655.46020号
[23] V.Maslov:《梅特霍德斯·奥佩拉托列斯》,莫斯科,1987年。Zbl0651.47039 MR1085245号·Zbl 0651.47039号
[24] V.Maslov和S.N.Samborskii:Idempotent分析,《苏联数学进展》,第13期,AMS,普罗维登斯,1992年。Zbl0772.00015 MR1203781·兹比尔0772.00015
[25] J-P.Quadrat:Théorèmes渐近线en programmation dynamice,《科学院学报》,31119990745-748。Zbl0711.90082 MR1081638号·Zbl 0711.90082号
[26] A.Rapaport和P.Bernhard:Un jeu de poursuite-lavec connaissance imparfaite des coordonnees,差分博弈与应用国际研讨会,圣约维特,1994年。
[27] A.J.van der Schaft:非线性状态空间H≠;控制理论,ECC 1993,Gronin-gen。
[28] M.Viot:马尔可夫链&#x211D;min+,META2研讨会,INRIA,1992年,未出版。
[29] P.Whittle:风险敏感线性二次高斯控制,应用概率进展,第13期,1981年,第764-777页。Zbl0489.93067 MR632961号·Zbl 0489.93067号 ·doi:10.2307/1426972
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。