×

具有竞争决策者的马尔科夫系统中的保证性能区域。 (英语) Zbl 0779.90080号

本文的贡献是证明了向量支付的两人随机对策的可逼近性结果。该博弈对应于一个控制问题,其中一个动态系统由多个决策者控制。本文考虑了特定决策者是否能够保证时间平均性能度量向量在性能向量空间中渐近逼近期望集的问题。在可数状态空间和有限作用空间中考虑受控系统的马尔可夫模型。主要结果是:(1)任意给定集是可逼近的充分条件,(2)凸集是可接近的充要条件,(3)逼近控制策略的构造。结果主要取决于单个固定状态的某些递归性质。所提出的控制策略要求决策者除了监控系统的基本状态外,还要监控系统的性能,并相应地修改其策略。可接近性条件的验证和控制策略的计算带来了一些复杂的问题。分析了一个简单的排队实例来说明结果。

MSC公司:

91A15型 随机对策,随机微分对策
91A60 概率博弈;赌博
93E35型 随机学习与自适应控制
PDF格式BibTeX公司 XML格式引用
全文: 内政部 链接