×

具有独立状态过程的零和约束随机对策。 (英语) Zbl 1108.91011号

摘要:我们考虑一个具有边约束的零和随机博弈,博弈双方都具有特殊的结构。有两个独立的受控马尔可夫链,每个参与者一个。与参与者关联的链的转移概率以及相关边约束仅取决于相应参与者的行为;边约束也取决于玩家的控制链。然而,玩家1希望最小化的全局成本和玩家2希望最大化的全局成本取决于两个玩家的行动和马尔可夫链。我们得到了一个线性规划公式,该公式允许计算该问题的值和鞍点策略。我们通过无线网络中的零和随机博弈来说明理论结果,其中每个参与者都有功率约束

MSC公司:

91A15型 随机对策,随机微分对策
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Altman E(1999)约束马尔可夫决策过程。查普曼和霍尔/CRC,伦敦·Zbl 0963.90068号
[2] Altman E,Shwartz A(1991)马尔可夫决策问题和状态-动作频率。SIAM J控制优化29(4):786–809·Zbl 0733.90075号 ·数字对象标识代码:10.1137/0329043
[3] Altman E,Shwartz A(2000)约束马尔可夫博弈:纳什均衡。收录于:Gaitsgory V,Filar J,Mizukami K(eds)《国际动态博弈学会年鉴》,第5卷,Birkhauser,第303–323页·Zbl 0957.91014号
[4] Altman E,Spieksma F(1995)重新审视马尔可夫决策问题中的线性规划方法。ZOR Meth模型Oper Res 42(2):169–188·Zbl 0852.90129号 ·doi:10.1007/BF01415752
[5] Gómez-Ramírez E,Najim K,Poznyak AS(2003)约束有限马尔可夫链的鞍点计算。《经济动态控制杂志》27:1833–1853·兹比尔1178.91022 ·doi:10.1016/S0165-1889(02)00085-4
[6] Hordijk A,Kallenberg LCM(1984)约束未贴现随机动态规划。数学运算研究9(2):276–289·Zbl 0598.90090号 ·doi:10.1287/门9.2.276
[7] Hordijk A,Kallenberg LCM(1981a)线性规划与马尔可夫对策I.In:Moeschlin O,Pallschke D(eds)博弈论与数学经济学,北荷兰,第291-305页
[8] Hordijk A,Kallenberg LCM(1981b)线性规划和马尔可夫对策II。收录:Moeschlin O,Pallschke D(编辑)博弈论和数学经济学,北荷兰,第307-320页
[9] Kallenberg LCM(1994)标准和非标准马尔可夫控制问题线性规划综述,第一部分:理论。ZOR方法模型Oper Res 40:1–42·Zbl 0810.90133号 ·doi:10.1007/BF01414028
[10] Mertens JF,Neyman A(1981)随机博弈。国际J博弈论10(2):53–66·Zbl 0486.90096号 ·doi:10.1007/BF01769259文件
[11] Shimkin N(1994)具有平均成本约束的随机博弈。收录:Basar T,Haurie A(编辑)《国际动态游戏学会年鉴》,第1卷:动态游戏和应用的进展,Birkhauser·Zbl 0829.90144号
[12] Vrieze OJ(1981)线性规划和无折扣随机游戏,其中一个玩家控制转换。OR演讲稿3,第29–35页·Zbl 0462.9003号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。