×

零和随机博弈中的恒定收益。 (英语) Zbl 1481.91017号

总结:在零和随机博弈中,在每个阶段,两个对手玩家做出决策,并获得由他们和代表自然状态的受控随机变量决定的阶段收益。总收益是阶段收益的标准化折现总和。在本文中,我们解决了由S.索林等[Sankhyá,Ser.A 72,No.1,237–245(2010;Zbl 1209.49035号)]:如果两个玩家都使用最优策略,那么对于任何一个\(\alpha>0\),阶段\(1\)和阶段\(\alpha/\lambda\)之间的预期贴现收益往往是游戏的极限贴现值,因为贴现率\(\lambda\)变为\(0\)。

MSC公司:

91A15型 随机对策,随机微分对策
91年10月 非合作游戏
15B51号 随机矩阵
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] L.Attia和M.Oliu Barton。随机博弈值的公式。程序。国家。阿卡德。科学。美国116 (52) (2019) 26435-26443. ·Zbl 1456.91008号 ·doi:10.1073/pnas.1908643116
[2] T.Bewley和E.Kohlberg。随机对策的渐近理论。数学。操作。物件。1 (3) (1976) 197-208. ·兹伯利0364.93031 ·doi:10.1287/门1.3.197
[3] T.Bewley和E.Kohlberg。关于具有平稳最优策略的随机博弈。数学。操作。物件。3 (2) (1978) 104-125. ·Zbl 0395.90091号 ·doi:10.1287/门3.2.104
[4] O.Catoni。模拟退火算法和具有罕见跃迁的马尔可夫链。概率标准三十三69-119. 斯普林格,1999年·Zbl 0944.90053号 ·doi:10.1007/BFb0096510
[5] W.Feller。概率论及其应用导论第二卷约翰·威利父子公司,1971年·Zbl 0219.60003号
[6] D.吉列。具有零停止概率的随机博弈。对博弈论的贡献179-187. M.Dresher、A.W.Tucker和P.Wolfe(编辑)。数学研究年鉴39.普林斯顿大学出版社,1957年·Zbl 0078.33001号
[7] E.Lehrer和S.Sorin。动态规划中的统一Tauberian定理。数学。操作。物件。17 (2) (1992) 303-307. ·Zbl 0771.90099号 ·doi:10.1287/门1.7203
[8] J.-F.Mertens和A.Neyman。随机游戏。国际。J.博弈论10 (2) (1981) 53-66. ·Zbl 0486.90096号 ·doi:10.1007/BF01769259文件
[9] M.Oliu-巴顿。随机对策中的渐近值。数学。操作。物件。39 (3) (2014) 712-721. ·Zbl 1308.91028号 ·doi:10.1287/门2013.0642
[10] M.Oliu-巴顿。分裂游戏:价值和最优策略。动态。游戏应用程序。8 (1) (2018) 157-179. ·Zbl 1390.91040号 ·doi:10.1007/s13235-017-0216-8
[11] M.Oliu-巴顿。求解零和随机对策的新算法。数学。操作。物件。(2020). ·Zbl 1466.91022号 ·doi:10.1287/门2020.1055
[12] J.雷诺。《博弈论基础》(课堂笔记),2017年。
[13] L.S.沙普利。随机游戏。程序。国家。阿卡德。科学。美国39 (10) (1953) 1095-1100. ·Zbl 0051.35805号 ·doi:10.1073/pnas.39.10.1953
[14] S.索林。关于零和重复博弈的第一堂课斯普林格出版社,2002年·Zbl 1005.91019号
[15] 零和随机博弈的算子方法。随机博弈及其应用417-426.北约科学系列C,数学和物理科学570, 2003. ·Zbl 1092.91502号
[16] S.Sorin、X.Venel和G.Vigeral。动态规划中最优轨迹的渐近性质。Sankhya A公司72 (1) (2010) 237-245. ·Zbl 1209.49035号 ·doi:10.1007/s13171-010-0011-8
[17] S.Sorin和G.Vigeral。零和随机博弈中的极限最优轨迹。动态。游戏应用程序。(2019) 1-18. ·Zbl 1444.91024号 ·doi:10.1007/s13235-019-00333-z
[18] G.维格尔。具有紧动作集且无渐近值的零和随机对策。动态。游戏应用程序。3 (2) (2013) 172-186. ·兹比尔1280.91026 ·doi:10.1007/s13235-013-0073-z
[19] B.齐利奥托。零和重复博弈:渐近值的存在性和maxmin=limv(n)猜想的反例。安·普罗巴伯。44 (2) (2016) 1107-1133. ·Zbl 1344.91006号 ·doi:10.1214/14-AOP997
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。