文件Zbl 1481.91017-zbMATH Open

零和随机博弈中的恒定收益。（英语） Zbl 1481.91017号

普罗巴伯亨利·彭卡雷（Henri Poincaré）安研究所。斯达。 57，第4期，1888-1900（2021）.

总结：在零和随机博弈中，在每个阶段，两个对手玩家做出决策，并获得由他们和代表自然状态的受控随机变量决定的阶段收益。总收益是阶段收益的标准化折现总和。在本文中，我们解决了由S.索林等[Sankhyá，Ser.A 72，No.1，237–245（2010；Zbl 1209.49035号)]：如果两个玩家都使用最优策略，那么对于任何一个\（\alpha>0\），阶段\（1\）和阶段\（\alpha/\lambda\）之间的预期贴现收益往往是游戏的极限贴现值，因为贴现率\（\lambda\）变为\（0\）。

引用于1文件

MSC公司：

91A15型	随机对策，随机微分对策
91年10月	非合作游戏
15B51号	随机矩阵

关键词：

固定收益;极限值;Puiseux系列;零和随机对策

引文：

Zbl 1209.49035号

PDF格式 BibTeX公司 XML格式引用

全文：内政部

参考文献：

[1]	L.Attia和M.Oliu Barton。随机博弈值的公式。程序。国家。阿卡德。科学。美国116 (52) (2019) 26435-26443. ·Zbl 1456.91008号 ·doi:10.1073/pnas.1908643116
[2]	T.Bewley和E.Kohlberg。随机对策的渐近理论。数学。操作。物件。1 (3) (1976) 197-208. ·兹伯利0364.93031 ·doi:10.1287/门1.3.197
[3]	T.Bewley和E.Kohlberg。关于具有平稳最优策略的随机博弈。数学。操作。物件。3 (2) (1978) 104-125. ·Zbl 0395.90091号 ·doi:10.1287/门3.2.104
[4]	O.Catoni。模拟退火算法和具有罕见跃迁的马尔可夫链。在概率标准三十三69-119. 斯普林格，1999年·Zbl 0944.90053号 ·doi:10.1007/BFb0096510
[5]	W.Feller。概率论及其应用导论第二卷约翰·威利父子公司，1971年·Zbl 0219.60003号
[6]	D.吉列。具有零停止概率的随机博弈。在对博弈论的贡献179-187. M.Dresher、A.W.Tucker和P.Wolfe（编辑）。数学研究年鉴39.普林斯顿大学出版社，1957年·Zbl 0078.33001号
[7]	E.Lehrer和S.Sorin。动态规划中的统一Tauberian定理。数学。操作。物件。17 (2) (1992) 303-307. ·Zbl 0771.90099号 ·doi:10.1287/门1.7203
[8]	J.-F.Mertens和A.Neyman。随机游戏。国际。J.博弈论10 (2) (1981) 53-66. ·Zbl 0486.90096号 ·doi:10.1007/BF01769259文件
[9]	M.Oliu-巴顿。随机对策中的渐近值。数学。操作。物件。39 (3) (2014) 712-721. ·Zbl 1308.91028号 ·doi:10.1287/门2013.0642
[10]	M.Oliu-巴顿。分裂游戏：价值和最优策略。动态。游戏应用程序。8 (1) (2018) 157-179. ·Zbl 1390.91040号 ·doi:10.1007/s13235-017-0216-8
[11]	M.Oliu-巴顿。求解零和随机对策的新算法。数学。操作。物件。(2020). ·Zbl 1466.91022号 ·doi:10.1287/门2020.1055
[12]	J.雷诺。《博弈论基础》（课堂笔记），2017年。
[13]	L.S.沙普利。随机游戏。程序。国家。阿卡德。科学。美国39 (10) (1953) 1095-1100. ·Zbl 0051.35805号 ·doi:10.1073/pnas.39.10.1953
[14]	S.索林。关于零和重复博弈的第一堂课斯普林格出版社，2002年·Zbl 1005.91019号
[15]	零和随机博弈的算子方法。在随机博弈及其应用417-426.北约科学系列C，数学和物理科学570, 2003. ·Zbl 1092.91502号
[16]	S.Sorin、X.Venel和G.Vigeral。动态规划中最优轨迹的渐近性质。Sankhya A公司72 (1) (2010) 237-245. ·Zbl 1209.49035号 ·doi:10.1007/s13171-010-0011-8
[17]	S.Sorin和G.Vigeral。零和随机博弈中的极限最优轨迹。动态。游戏应用程序。(2019) 1-18. ·Zbl 1444.91024号 ·doi:10.1007/s13235-019-00333-z
[18]	G.维格尔。具有紧动作集且无渐近值的零和随机对策。动态。游戏应用程序。3 (2) (2013) 172-186. ·兹比尔1280.91026 ·doi:10.1007/s13235-013-0073-z
[19]	B.齐利奥托。零和重复博弈：渐近值的存在性和maxmin=limv（n）猜想的反例。安·普罗巴伯。44 (2) (2016) 1107-1133. ·Zbl 1344.91006号 ·doi:10.1214/14-AOP997

此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配，可能包含数据转换错误。在某些情况下，zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献，而不要求完整或完全匹配。

任何	在任何地方
一个	内部文档标识符
澳大利亚	作者、编辑
人工智能	内部作者标识符
钛	标题
洛杉矶	语言
所以	来源
ab公司	回顾，摘要
第页	出版年份
车辆	评审员
复写的副本	MSC代码
美国犹他州	关键字
日期	文档类型(j个：期刊文章；b条：book；一：图书文章）

一&b条	逻辑和
一\|b条	逻辑或
!ab公司	逻辑非
美国广播公司*	右通配符
"ab c公司"	短语
(ab c公司)	圆括号

示例

领域

操作员

零和随机博弈中的恒定收益。（英语） Zbl 1481.91017号

MSC公司：

关键词：

引文：

参考文献：

示例

领域

操作员

零和随机博弈中的恒定收益。 （英语） Zbl 1481.91017号

MSC公司：

关键词：

引文：

参考文献：

零和随机博弈中的恒定收益。（英语） Zbl 1481.91017号