奥利弗·弗里德曼 最新确定性策略迭代算法的指数下限。 (英文) Zbl 1237.68087号 日志。方法计算。科学。 7,第3号,第23号论文,42页(2011年). 摘要:本文针对求解平价、平均收益、折扣收益和简单随机博弈的策略改进算法的两种最常见的确定性变体,提出了一个新的指数下界。第一种变体在每个步骤中改进每个节点,使当前估值局部最大化,而第二种变体在每个步骤中计算全局最优改进。我们概述了两种变体都需要指数级多次策略迭代的游戏系列。 引用于10文件 MSC公司: 2017年第68季度 问题的计算难度(下限、完备性、近似难度等) 91A15型 随机对策,随机微分对策 91年43月 涉及图形的游戏 关键词:平价游戏;\(\mu\)-微积分;有酬游戏;策略迭代;战略改进;指数下限 软件:PGSolver公司 PDF格式BibTeX公司 XML格式引用 \textit{O.Friedmann},日志。方法计算。科学。7,第3号,第23号论文,42页(2011年;Zbl 1237.68087) 全文: 内政部