×

最新确定性策略迭代算法的指数下限。 (英文) Zbl 1237.68087号

摘要:本文针对求解平价、平均收益、折扣收益和简单随机博弈的策略改进算法的两种最常见的确定性变体,提出了一个新的指数下界。第一种变体在每个步骤中改进每个节点,使当前估值局部最大化,而第二种变体在每个步骤中计算全局最优改进。我们概述了两种变体都需要指数级多次策略迭代的游戏系列。

MSC公司:

2017年第68季度 问题的计算难度(下限、完备性、近似难度等)
91A15型 随机对策,随机微分对策
91年43月 涉及图形的游戏

软件:

PGSolver公司
PDF格式BibTeX公司 XML格式引用
全文: 内政部