文件Zbl 1237.68087-zbMATH打开

最新确定性策略迭代算法的指数下限。（英文） Zbl 1237.68087号

摘要：本文针对求解平价、平均收益、折扣收益和简单随机博弈的策略改进算法的两种最常见的确定性变体，提出了一个新的指数下界。第一种变体在每个步骤中改进每个节点，使当前估值局部最大化，而第二种变体在每个步骤中计算全局最优改进。我们概述了两种变体都需要指数级多次策略迭代的游戏系列。

PDF格式 BibTeX公司 XML格式引用

全文：内政部