×

马尔可夫决策过程分散控制的复杂性。 (英语) Zbl 1082.90593号

摘要:我们考虑马尔可夫决策过程的分散控制,并给出了寻找最优解的算法在最坏情况下运行时间的复杂性界。描述了允许分散控制的完全可观测情况和部分可观测情况的推广。即使是两个主体,对于非确定性指数时间,与这两个模型相对应的有限时域问题也很难求解。这些复杂性结果说明了马尔可夫决策过程的集中控制和分散控制之间的根本区别。与涉及集中控制的问题相比,我们考虑的问题不允许多项式时间算法。此外,假设EXP\(\ not=\)NEXP,在最坏的情况下,这些问题需要超指数时间才能解决。

MSC公司:

90C60型 数学规划问题的抽象计算复杂性
65年第68季度 算法和问题复杂性分析
90立方厘米 马尔可夫和半马尔可夫决策过程
93E03型 控制理论中的随机系统(一般)

软件:

POMDP公司
PDF格式BibTeX公司 XML格式引用