丹尼尔·伯恩斯坦(Daniel S.Bernstein)。;罗伯特·吉万;尼尔·伊梅尔曼;什洛莫·齐尔伯斯坦 马尔可夫决策过程分散控制的复杂性。 (英语) Zbl 1082.90593号 数学。操作。物件。 27,第4期,819-840(2002). 摘要:我们考虑马尔可夫决策过程的分散控制,并给出了寻找最优解的算法在最坏情况下运行时间的复杂性界。描述了允许分散控制的完全可观测情况和部分可观测情况的推广。即使是两个主体,对于非确定性指数时间,与这两个模型相对应的有限时域问题也很难求解。这些复杂性结果说明了马尔可夫决策过程的集中控制和分散控制之间的根本区别。与涉及集中控制的问题相比,我们考虑的问题不允许多项式时间算法。此外,假设EXP\(\ not=\)NEXP,在最坏的情况下,这些问题需要超指数时间才能解决。 引用于44文件 MSC公司: 90C60型 数学规划问题的抽象计算复杂性 65年第68季度 算法和问题复杂性分析 90立方厘米 马尔可夫和半马尔可夫决策过程 93E03型 控制理论中的随机系统(一般) 关键词:计算复杂性;马尔可夫决策过程;分散控制 软件:POMDP公司 PDF格式BibTeX公司 XML格式引用 \textit{D.S.Bernstein}等人,《数学》。操作。第27号决议,第4号,819--840(2002;Zbl 1082.90593) 全文: DOI程序 arXiv公司