×

复杂排队系统中的值函数近似。 (英语) Zbl 1375.90086号

Boucherie,Richard J.(编辑)等人,《实践中的马尔可夫决策过程》。查姆:施普林格(ISBN 978-3-319-47764-0/hbk;978-3-3169-47766-4/电子书)。运筹学与管理科学国际系列248,33-62(2017)。
摘要:马尔可夫决策理论在排队系统控制中的应用通常会导致具有巨大状态空间的模型。因此,对于大多数实际模型来说,使用标准技术和算法直接计算最优策略几乎是不可能的。解决此问题的一种方便方法是使用一步策略改进。要使这项技术发挥作用,需要对研究中的排队系统及其在将系统分解为较不复杂系统的策略下的(近似)值函数有很好的了解。这保证了对简单排队模型相对值函数的研究,该模型可用于更复杂的排队系统的控制。在本章中,我们对基本排队模型的值函数进行了综述,并展示了它们如何应用于更复杂的排队系统的控制。
关于整个系列,请参见[Zbl 1369.90001号].

MSC公司:

90B22型 运筹学中的排队与服务
90立方厘米 动态编程
PDF格式BibTeX公司 XML格式引用
全文: DOI程序