Multi-weighted Markov Decision Processes with Reachability Objectives

Bouyer, Patricia; González, Mauricio; Markey, Nicolas; Randour, Mickael

具有可达性目标的多加权马尔可夫决策过程

帕特里夏布耶

毛里西奥冈萨雷斯

尼古拉斯马基

米凯尔Randour公司

在本文中，我们感兴趣的是双加权马尔可夫决策过程中调度器的综合，它既满足加权可达条件的百分位约束，又满足使用加权可达条件定义的随机变量期望值的定量约束。这个问题的灵感来自电动汽车充电问题的模型化。我们研究了当一个参数变化时问题的制图，并展示了如何通过两个优化问题序列获得部分制图。我们讨论了该方法的完整性和可行性。

安德烈亚·奥兰迪尼（Andrea Orlandini）和马丁·齐默尔曼（Martin Zimmermann）：第九届国际研讨会论文集游戏、自动机、逻辑和形式验证（甘道夫2018），2018年9月26日至28日，德国萨尔布吕肯，理论计算机科学中的电子论文集277，第250-264页。
出版日期：2018年9月7日。

ArXived公司地点：https://dx.doi.org/10.4204/EPTCS.277.18	围巾	PDF格式

中的引用重建bibtex,XML格式和HTML格式格式（近似值）。

评论和问题：

eptcs@eptcs.org

对于网站问题：

webmaster@eptcs.org