具有可达性目标的多加权马尔可夫决策过程

帕特里夏布耶
毛里西奥冈萨雷斯
尼古拉斯马基
米凯尔Randour公司

在本文中,我们感兴趣的是双加权马尔可夫决策过程中调度器的综合,它既满足加权可达条件的百分位约束,又满足使用加权可达条件定义的随机变量期望值的定量约束。这个问题的灵感来自电动汽车充电问题的模型化。我们研究了当一个参数变化时问题的制图,并展示了如何通过两个优化问题序列获得部分制图。我们讨论了该方法的完整性和可行性。

安德烈亚·奥兰迪尼(Andrea Orlandini)和马丁·齐默尔曼(Martin Zimmermann):第九届国际研讨会论文集游戏、自动机、逻辑和形式验证(甘道夫2018),2018年9月26日至28日,德国萨尔布吕肯,理论计算机科学中的电子论文集277,第250-264页。
出版日期:2018年9月7日。

ArXived公司地点:https://dx.doi.org/10.4204/EPTCS.277.18 围巾 PDF格式
中的引用重建bibtex,XML格式HTML格式格式(近似值)。
评论和问题: eptcs@eptcs.org
对于网站问题: webmaster@eptcs.org