具有可达性目标的多加权马尔可夫决策过程
帕特里夏
布耶
毛里西奥
冈萨雷斯
尼古拉斯
马基
米凯尔
Randour公司
在本文中,我们感兴趣的是双加权马尔可夫决策过程中调度器的综合,它既满足加权可达条件的百分位约束,又满足使用加权可达条件定义的随机变量期望值的定量约束。
这个问题的灵感来自电动汽车充电问题的模型化。
我们研究了当一个参数变化时问题的制图,并展示了如何通过两个优化问题序列获得部分制图。
我们讨论了该方法的完整性和可行性。
安德烈亚·奥兰迪尼(Andrea Orlandini)和马丁·齐默尔曼(Martin Zimmermann):
第九届国际研讨会论文集
游戏、自动机、逻辑和形式验证
(甘道夫2018),
2018年9月26日至28日,德国萨尔布吕肯,
理论计算机科学中的电子论文集
277,第250-264页。
出版日期:2018年9月7日。
ArXived公司
地点:
https://dx.doi.org/10.4204/EPTCS.277.18
围巾
PDF格式
中的引用
重建bibtex
,
XML格式
和
HTML格式
格式(近似值)。
评论和问题:
eptcs@eptcs.org
对于网站问题:
webmaster@eptcs.org