马尔可夫决策过程的多目标模型检验第条
作者:Kousha Etessami;Marta Kwiatkowska;Moshe Y.Vardi;米哈利斯·扬纳卡基斯
空##空##NULL空##
库沙·埃特萨米(Kousha Etessami);Marta Kwiatkowska;Moshe Y.Vardi;米哈利斯·扬纳卡基斯
我们研究并提供了多目标模型检查的有效算法马尔可夫决策过程(MDP)问题。给定MDP、M和给定多个线性时间(\omega-常规或LTL)属性\varphi\_i,以及概率r\_i\epsilon[0,1],i=1,。。。,k、 我们问是否存在控制器的策略\sigma,对于所有i由\sigma控制的M的轨迹满足\varphi\_i至少是r_i提供一个算法来决定是否存在这样的策略,以及如果这样就产生了它,它在MDP大小的时间多项式中运行。这样的一种策略可能需要同时使用随机化和记忆。我们还考虑更一般的多目标\omega常规查询,我们用一个应用程序进行激励,以保证组合推理概率系统。请注意,可以在不同属性之间进行权衡:满足具有高概率的属性\varphi\_1可能需要满足\varphi \_2概率很低。将其视为多目标优化问题,我们需要有关“权衡曲线”或帕累托曲线的信息,以便最大化不同性质的概率。我们证明了一个人可以计算关于中一组ω-正则属性的近似Pareto曲线MDP大小的时间多项式。我们的定量上限使用LP方法。我们还研究定性多目标模型检查问题,我们表明可以对这些问题进行分析通过纯粹的图表理论方法,即使策略可能仍然需要随机化和记忆。
卷:第4卷第4期
发布日期:2008年11月12日
进口日期:2007年10月4日
关键词:计算机科学-计算机科学中的逻辑,计算机科学-计算复杂性,计算机科学–计算机科学和博弈论,G.3,F.2,F.3.1,F.4.1
基金: 来源:OpenAIRE Graph- 设计验证的自动机理论方法; 资助单位:国家科学基金;代码:0311326
- 发展线性时间模型检测技术; 资助单位:国家科学基金;代码:9988322
- 游戏、固定点和近似研究; 资助单位:国家科学基金;代码:0728736
- MRI:收购CITI Terascale集群(CTC); 资助单位:国家科学基金;代码:0216467