库沙·埃特萨米(Kousha Etessami);Marta Kwiatkowska;Moshe Y.Vardi;米哈利斯·扬纳卡基斯-马尔可夫决策过程的多目标模型检验

lmcs:990个-计算机科学中的逻辑方法,2008年11月12日,第4卷第4期-https://doi.org/10.2168/LMCS-4(4:8)2008
马尔可夫决策过程的多目标模型检验第条

作者:Kousha Etessami;Marta Kwiatkowska;Moshe Y.Vardi;米哈利斯·扬纳卡基斯

    我们研究并提供了多目标模型检查的有效算法马尔可夫决策过程(MDP)问题。给定MDP、M和给定多个线性时间(\omega-常规或LTL)属性\varphi\_i,以及概率r\_i\epsilon[0,1],i=1,。。。,k、 我们问是否存在控制器的策略\sigma,对于所有i由\sigma控制的M的轨迹满足\varphi\_i至少是r_i提供一个算法来决定是否存在这样的策略,以及如果这样就产生了它,它在MDP大小的时间多项式中运行。这样的一种策略可能需要同时使用随机化和记忆。我们还考虑更一般的多目标\omega常规查询,我们用一个应用程序进行激励,以保证组合推理概率系统。请注意,可以在不同属性之间进行权衡:满足具有高概率的属性\varphi\_1可能需要满足\varphi \_2概率很低。将其视为多目标优化问题,我们需要有关“权衡曲线”或帕累托曲线的信息,以便最大化不同性质的概率。我们证明了一个人可以计算关于中一组ω-正则属性的近似Pareto曲线MDP大小的时间多项式。我们的定量上限使用LP方法。我们还研究定性多目标模型检查问题,我们表明可以对这些问题进行分析通过纯粹的图表理论方法,即使策略可能仍然需要随机化和记忆。


    资料来源:arXiv.org:0810.5728
    卷:第4卷第4期
    发布日期:2008年11月12日
    进口日期:2007年10月4日
    关键词:计算机科学-计算机科学中的逻辑,计算机科学-计算复杂性,计算机科学–计算机科学和博弈论,G.3,F.2,F.3.1,F.4.1
    基金:
      来源:OpenAIRE Graph
    • 设计验证的自动机理论方法; 资助单位:国家科学基金;代码:0311326
    • 发展线性时间模型检测技术; 资助单位:国家科学基金;代码:9988322
    • 游戏、固定点和近似研究; 资助单位:国家科学基金;代码:0728736
    • MRI:收购CITI Terascale集群(CTC); 资助单位:国家科学基金;代码:0216467

    65引用本文的文件

    咨询统计

    这个页面已经被浏览了1580次。
    本文的PDF已下载576次。