×

随机拉宾和斯特里特游戏的策略改进。 (英语) Zbl 1151.68474号

Baier,Christel(编辑)等人,CONCUR 2006–并发理论。第17届国际会议,CONCUR 2006,德国波恩,2006年8月27日至30日。诉讼程序。柏林:施普林格出版社(ISBN 978-3-540-37376-6/pbk)。计算机科学讲义4137,375-389(2006)。
摘要:随机图游戏是由两个玩家在具有概率转移的游戏图上进行的。我们考虑具有指定为Rabin或Streett目标的正规获胜条件的随机图对策。这些游戏分别是NP完成和coNP完成。在给定目标\(\Phi\)的状态\(s\)下,玩家的游戏值是玩家能够保证\(\Phi\)满足\(s\)的最大概率。我们提出了一种计算随机拉宾对策值的策略改进算法,其中改进步骤涉及求解马尔可夫决策过程(MDP)和非随机拉宾博弈。该算法还计算随机Streett博弈的值,但不能直接得出Streett目标的最优策略。然后,我们展示了如何通过求解某些非随机Street博弈来获得Street目标的最优策略。
关于整个系列,请参见[Zbl 1114.68001号].

MSC公司:

60年第68季度 规范和验证(程序逻辑、模型检查等)
65年第68季度 形式语言和自动机
68问题85 并发和分布式计算的模型和方法(进程代数、互模拟、转换网等)
91A15型 随机对策,随机微分对策
PDF格式BibTeX公司 XML格式引用
全文: 内政部