×

随机米勒博弈的复杂性。 (英语) Zbl 1238.91022号

摘要:具有(ω)-正则获胜条件的图对策理论是反应过程建模和综合的基础。在随机反应过程的情况下,相应的随机图游戏有三个参与者,其中两个(系统和环境)表现为敌对行为,第三个(不确定性)表现为概率行为。我们考虑随机图对策的两个问题:定性问题要求玩家以概率1获胜(几乎获胜)的状态集;定量问题要求每个状态的最大获胜概率(最优获胜)。我们考虑将正规获胜条件形式化为Müller获胜条件。我们给出了具有Müller获胜条件的随机图对策中纯(确定性)近似获胜和最优获胜策略的最优记忆界。我们还研究了随机Müller对策的复杂性,并证明了定性和定量分析问题都是PSPACE完备的。我们的结果与随机反应过程的综合有关。

MSC公司:

91A15型 随机对策,随机微分对策
91A43型 涉及图形的游戏
2017年第68季度 问题的计算难度(下限、完备性、近似难度等)
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Büchi,J.R。;Landweber,L.H.,通过有限状态策略求解序列条件,Trans。阿默尔。数学。《社会学杂志》,138295-311(1969)·Zbl 0182.02302号
[2] Chatterjee,K.,《带尾部目标的并发游戏》,Theoret。计算。科学。,388181-198(2007年)·Zbl 1177.91031号
[3] Chatterjee,K.,随机Müller对策的最优策略综合,(FoSSaCS’07。FoSSaCS´07,计算机讲义。科学。,第4423卷(2007),施普林格),138-152·Zbl 1195.68065号
[4] Chatterjee,K.,随机Müller游戏是PSPACE-完全的。FSTTCS’07,计算机课堂讲稿。科学。,第4855卷(2007),施普林格),436-448·Zbl 1135.91333号
[5] 查特吉,K。;de Alfaro,L。;Henzinger,T.A.,《随机性的交易记忆》(QEST’04(2004),IEEE计算机社会出版社),206-217
[6] 查特吉,K。;de Alfaro,L。;Henzinger,T.A.,随机Rabin和Streett博弈的复杂性,(ICALP’05。ICALP’05,计算机课堂讲稿。科学。,第3580卷(2005),施普林格),878-890·Zbl 1085.68060号
[7] 查特吉,K。;Henzinger,T.A.,随机奇偶博弈的策略改进和随机次指数算法,(STACS’06。STACS’06,计算机课堂讲稿。科学。,第3884卷(2006),施普林格),512-523·Zbl 1136.91322号
[8] 查特吉,K。;尤金斯基,M。;Henzinger,T.A.,简单随机平价博弈,(CSL’03。CSL’03,计算机课堂讲稿。科学。,第2803卷(2003),施普林格),100-113·Zbl 1116.68493号
[9] 查特吉,K。;尤金斯基,M。;Henzinger,T.A.,定量随机平价博弈,(SODA’04(2004),SIAM),114-123·Zbl 1318.91027号
[10] Condon,A.,《随机博弈的复杂性》,Inform。和计算。,96, 203-224 (1992) ·Zbl 0756.90103号
[11] Condon,A.,《简单随机游戏的算法》,(计算复杂性理论的进展。计算复杂性理论进展,DIMACS Ser.离散数学理论。计算科学,第13卷(1993年),Amer。数学。Soc.),51-73年·Zbl 0808.90141号
[12] Courcoubetis,C。;Yannakakis,M.,马尔可夫决策过程和常规事件,(ICALP’90。ICALP’90,计算机课堂讲稿。科学。,第443卷(1990),施普林格),336-349·Zbl 0765.68152号
[13] L.de Alfaro,概率系统的形式化验证,斯坦福大学博士论文,1997年。;L.de Alfaro,概率系统的形式验证,斯坦福大学博士论文,1997年。
[14] Dziembowski,S。;尤金斯基,M。;Walukiewicz,I.,赢得无限游戏需要多少内存?,(LICS´97(1997),IEEE计算机学会出版社),99-110
[15] de Alfaro,L。;Henzinger,T.A.,并发\(ω\)-规则游戏,(LICS´00(2000),IEEE计算机学会出版社),141-154
[16] Etessami,K。;Yannakakis,M.,递归马尔可夫决策过程和递归随机对策,(ICALP’05。ICALP’05,计算机课堂讲稿。科学。,第3580卷(2005),施普林格),891-903·Zbl 1085.68089号
[17] 菲拉尔,J。;Vrieze,K.,竞争马尔可夫决策过程(1997),Springer·Zbl 0934.91002号
[18] 古雷维奇,Y。;哈林顿,L.,《树、自动机和游戏》(STOC’82(1982),ACM出版社),60-65
[19] 霍恩,F.,《街头骰子》,《告密》。过程。莱特。,104, 1-9 (2007) ·Zbl 1184.68338号
[20] F.Horn,《Zielonka树上的随机果实》,收录于:STACS,2009年,第541-552页。;F.Horn,《Zielonka树上的随机果实》,见:STACS,2009年,第541-552页·Zbl 1236.91025号
[21] 亨特,P。;Dawar,A.,常规比赛的复杂性界限,(MFCS’05。MFCS’05,计算机课堂讲稿。科学。,第3688卷(2005),施普林格),495-506·Zbl 1156.68392号
[22] R.Majumdar,验证和控制的符号算法,博士论文,加州大学伯克利分校,2003年。;R.Majumdar,验证和控制的符号算法,博士论文,加州大学伯克利分校,2003年。
[23] Manna,Z。;Pnueli,A.,《反应和并发系统的时间逻辑:规范》(1992),Springer
[24] Martin,D.A.,《布莱克威尔游戏的确定性》,J.符号逻辑,63,1565-1581(1998)·Zbl 0926.03071号
[25] McIver,A.K。;Morgan,C.C.,《游戏、概率和定量微积分》qmμ,(LPAR’02。LPAR’02,《人工智能课堂讲稿》,第2514卷(2002年),施普林格出版社,292-310·Zbl 1023.68064号
[26] 尼文斯基,D.,有限状态系统无限行为的定点表征,理论。计算。科学。,189, 1-2, 1-69 (1997) ·Zbl 0893.68102号
[27] 普努利,A。;Rosner,R.,关于反应性模块的合成,(POPL’89(1989),ACM出版社),179-190
[28] Raghavan,T.E.S。;Filar,J.A.,《随机博弈的算法——一项调查》,《运筹学的ZOR-方法和模型》,35,437-472(1991)·Zbl 0736.90082号
[29] Ramadge,P.J。;Wonham,W.M.,一类离散事件过程的监督控制,SIAM J.控制优化。,25, 206-230 (1987) ·Zbl 0618.93033号
[30] Thomas,W.,《语言、自动机和逻辑》,(形式语言手册,第3卷(超越文字)(1997),Springer),389-455
[31] Zielonka,W.,《有限色图上的无限游戏与无限树上自动机的应用》,Theoret。计算。科学。,200, 1-2, 135-183 (1998) ·Zbl 0915.68120号
[32] Zielonka,W.,完全信息随机奇偶对策,(FoSSaCS \ 04。FoSSaCS´04,计算机讲义。科学。,第2987卷(2004年),施普林格出版社),499-513·Zbl 1126.68489号
[33] 美国兹威克。;Paterson,M.S.,图上平均回报博弈的复杂性,理论。计算。科学。,158, 343-359 (1996) ·Zbl 0871.68138号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。