×

并发可达性游戏。 (英语) 兹比尔1154.91306

摘要:我们考虑具有可达性目标的并发两层博弈。在这样的游戏中,在每一轮中,玩家1和玩家2分别同时选择动作,这两个选择决定游戏的下一个状态。玩家1的目标是达到一组目标状态;玩家2的目标是防止这种情况发生。这些是零和博弈,可达性目标是最基本的目标之一:确定参与者1可以从中赢得博弈的状态集是控制理论和系统验证中的一个基本问题。根据玩家1达到目标的确定程度,有三种获胜状态。从第一类状态来看,玩家1有一个确定的策略来始终达到目标。从2类状态来看,玩家1有一个随机策略,以概率1达到目标。从类型3状态来看,玩家1对每一个真实的(varepsilon>0)都有一个随机策略,以达到概率大于(1-varepsilen)的目标。我们证明,对于有限状态空间,所有三组获胜状态都可以在多项式时间内计算:线性时间中的类型1状态,二次时间中的类型2和类型3状态。计算三组获胜状态的算法还可以构建获胜和败北策略。

MSC公司:

91A05型 2人游戏
91A15型 随机对策,随机微分对策
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 阿鲁尔(Alur,R.)。;亨辛格,T.A。;Kupferman,O.,《交替时间时序逻辑》,J.ACM,49,672-713(2002)·Zbl 1326.68181号
[2] Burch,J.R。;克拉克,E.M。;McMillan,K.L。;Dill,D.L。;Hwang,L.J.,符号模型检查:(10^{20})状态及其以外,通知。计算。,95, 2, 142-170 (1992) ·Zbl 0753.68066号
[3] Beeri,C.,关于关系数据库中函数和多值依赖的隶属度问题,ACM Trans。数据库系统。,5, 241-259 (1980) ·Zbl 0441.68118号
[4] Bertsekas,D.P.,《动态规划和最优控制》,第一卷,第二卷(1995年),雅典娜科学出版社·Zbl 0935.90037号
[5] 巴沙尔,T。;Olsder,G.J.,《动态非合作博弈论》(1982),学术出版社·Zbl 0479.90085号
[6] Bertsekas,D.P。;Tsitsiklis,J.N.,随机最短路径问题的分析,数学。操作。研究,16,3,580-595(1991)·Zbl 0751.90077号
[7] K.Chatterjee,L.de Alfaro,T.A.Henzinger,《数量并发奇偶博弈的复杂性》,收录于:Proc。SODA:ACM-SIAM交响乐团。《离散算法》,2006年,第678-687页;K.Chatterjee,L.de Alfaro,T.A.Henzinger,《数量并发奇偶博弈的复杂性》,收录于:Proc。SODA:ACM-SIAM交响乐团。离散算法,2006年,第678-687页·Zbl 1192.68430号
[8] K.Chatterjee,L.de Alfaro,T.A.Henzinger,并发可达性游戏的策略改进,收录于:QEST:IEEE Conf.定量评估系统,2006年;K.Chatterjee,L.de Alfaro,T.A.Henzinger,并发可达性游戏的策略改进,收录于:QEST:IEEE Conf.定量评估系统,2006年·Zbl 1269.91022号
[9] 查特吉,K。;尤尔津斯基,J。;Henzinger,T.A.,《简单随机奇偶博弈》(Computer Science Logic.Computer Science Logic,Lect.Notes in Comp.Sci.,vol.2803(2003),Springer-Verlag),100-113·Zbl 1116.68493号
[10] K.Chatterjee,J.Jurdzinski,T.A.Henzinger,《定量随机平价博弈》,摘自:Proc。SODA:ACM-SIAM交响乐团。《离散算法》,2004年,第114-123页;K.Chatterjee,J.Jurdzinski,T.A.Henzinger,《定量随机平价博弈》,摘自:Proc。SODA:ACM-SIAM交响乐团。《离散算法》,2004年,第114-123页·Zbl 1318.91027号
[11] Condon,A.,《随机博弈的复杂性》,Inform。计算。,96, 203-224 (1992) ·Zbl 0756.90103号
[12] Condon,A.,《简单随机游戏的算法》,(计算复杂性理论的进展。计算复杂性理论进展,离散数学和理论计算机科学DIMACS系列,第13卷(1993年),AMS),51-73·Zbl 0808.90141号
[13] 克利夫兰,R。;Steffen,B.,无交互模式演算的线性时间模型检查算法,(计算机辅助验证。计算机辅助验证,《计算机科学评论》,第575卷(1991年),Springer-Verlag),48-58
[14] C.Courcoubetis,M.Yannakakis,《验证有限状态概率程序的时间特性》,摘自:Proc。FOCS:IEEE交响乐。《计算机科学基础》,1988年,第338-354页;C.Courcoubetis,M.Yannakakis,《验证有限状态概率程序的时间特性》,摘自:Proc。FOCS:IEEE交响乐。计算机科学基础,1988年,第338-354页
[15] L.de Alfaro,概率系统的形式化验证。斯坦福大学博士论文,1997年。技术报告STAN-CS-TR-98-1601;L.de Alfaro,概率系统的形式化验证。斯坦福大学博士论文,1997年。技术报告STAN-CS-TR-98-1601
[16] L.de Alfaro,T.A.Henzinger,《并行欧米伽规则游戏》,收录于:Proc。LICS:IEEE交响乐团。《计算机科学中的逻辑》,2000年,第141-154页;L.de Alfaro,T.A.Henzinger,《并行欧米伽规则游戏》,收录于:Proc。LICS:IEEE交响乐团。《计算机科学中的逻辑》,2000年,第141-154页
[17] de Alfaro,L。;Majumdar,R.,《欧米伽规则游戏的定量解》,J.Compute。系统。科学。,68, 374-397 (2004) ·Zbl 1093.91001号
[18] Derman,C.,《有限状态马尔科夫决策过程》(1970),学术出版社·Zbl 0262.90001号
[19] E.A.Emerson,C.S.Jutla,树自动机,微积分和确定性(扩展抽象),in:Proc。FOCS:IEEE交响乐。《计算机科学基础》,1991年,第368-377页;E.A.Emerson,C.S.Jutla,树自动机,微积分和确定性(扩展抽象),in:Proc。FOCS:IEEE交响乐。计算机科学基础,1991年,第368-377页
[20] Etessami,K。;Yannakakis,M.,递归并发随机游戏,(国际自动机,语言与编程,国际自动机(Languages,and Programming),《计算机科学学报》,第4052卷(2006),Springer-Verlag),324-335·Zbl 1133.91317号
[21] Everett,H.,递归游戏,(对游戏理论的贡献III.对游戏理论III的贡献,《数学研究年鉴》,第39卷(1957年)),47-78·Zbl 0078.32802号
[22] Filar,J.A.,当控制状态转换的玩家从一个状态切换到另一个状态时,随机游戏的有序场属性,J.Optim。理论应用。,34, 4, 503-515 (1981) ·Zbl 0431.90094号
[23] 菲拉尔,J。;Vrieze,K.,竞争马尔可夫决策过程(1997),施普林格出版社·Zbl 0934.91002号
[24] 哈特,S。;谢里尔,M。;Pnueli,A.,概率并发程序的终止,ACM Trans。掠夺。语言系统。,5, 3, 356-380 (1983) ·Zbl 0511.68009号
[25] Immerman,N.,《量词的数量比磁带单元的数量好》,J.Compute。系统科学。,22, 384-406 (1981) ·Zbl 0486.03019号
[26] Isaacs,R.,《差异游戏》(1965),约翰·威利·Zbl 0152.38407号
[27] 尤金斯基,M。;库普夫曼,O。;Henzinger,T.A.,《公平交易概率》,(计算机科学逻辑,计算机科学逻辑部分注释,《计算机科学》,第2471卷(2002),Springer-Verlag),292-305·Zbl 1020.68060号
[28] Jones,N.D.,组合问题中的空间边界可约性,J.Compute。系统科学。,11, 68-75 (1975) ·Zbl 0317.02039号
[29] M.Jurdziñski,M.Paterson,U.Zwick,求解奇偶博弈的确定性次指数算法,in:Proc。SODA:ACM-SIAM交响乐团。《离散算法》,2006年,第117-123页;M.Jurdziñski,M.Paterson,U.Zwick,求解奇偶博弈的确定性次指数算法,in:Proc。SODA:ACM-SIAM交响乐团。离散算法,2006年,第117-123页·Zbl 1192.91013号
[30] Jurdziñski,M.,《解决平价游戏的小进步措施》,(《计算机科学的理论方面》交响曲,《计算机科学理论方面》,《计算机科技评论》,第1770卷(2000年),斯普林格-Verlag),290-301·Zbl 0962.68111号
[31] Kumar,P.R。;Shiau,T.H.,零和离散随机动态博弈中值的存在性和随机策略,SIAM J.控制优化。,19, 5, 617-634 (1981) ·Zbl 0474.93053号
[32] Kemeny,J.G。;斯内尔,J.L。;Knapp,A.W.,可数马尔可夫链(1966),D.Van Nostrand公司·Zbl 0149.13301号
[33] Martin,D.A.,《Borel确定性的扩展》,Ann.Pure Appl。逻辑,49,279-293(1990)·Zbl 0721.03036号
[34] Martin,D.A.,《布莱克威尔游戏的确定性》,J.符号逻辑,63,4,1565-1581(1998)·Zbl 0926.03071号
[35] 奥斯本,M.J。;Rubinstein,A.,《博弈论课程》(1994),麻省理工出版社·兹比尔1194.91003
[36] A.Pnueli,R.Rosner,《关于反应性模块的合成》,摘自:Proc。流行乐:ACM Symp。《程序设计语言原理》,1989年,第179-190页;A.Pnueli,R.Rosner,《关于反应性模块的合成》,摘自:Proc。流行乐:ACM Symp。《程序设计语言原理》,1989年,第179-190页·兹伯利0686.68015
[37] Ramadge,P.J.G。;Wonham,W.M.,《离散事件系统的控制》,IEEE Trans。控制理论,77,81-98(1989)
[38] Secchi,P.,递归游戏的静态策略,数学。操作。决议,22,2,494-512(1997)·Zbl 0883.90125号
[39] Shapley,L.S.,《随机游戏》,Proc。国家。阿卡德。科学。美国,39,1095-1100(1953)·Zbl 0051.35805号
[40] Thomas,W.,《无限物体上的自动机》(van Leeuwen,J.,《理论计算机科学手册》,第B卷(1990),爱思唯尔科学出版社),135-191,(第4章)·Zbl 0900.68316号
[41] Thomas,W.,《关于无限游戏中策略的综合》,(Symp.计算机科学的理论方面,Symp.Comp.Sci.Lect.Notes,vol.900(1995),Springer-Verlag),1-13·Zbl 1379.68233号
[42] Thuijsman,F。;O.J.Vrieze,《糟糕的比赛,一个完全奖赏的随机游戏》,OR Spectrum,993-99(1987)·Zbl 0617.90103号
[43] M.Y.Vardi,概率并发有限状态系统的自动验证,in:Proc。FOCS:IEEE交响乐。《计算机科学基础》,1985年,第327-338页;M.Y.Vardi,概率并发有限状态系统的自动验证,in:Proc。FOCS:IEEE交响乐。计算机科学基础,1985年,第327-338页
[44] Vöge,J。;Jurdziñski,M.,求解奇偶博弈的离散策略改进算法,(计算机辅助验证。计算机辅助验证,《计算机科学学报》,第1855卷(2000年),Springer-Verlag),202-215·Zbl 0974.68527号
[45] 冯·诺依曼,J.,《数学理论》。安,100295-320(1928)·JFM 54.0543.02型
[46] O.J.弗里泽。;蒂吉斯,S.H。;Raghavan,T.E.S。;Filar,J.A.,开关控制器随机博弈的有限算法,OR Spectrum,5,15-24(1983)·Zbl 0504.90088号
[47] M.Yannakakis,《个人沟通》,1998年;M.Yannakakis,《个人沟通》,1998年
[48] 美国兹威克。;Paterson,M.,图上平均支付游戏的复杂性,Theoret。计算。科学。,158, 343-359 (1996) ·Zbl 0871.68138号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。