×

欧米伽规则游戏的定量求解。 (英语) Zbl 1093.91001号

总结:我们考虑两层游戏,游戏进行了无限次的回合,并且有规律的获胜条件。游戏可能是并发的,因为玩家同时独立地选择他们的动作,并且是概率性的,因为这些动作决定了后继国家的概率分布。我们引入了定量博弈演算,并证明了在该演算中,赢得此类博弈的最大概率可以表示为不动点公式。我们发展了确定性和概率并发博弈的论据;作为一个特例,我们求解了具有欧米茄规则获胜条件的概率回合博弈,该条件也是开放的。我们还描述了获胜策略的最佳性和内存需求。特别地,我们表明,虽然无记忆策略足以在安全性和可达性条件下赢得游戏,但Büchi条件要求使用具有无限记忆的策略。与(varepsilon)最优相反,最优策略的存在性只有在具有安全获胜条件的博弈中才能得到保证。

MSC公司:

91A05型 2人游戏
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] A.Aziz,V.Singhal,F.Balarin,R.Brayton,A.Sangiovanni-Vincentelli,《它通常起作用:随机系统的时序逻辑》,载于:《计算机辅助验证》,《计算机科学讲义》,第939卷,纽约斯普林格出版社,1995年。;A.Aziz,V.Singhal,F.Balarin,R.Brayton,A.Sangiovanni-Vincentelli,《它通常起作用:随机系统的时序逻辑》,载于:《计算机辅助验证》,《计算机科学讲义》,第939卷,纽约斯普林格出版社,1995年。
[2] A.Bianco,L.de Alfaro,概率和非确定性系统的模型检验,摘自:软件技术和理论计算机科学基础,计算机科学讲稿,第1026卷,Springer,纽约,1995年,第499-513页。;A.Bianco,L.de Alfaro,概率和非确定性系统的模型检验,摘自:软件技术和理论计算机科学基础,计算机科学讲稿,第1026卷,纽约斯普林格,1995年,第499-513页·Zbl 1354.68167号
[3] Büchi,J。;Landweber,L.,通过有限状态策略求解序列条件,Trans。阿默尔。数学。《社会学杂志》,138295-311(1969)·Zbl 0182.02302号
[4] J.Burch,K.McMillan,E.Clarke,D.Dill,使用符号模型检查进行时序电路验证,摘自:第27届ACM/IEEE设计自动化会议论文集,佛罗里达州奥兰多,美国,1990年6月,第46-51页。;J.Burch,K.McMillan,E.Clarke,D.Dill,《使用符号模型检查进行时序电路验证》,载于:第27届ACM/IEEE设计自动化会议论文集,美国佛罗里达州奥兰多,1990年6月,第46-51页。
[5] Chang,C。;Keisler,H.,模型理论(1990),北荷兰:北荷兰阿姆斯特丹·Zbl 0697.03022号
[6] C.Courcoubetis,M.Yannakakis,马尔可夫决策过程和常规事件,摘自:Proc。第17届国际学术讨论会Aut.Lang.Prog。,《计算机科学讲义》,第443卷,施普林格出版社,纽约,1990年,第336-349页。;C.Courcoubetis,M.Yannakakis,马尔可夫决策过程和常规事件,摘自:Proc。第17届国际学术讨论会Aut.Lang.Prog。,计算机科学讲义,第443卷,Springer-Verlag,纽约,1990年,第336-349页·Zbl 0765.68152号
[7] L.de Alfaro,T.Henzinger,并行欧米伽规则游戏,摘自:第15届IEEE计算机科学逻辑研讨会论文集,2000年,第141-154页。;L.de Alfaro,T.Henzinger,并行欧米伽规则游戏,收录于:第15届IEEE计算机科学逻辑研讨会论文集,2000年,第141-154页。
[8] L.de Alfaro,T.Henzinger,O.Kupferman,并发可达性游戏,摘自:第39届IEEE计算机科学基础研讨会论文集,IEEE计算机社会出版社,马里兰州银泉,1998年,第564-575页。;L.de Alfaro,T.Henzinger,O.Kupferman,并发可达性游戏,收录于:第39届IEEE计算机科学基础研讨会论文集,IEEE计算机社会出版社,马里兰州银泉,1998年,第564-575页。
[9] L.de Alfaro,M.Kwiatkowska,G.Norman,D.Parker,R.Segala,使用MTBDD和Kronecker表示法对并发概率过程进行符号模型检查,收录于:TACAS:系统构建和分析的工具和算法,计算机科学讲义,第1785卷,Springer,纽约,2000年,第395-410页。;L.de Alfaro,M.Kwiatkowska,G.Norman,D.Parker,R.Segala,使用MTBDD和Kronecker表示法对并发概率过程进行符号模型检查,收录于:TACAS:系统构建和分析的工具和算法,计算机科学讲义,第1785卷,Springer,纽约,2000年,第395-410页·Zbl 0960.68109号
[10] E.Emerson,C.Jutla,树自动机,mu-calculus和确定性(扩展摘要),摘自:第32届IEEE计算机科学基础研讨会论文集,IEEE计算机社会出版社,马里兰州银泉,1991年,第368-377页。;E.Emerson,C.Jutla,树自动机,mu-calculus和确定性(扩展摘要),摘自:第32届IEEE计算机科学基础研讨会论文集,IEEE计算机社会出版社,马里兰州银泉,1991年,第368-377页。
[11] H.Everett,递归游戏,收录于:对游戏理论的贡献III,《数学研究年鉴》,第39卷,1957年,第47-78页。;H.Everett,递归游戏,收录于:对游戏理论的贡献III,《数学研究年鉴》,第39卷,1957年,第47-78页·Zbl 0078.32802号
[12] 菲拉尔,J。;Vrieze,K.,竞争马尔可夫决策过程(1997),Springer:Springer New York·Zbl 0934.91002号
[13] Y.Gurevich,L.Harrington,树,自动机和游戏,摘自:第14届ACM计算理论研讨会论文集,ACM出版社,纽约,1982年,第60-65页。;Y.Gurevich,L.Harrington,树,自动机和游戏,摘自:第14届ACM计算理论研讨会论文集,ACM出版社,纽约,1982年,第60-65页。
[14] M.Huth,M.Kwiatkowska,定量分析和模型检验,摘自:1997年第12届IEEE计算机科学逻辑研讨会论文集,第111-122页。;M.Huth,M.Kwiatkowska,定量分析和模型检验,摘自:1997年第12届IEEE计算机科学逻辑研讨会论文集,第111-122页。
[15] D.Kozen,《概率PDL》,载于:第15届ACM计算理论研讨会论文集,1983年,第291-297页。;D.Kozen,《概率PDL》,载于《第15届ACM计算理论研讨会论文集》,1983年,第291-297页。
[16] Kozen,D.,命题演算的结果,Theoret。计算。科学。,27, 3, 333-354 (1983) ·Zbl 0553.03007号
[17] 库马尔,P。;Shiau,T.,零和离散随机动态博弈中值的存在性和随机策略,SIAM J.控制优化。,19, 5, 617-634 (1981) ·Zbl 0474.93053号
[18] Manna,Z。;Pnueli,A.,《反应和并发系统的时间逻辑:规范》(1991),Springer:Springer New York·Zbl 0753.68003号
[19] Martin,D.,《布莱克威尔游戏的确定性》,J.符号逻辑,63,4,1565-1581(1998)·Zbl 0926.03071号
[20] A.McIver,关于概率内效率的推理(μ);A.McIver,关于概率内效率的推理
[21] McIver,A。;Morgan,C.,顺序程序中的Demonic、angelic和无界概率选择,Acta Inform。,37/4/5329-354(2001年)·Zbl 0971.68027号
[22] 麦克诺顿,R.,《在有限图上玩无限游戏》,安。纯粹应用。逻辑,65149-184(1993)·Zbl 0798.90151号
[23] 摩根,C。;McIver,A。;Seidel,K.,概率谓词变换,ACM Trans。掠夺。语言系统,18,3,325-353(1996)
[24] A.Mostowski,无限树的正则表达式和自动机的标准形式,收录于:计算理论,计算机科学讲义,第208卷,Springer,纽约,1984年,第157-168页。;A.Mostowski,无限树的正则表达式和自动机的标准形式,收录于:计算理论,计算机科学讲义,第208卷,Springer,纽约,1984年,第157-168页·Zbl 0612.68046号
[25] Owen,G.,《博弈论》(1995),学术出版社:纽约学术出版社·Zbl 0159.49201号
[26] Raghavan,T。;Filar,J.,《随机游戏的算法——一项调查》,《操作的ZOR-Methods模型》。研究,35,437-472(1991)·Zbl 0736.90082号
[27] S.Safra,关于(ω)的复杂性;S.Safra,关于(ω)的复杂性
[28] S.Safra,\(ω\)的指数确定;S.Safra,\(ω\)的指数确定
[29] Shapley,L.,《随机游戏》,Proc。国家。阿卡德。科学。美国,39,1095-1100(1953)·Zbl 0051.35805号
[30] Tarski,A.,《初等代数和几何的决策方法》(1951),加州大学出版社:加州大学伯克利分校,洛杉矶·Zbl 0044.25102号
[31] W.Thomas,《关于无限游戏中策略的综合》,载于:《第12届计算机科学理论方面年度研讨会论文集》,《计算机科学讲义》,第900卷,纽约斯普林格出版社,1995年,第1-13页。;W.Thomas,《关于无限游戏中策略的综合》,载于:《第12届计算机科学理论方面年度研讨会论文集》,《计算机科学讲义》,第900卷,纽约斯普林格出版社,1995年,第1-13页·Zbl 1379.68233号
[32] Thuijsman,F。;弗里泽,O.,糟糕的比赛,一个完全奖赏的随机游戏,Oper。Res.Spektrum,9,93-99(1987)·Zbl 0617.90103号
[33] M.Vardi,概率并发有限状态系统的自动验证,摘自:第26届IEEE计算机科学基础研讨会论文集,IEEE计算机社会出版社,马里兰州银泉,1985年,第327-338页。;M.Vardi,概率并发有限状态系统的自动验证,摘自:第26届IEEE计算机科学基础研讨会论文集,IEEE计算机社会出版社,马里兰州银泉,1985年,第327-338页。
[34] 瓦尔迪,M。;Wolper,P.,《关于无限计算的推理》,Inform。和计算。,115,1,1-37(1994年)·兹比尔0827.03009
[35] 冯·诺依曼,J。;Morgenstern,O.,《博弈与经济行为理论》(1947),普林斯顿大学出版社:普林斯顿大学出版社,新泽西州普林斯顿·Zbl 1241.91002号
[36] H.Weyl,冯·诺依曼提出的极小极大定理的初等证明,载于:《对游戏理论的贡献》,第一卷,《数学研究年鉴》,第24卷,普林斯顿大学出版社,新泽西州普林斯顿,1950年,第19-25页。;H.Weyl,冯·诺依曼(von Neumann)提出的极小极大定理的初等证明,载于:《对游戏理论的贡献》,第一卷,《数学研究年鉴》,第24卷,普林斯顿大学出版社,新泽西州普林斯顿,1950年,第19-25页·Zbl 0041.25402号
[37] Williams,D.,《鞅概率》(1991),剑桥大学出版社:剑桥大学出版社·Zbl 0722.60001号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。