×

对称战略改进。 (英语) Zbl 1440.91005号

Halldórsson,Magnüs M.(编辑)等人,《自动化、语言和编程》。第42届国际学术讨论会,ICALP 2015,日本京都,2015年7月6日至10日。诉讼程序。第二部分。柏林:斯普林格。莱克特。注释计算。科学。9135, 388-400 (2015).
摘要:对称性是大多数两层零和游戏的固有定义,包括奇偶、平均值对弈和折扣对弈游戏。因此,不存在用于这些游戏的对称分析技术是非常令人惊讶的。我们开发了一种新的对称策略改进算法,在每次迭代中,两个参与者的策略都会同时得到改进。我们发现对称策略改进克服了Friedmann的陷阱,这动摇了传统策略改进潜力为多项式的信念。
关于整个系列,请参见[Zbl 1316.68013号].

MSC公司:

91A05型 2人游戏
65年第68季度 算法和问题复杂性分析

软件:

PGSolver公司
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] 阿鲁尔(Alur,R.)。;TA Henzinger;Kupferman,O.,交替时间时序逻辑,ACM杂志,49,5,672-713(2002)·Zbl 1326.68181号 ·doi:10.1145/585265.585270
[2] Berwanger,D。;Dawar,A。;亨特,P。;Kreutzer,S。;杜兰德,B。;Thomas,W.,《DAG-width and parity games》,STACS 2006,524-536(2006),海德堡:斯普林格·Zbl 1136.68447号 ·doi:10.1007/11672142_43
[3] 比约克隆德,H。;Vorobyov,S.,平均收益博弈的组合强次指数策略改进算法,离散应用。数学。,155, 2, 210-229 (2007) ·Zbl 1176.68087号 ·doi:10.1016/j.dam.2006.04.029
[4] A.Browne。;EM克拉克;Jha,S。;长,DE;Marrero,W.,评估不动点表达式的改进算法,TCS,178,1-2,237-255(1997)·Zbl 0901.68118号 ·doi:10.1016/S0304-3975(96)00228-9
[5] Condon,A.:关于简单随机游戏的算法。摘自:《计算复杂性理论进展》,第51-73页。美国数学学会(1993)·Zbl 0808.90141号
[6] de Alfaro,L.、Henzinger,T.A.、Majumdar,R.:从验证到控制:欧米茄常规目标的动态程序。In:程序。第279-290页(2001年)
[7] Emerson,E.A.,Jutla,C.S.:树自动机,微积分和确定性。In:程序。FOCS,第368-377页。IEEE计算机学会出版社,1991年10月
[8] 艾默生,EA;南卡罗来纳州朱特拉;西斯特拉,AP;Courcoubetis,C.,关于微积分片段的模型检验,计算机辅助验证,385-396(1993),海德堡:斯普林格·doi:10.1007/3-540-56922-7_32
[9] Emerson,E.A.,Lei,C.:Efcient模型检查命题演算的片段。In:程序。第267-278页。IEEE计算机学会出版社(1986)
[10] 费恩利,J。;Abramsky,S。;加沃勒,C。;基什内尔,C。;Meyer auf der Heide,F。;Spirakis,PG,《策略迭代的指数下限》,《自动机,语言与编程》,551-562(2010),海德堡:施普林格出版社·Zbl 1288.68089号 ·doi:10.1007/978-3-642-14162-1_46
[11] 费恩利,J。;EM克拉克;Voronkov,A.,《非公开战略改进》,《编程逻辑、人工智能和推理》,212-230(2010),海德堡:斯普林格出版社·Zbl 1310.91040号 ·doi:10.1007/978-3-642-17511-4_13
[12] Friedmann,O.:最新确定性策略迭代算法的指数下限。LMCS 7(3)(2011)·Zbl 1237.68087号
[13] 弗里德曼,O。;Günlük,O。;Woeginger,GJ,解线性规划和博弈的Zadeh枢轴规则的亚指数下界,整数规划和组合优化,192-206(2011),海德堡:施普林格,海德堡·Zbl 1341.90143号 ·doi:10.1007/978-3-642-20807-2_16
[14] Friedmann,O.,基于陷阱记忆的策略迭代的超多项式下限,《离散应用数学》,161,10-11,1317-1337(2013)·Zbl 1296.68067号 ·doi:10.1016/j.dam.2013.02.007
[15] 尤金斯基,M。;赖歇尔,H。;Tison,S.,解决平价游戏的小进度措施,STACS 2000,290-301(2000),海德堡:施普林格·Zbl 0962.68111号 ·doi:10.1007/3-540-46541-3_24
[16] Jurdzinski,M。;帕特森,M。;Zwick,U.,求解奇偶博弈的确定性次指数算法,SIAM J.Compute。,38, 4, 1519-1532 (2008) ·Zbl 1173.91326号 ·doi:10.1137/070686652
[17] Kozen,D.,命题演算的结果,TCS,27333-354(1983)·Zbl 0553.03007号 ·doi:10.1016/0304-3975(82)90125-6
[18] Lange,M.:通过降低SAT来解决平价游戏。In:Proc。国际游戏设计与验证研讨会(2005年)
[19] Lange,M.,Friedmann,O.:平价游戏求解器的PGSolver集合。技术报告,路德维希·马克西米利安大学信息研究所(2010年)
[20] Ludwig,W.,简单随机博弈问题的次指数随机算法,Inf.Compute。,117, 1, 151-155 (1995) ·Zbl 0827.90141号 ·doi:10.1006/inco.1995.1035
[21] McNaughton,R.,《有限图上的无限游戏》,Ann.Pure Appl。逻辑,65,2,149-184(1993)·Zbl 0798.90151号 ·doi:10.1016/0168-0072(93)90036-D
[22] Obdržálek,J.等人。;小华盛顿州亨特;Somenzi,F.,《树宽有界时快速多演算模型检查》,《计算机辅助验证》,80-92(2003),海德堡:斯普林格出版社·Zbl 1278.68188号 ·doi:10.1007/978-3-540-45069-6-7
[23] Piterman,N.:从非确定性Büchi和Streett自动机到确定性奇偶自动机。In:程序。第255-264页。IEEE计算机学会(2006)·Zbl 1125.68067号
[24] Puri,A.:混合系统和离散事件系统理论。加州大学伯克利分校计算机科学系博士论文(1995年)
[25] Schewe,S。;Arvind,V。;Prasad,S.,《大步解决平价游戏》,FSTTCS 2007:软件技术和理论计算机科学基础,449-460(2007),海德堡:斯普林格,海德伯格·Zbl 1135.68480号 ·doi:10.1007/978-3-540-77050-3_37
[26] Schewe,S。;卡明斯基,M。;Martini,S.,求解平价和收益博弈的最优策略改进算法,计算机科学逻辑,369-384(2008),海德堡:施普林格,海德堡·Zbl 1156.68478号 ·doi:10.1007/978-3-540-87531-4_27
[27] Schewe,S。;Finkbeiner,B。;埃西克,Z.,交替时间微积分的可满足性和有限模型性质,计算机科学逻辑,591-605(2006),海德堡:斯普林格·Zbl 1225.68124号 ·doi:10.1007/11874683_39
[28] Schewe,S。;Finkbeiner,B。;Puebla,G.,异步系统的合成,基于逻辑的程序合成与转换,127-142(2007),海德堡:施普林格·Zbl 1196.68142号 ·数字对象标识代码:10.1007/978-3-540-71410-110
[29] Schewe,S.、Trivedi,A.、Varghese,T.:对称战略改进(2015)。CoRR,abs/1501.06484·Zbl 1440.91005号
[30] 瓦尔迪,MY;拉森,KG;Skyum,S。;温斯克尔,G.,《用双向自动机推理过去》,自动机,语言和编程,628-641(1998),海德堡:斯普林格,海德伯格·Zbl 0909.03019号 ·doi:10.1007/BFb0055090
[31] Vöge,J。;尤尔金斯基,K。;艾默生,EA;Sistla,AP,解奇偶博弈的离散策略改进算法,计算机辅助验证,202-215(2000),海德堡:施普林格·Zbl 0974.68527号 ·doi:10.1007/10722167_18
[32] Wilke,T.:交替树自动机、奇偶博弈和模态演算。牛市。社会数学。贝尔格。2001年5月8日(2)·Zbl 0994.68079号
[33] Zielonka,W.,《有限色图上的无限游戏与无限树上自动机的应用》,Theor。计算。科学。,200, 1-2, 135-183 (1998) ·Zbl 0915.68120号 ·doi:10.1016/S0304-3975(98)00009-7
[34] 美国兹威克。;Paterson,MS,图上平均支付游戏的复杂性,理论计算机科学,158,1-2,343-359(1996)·Zbl 0871.68138号 ·doi:10.1016/0304-3975(95)00188-3
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。