×

并发安全游戏的策略复杂性。 (英语) Zbl 1447.91018号

Larsen,Kim G.(编辑)等人,第42届计算机科学数学基础国际研讨会,2017年8月21日至25日,丹麦奥尔堡,MFCS 2017。Wadern:Schloss Dagstuhl–Leibniz Zentrum für Informatik。LIPIcs–莱布尼茨国际程序。通知。83,第55条,第13页(2017年)。
小结:我们考虑两人零和有限状态并发可达性游戏,游戏进行了无限多轮,其中每一轮中,每个玩家同时独立于其他玩家选择一个动作,然后,后继状态由当前状态和所选动作给定的概率分布确定。如果最终到达指定的目标状态,球员1获胜。我们对用耐心来衡量平稳策略的复杂性感兴趣,耐心被定义为所用最小非零概率的倒数。
我们的主要结果如下:我们证明了:(i)最优和(ε)最优策略的耐心的最优界对于两个参与者都是双指数的;(ii)即使是在具有单一非吸收状态指数(动作数)的游戏中,耐心也是必要的。
关于整个系列,请参见[Zbl 1376.68011号].

MSC公司:

91A20型 多阶段重复游戏
91A43型 涉及图形的游戏
91A05型 2人游戏
91A68型 算法博弈论与复杂性
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[2] R.Alur、T.Henzinger和O.Kupferman。交替时间时序逻辑。《美国医学会杂志》,49:672-7132002·Zbl 1326.68181号
[3] 查特吉。带有尾部目标的并发游戏。{\it理论计算机科学},388:181-1982007·兹比尔1177.91031
[4] K.Chatterjee、L.de Alfaro和T.Henzinger。定性并行平价游戏。{\it ACM}{\it ToCL},2011年·Zbl 1351.68179号
[5] K.Chatterjee、K.A.Hansen和R.Ibsen-Jensen。具有安全性和可达性目标的并发随机博弈的策略复杂性。{\it CoRR},abs/1506.024342015年。
[6] K.Chatterjee和R.Ibsen-Jensen。遍历意义回报游戏的复杂性。在{it ICALP 2014}中,第122-133页,2014年·Zbl 1410.68156号
[7] L.de Alfaro、T.Henzinger和F.Mang。同步系统的控制。在{it CON-}{it CUR'00}中,LNCS 1877,第458-473页。斯普林格,2000年·Zbl 0999.68531号
[8] L.de Alfaro、T.Henzinger和F.Mang。同步系统的控制,第二部分。在{it CONCUR'01},LNCS 2154,第566-580页。斯普林格,2001年·Zbl 1006.68534号
[9] L.de Alfaro、T.A.Henzinger和O.Kupferman。并发可达性游戏。{理论}{计算科学},386(3):188-2172007·Zbl 1154.91306号
[10] K.Etessami和M.Yannakakis。递归并发随机博弈。在{\it ICALP'06(2)},LNCS 4052,Springer,第324-335页,2006·Zbl 1133.91317号
[11] H.埃弗雷特。递归游戏。在{it CTG}中,{it AMS}第39卷,第47-78页,1957年·Zbl 0078.32802号
[12] J.Filar和K.Vrieze。{竞争马尔可夫决策过程}。Springer-Verlag,1997年·Zbl 0934.91002号
[13] K.A.Hansen、R.Ibsen Jensen和P.B.Miltersen。使用值和策略迭代求解可达性博弈的复杂性。在{it CSR}中,第77-90页,2011年·兹比尔1330.68112
[14] K·A·汉森、M·库克和P·B·米尔特森。赢得并发可达性游戏需要双重指数的耐心。在LICS中,第332-341页,2009年。
[15] C.J.Himmelberg、T.Parthasarathy、T.E.S.Raghavan和F.S.V.Vleck。随机博弈中{\itp}均衡和最优平稳策略的存在性。《程序美国数学》,第60:245-2511976页·Zbl 0358.90083号
[16] R.易卜生-延森。{双层零和博弈的策略复杂性}。奥胡斯大学博士论文,2013年。
[17] R.Ibsen-Jensen和P.B.Miltersen。用很少的投币位置求解简单的随机游戏。在《欧洲账户体系》第636-647页,2012年·Zbl 1365.68283号
[18] R.Lipton、E.Markakis和A.Mehta。使用简单的策略玩大型游戏。在{it EC}{it 03:电子商务}中,第36-41页。ACM出版社,2003年。
[19] P.B.Miltersen和T.B.Sörensen。一个接近最佳的策略,为一个不受限制的德克萨斯扑克锦标赛。在{it AAMAS’07}中,第191-197页,2007年。
[20] G.欧文。{博弈论}。学术出版社,1995年·Zbl 1284.91004号
[21] T.Parthasarathy公司。折扣和正随机博弈。{\it Bull.Amer.Math.Soc},77:134-1361971年·Zbl 0208.47401号
[22] A.Pnueli和R.Rosner。关于反应模的合成。在《流行文学杂志》第179-190页。ACM出版社,1989年·Zbl 0686.68015号
[23] P.J.Ramadge和W.M.Wonham。一类离散事件过程的监督控制。{SIAM控制与优化杂志},25(1):206-2301987·Zbl 0618.93033号
[24] L.沙普利。随机游戏。{\it PNAS},39:1095-11001953年·Zbl 0051.35805号
[25] E.Solan和N.Vieille。两人随机博弈中一致最优策略的计算。{经济理论},42(1):237-2532010·Zbl 1182.91030号
[26] M.瓦尔迪。概率并发有限状态系统的自动验证。在{it FOCS’85}中,第327-338页。IEEE,1985年。
[27] J.von Neumann和O.Morgenstern。{博弈论与经济行为}。普林斯顿大学出版社,1947年·Zbl 1241.91002号
[28] O.Vrieze和F.Thuijsman。关于具有吸收状态的重复博弈的均衡。{国际}{国家博弈论杂志},18(3):293-3101989·Zbl 0678.90107号
[29] O.Vrieze和S.Tijs。虚拟游戏适用于游戏序列和折扣随机游戏。{国际博弈论杂志},11(2):71-851982·Zbl 0497.90081号
[30] :13
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。