文件Open Access徽标

并发安全游戏的策略复杂性

作者 克里希南德·查特吉, 克里斯托弗·阿恩斯费尔特·汉森, 拉斯穆斯·易卜生-延森



PDF格式
缩略图PDF

文件

LIPIcs公司。MFCS.2017.55.pdf格式
  • 文件大小:0.52 MB
  • 13页

文件标识符

作者详细信息

克里希南德·查特吉
克里斯托弗·阿恩斯费尔特·汉森
拉斯穆斯·易卜生-延森

引用为获取BibTex

克里希南德·查特吉(Krishnendu Chatterjee)、克里斯托弗·阿恩斯费尔特·汉森(Kristoffer Arnsfelt Hansen)和拉斯穆斯·易卜森·延森(Rasmus Ibsen-Jensen)。并发安全游戏的策略复杂性。在第42届计算机科学数学基础国际研讨会(MFCS 2017)上。莱布尼茨国际信息学论文集(LIPIcs),第83卷,第55:1-55:13页,达格斯图尔-莱布尼兹-泽特鲁姆信息学研究所(2017)
https://doi.org/10.4230/LIPIcs.MFCS.2017.55

摘要

我们考虑两个玩家,零和,有限状态并发可达性游戏,玩了无限多轮,其中每一轮,每个玩家同时独立于其他玩家选择一个动作,然后,后继状态由当前状态和所选动作给定的概率分布确定。如果最终访问了指定的进球状态,则玩家1获胜。我们对用耐心来衡量平稳策略的复杂性感兴趣,耐心被定义为所用最小非零概率的倒数。我们的主要结果如下:我们证明:(i)最优和ε最优策略的耐心的最优界,对于两个参与者来说都是双指数的;(ii)即使是在具有单一非吸收状态指数(动作数)的游戏中,耐心也是必要的。
关键词
  • 并发游戏
  • 可达性和安全性
  • 策略的耐心

韵律学

工具书类

  1. R.Alur、T.A.Henzinger和O.Kupferman。交替时间时序逻辑。美国医学会杂志,49:672-7132002。谷歌学者
  2. 查特吉。带有尾部目标的并发游戏。理论计算机科学,388:181-1982007。谷歌学者
  3. K.Chatterjee、L.de Alfaro和T.A.Henzinger。定性并行平价游戏。ACM ToCL,2011年。谷歌学者
  4. 克里希南德·查特吉(Krishnendu Chatterjee)、克里斯托弗·阿恩斯费尔特·汉森(Kristoffer Arnsfelt Hansen)和拉斯穆斯·易卜森·延森(Rasmus Ibsen-Jensen)。具有安全性和可达性目标的并发随机博弈的策略复杂性。CoRR,abs/1506.024342015年。网址:http://arxiv.org/abs/1506.02434.
  5. 克里希南德·查特吉(Krishnendu Chatterjee)和拉斯穆斯·易卜森·延森(Rasmus Ibsen-Jensen)。遍历意义回报游戏的复杂性。在ICALP 2014中,第122-1332014页。谷歌学者
  6. L.de Alfaro、T.A.Henzinger和F.Y.C.Mang。同步系统的控制。CONCUR'00,LNCS 1877,第458-473页。斯普林格,2000年。谷歌学者
  7. L.de Alfaro、T.A.Henzinger和F.Y.C.Mang。同步系统的控制,第二部分。在CONCUR’01中,LNCS 2154,第566-580页。斯普林格,2001年。谷歌学者
  8. 卢卡·德·阿尔法罗(Luca de Alfaro)、托马斯·汉津格(Thomas A.Henzinger)和奥尔娜·库普夫曼(Orna Kupferman)。并发可达性游戏。西奥。计算。科学,386(3):188-2172007。谷歌学者
  9. K.Etessami和M.Yannakakis。递归并发随机博弈。在ICALP’06(2),LNCS 4052,Springer,第324-3352006页。谷歌学者
  10. H.埃弗雷特。递归游戏。在CTG中,AMS第39卷,第47-78页,1957年。谷歌学者
  11. J.Filar和K.Vrieze。竞争马尔可夫决策过程。Springer-Verlag,1997年。谷歌学者
  12. K.A.Hansen、R.Ibsen-Jensen和P.B.Miltersen。使用值和策略迭代求解可达性博弈的复杂性。《企业社会责任》,第77-90页,2011年。谷歌学者
  13. K.A.Hansen、M.Koucký和P.B.Miltersen。赢得并发可达性游戏需要双重指数的耐心。在LICS中,第332-341页,2009年。谷歌学者
  14. C.J.Himmelberg、T.Parthasarathy、T.E.S.Raghavan和F.S.Van Vleck。随机博弈中p-均衡和最优平稳策略的存在性。程序。阿默尔。数学。Soc.,60:245-2511976年。谷歌学者
  15. R.易卜生-延森。两层零和游戏的策略复杂性。奥胡斯大学博士论文,2013年。谷歌学者
  16. 拉斯穆斯·易卜森·延森(Rasmus Ibsen-Jensen)和彼得·布罗·米尔特森(Peter Bro Miltersen)。用很少的投币位置求解简单的随机游戏。《欧洲账户体系》,第636-647页,2012年。谷歌学者
  17. R.J.Lipton、E.Markakis和A.Mehta。使用简单的策略玩大型游戏。EC 03:电子商务,第36-41页。ACM出版社,2003年。谷歌学者
  18. P.B.Miltersen和T.B.Sörensen。一个接近最佳的策略,为一个不受限制的德克萨斯扑克锦标赛。AAMAS’07,第191-197页,2007年。谷歌学者
  19. G.欧文。博弈论。学术出版社,1995年。谷歌学者
  20. T.Parthasarathy公司。折扣和正随机博弈。牛市。阿默尔。数学。Soc,77:134-1361971年。谷歌学者
  21. A.Pnueli和R.Rosner。关于反应模的合成。过程中。第179-190页。ACM出版社,1989年。谷歌学者
  22. P.J.Ramadge和W.M.Wonham。一类离散事件过程的监督控制。SIAM控制与优化期刊,25(1):206-2301987。谷歌学者
  23. L.S.沙普利。随机游戏。美国国家科学院院刊,39:1095-11001953年。谷歌学者
  24. 艾伦·索兰和尼古拉斯·维耶。计算两层随机对策中的一致最优策略。经济理论,42(1):237-2532010。谷歌学者
  25. M.Y.瓦尔迪。概率并发有限状态系统的自动验证。在FOCS’85中,第327-338页。IEEE,1985年。谷歌学者
  26. J.von Neumann和O.Morgenstern。博弈论与经济行为。普林斯顿大学出版社,1947年。谷歌学者
  27. O.J.Vrieze和F.Thuijsman。关于具有吸收状态的重复博弈的均衡。国际博弈论杂志,18(3):293-3101989。谷歌学者
  28. O.J.Vrieze和S.H.Tijs。虚拟游戏适用于游戏序列和折扣随机游戏。国际博弈论杂志,11(2):71-851982。谷歌学者
问题/备注/反馈
X(X)

Dagstuhl出版社反馈


感谢您的反馈!

已提交反馈

无法发送消息

请稍后再试或发送电子邮件