Strategy Complexity of Concurrent Safety Games

Chatterjee, Krishnendu; Hansen, Kristoffer Arnsfelt; Ibsen-Jensen, Rasmus

doi:10.4230/LIPIcs.MFCS.2017.55

并发安全游戏的策略复杂性

作者详细信息

克里希南德·查特吉

克里斯托弗·阿恩斯费尔特·汉森

拉斯穆斯·易卜生-延森

引用为获取BibTex

克里希南德·查特吉（Krishnendu Chatterjee）、克里斯托弗·阿恩斯费尔特·汉森（Kristoffer Arnsfelt Hansen）和拉斯穆斯·易卜森·延森（Rasmus Ibsen-Jensen）。并发安全游戏的策略复杂性。在第42届计算机科学数学基础国际研讨会（MFCS 2017）上。莱布尼茨国际信息学论文集（LIPIcs），第83卷，第55:1-55:13页，达格斯图尔-莱布尼兹-泽特鲁姆信息学研究所（2017）
https://doi.org/10.4230/LIPIcs.MFCS.2017.55

@会议记录{chatterjee_et_al：LIPIcs.MFCS.2017.55，作者={Chatterjee、Krishnendu和Hansen、Kristoffer Arnsfelt和Ibsen-Jensen、Rasmus}，title={{并发安全游戏的策略复杂性}}，booktitle={第42届计算机科学数学基础国际研讨会（MFCS 2017）}，页数={55:1--55:13}，series={Leibniz国际信息学论文集（LIPIcs）}，国际标准图书编号={978-3-95977-046-0}，ISSN={1868-8969}，年份={2017年}，体积={83}，editor={Larsen，Kim G.和Bodlaender，Hans L.和Raskin，Jean-Francois}，publisher={Schloss Dagstuhl--Leibniz Zentrum f{\“u}r Informatik}，地址={Dagstuhl，德国}，URL={https://drops-dev.dagstuhl.de/entities/document/10.4230/LIPIcs.MFCS.2017.55},URN={URN:nbn:de:0030-drops-81203}，doi={10.4230/LIPIcs.MFCS.2017.55}，annote={关键词：并发游戏、可达性和安全性、策略的耐心}}

<trans data-src="@InProceedings{chatterjee_et_al:LIPIcs.MFCS.2017.55,">@会议记录{chatterjee_et_al：LIPIcs.MFCS.2017.55，</trans><trans data-src="author =	{Chatterjee, Krishnendu and Hansen, Kristoffer Arnsfelt and Ibsen-Jensen, Rasmus},">作者={Chatterjee、Krishnendu和Hansen、Kristoffer Arnsfelt和Ibsen-Jensen、Rasmus}，</trans><trans data-src="title =	{{Strategy Complexity of Concurrent Safety Games}},">title={{并发安全游戏的策略复杂性}}，</trans><trans data-src="booktitle =	{42nd International Symposium on Mathematical Foundations of Computer Science (MFCS 2017)},">booktitle={第42届计算机科学数学基础国际研讨会（MFCS 2017）}，</trans><trans data-src="pages =	{55:1--55:13},">页数={55:1--55:13}，</trans><trans data-src="series =	{Leibniz International Proceedings in Informatics (LIPIcs)},">series={Leibniz国际信息学论文集（LIPIcs）}，</trans><trans data-src="ISBN =	{978-3-95977-046-0},">国际标准图书编号={978-3-95977-046-0}，</trans><trans data-src="ISSN =	{1868-8969},">ISSN={1868-8969}，</trans><trans data-src="year =	{2017},">年份={2017年}，</trans><trans data-src="volume =	{83},">体积={83}，</trans><trans data-src="editor =	{Larsen, Kim G. and Bodlaender, Hans L. and Raskin, Jean-Francois},">editor={Larsen，Kim G.和Bodlaender，Hans L.和Raskin，Jean-Francois}，</trans><trans data-src="publisher =	{Schloss Dagstuhl -- Leibniz-Zentrum f{\"u}r Informatik},">publisher={Schloss Dagstuhl--Leibniz Zentrum f{\“u}r Informatik}，</trans><trans data-src="address =	{Dagstuhl, Germany},">地址={Dagstuhl，德国}，</trans><trans data-src="URL =		{">URL={</trans><trans data-src="https://drops-dev.dagstuhl.de/entities/document/10.4230/LIPIcs.MFCS.2017.55">https://drops-dev.dagstuhl.de/entities/document/10.4230/LIPIcs.MFCS.2017.55</trans><trans data-src="},">},</trans><trans data-src="URN =		{urn:nbn:de:0030-drops-81203},">URN={URN:nbn:de:0030-drops-81203}，</trans><trans data-src="doi =		{10.4230/LIPIcs.MFCS.2017.55},">doi={10.4230/LIPIcs.MFCS.2017.55}，</trans><trans data-src="annote =	{Keywords: Concurrent games, Reachability and safety, Patience of strategies}">annote={关键词：并发游戏，可达性和安全，策略耐心}</trans><trans data-src="}">}</trans>

摘要

我们考虑两个玩家，零和，有限状态并发可达性游戏，玩了无限多轮，其中每一轮，每个玩家同时独立于其他玩家选择一个动作，然后，后继状态由当前状态和所选动作给定的概率分布确定。如果最终访问了指定的进球状态，则玩家1获胜。我们对用耐心来衡量平稳策略的复杂性感兴趣，耐心被定义为所用最小非零概率的倒数。我们的主要结果如下：我们证明：（i）最优和ε最优策略的耐心的最优界，对于两个参与者来说都是双指数的；（ii）即使是在具有单一非吸收状态指数（动作数）的游戏中，耐心也是必要的。

工具书类

R.Alur、T.A.Henzinger和O.Kupferman。交替时间时序逻辑。美国医学会杂志，49:672-7132002。
查特吉。带有尾部目标的并发游戏。理论计算机科学，388:181-1982007。
K.Chatterjee、L.de Alfaro和T.A.Henzinger。定性并行平价游戏。ACM ToCL，2011年。
克里希南德·查特吉（Krishnendu Chatterjee）、克里斯托弗·阿恩斯费尔特·汉森（Kristoffer Arnsfelt Hansen）和拉斯穆斯·易卜森·延森（Rasmus Ibsen-Jensen）。具有安全性和可达性目标的并发随机博弈的策略复杂性。CoRR，abs/1506.024342015年。网址：http://arxiv.org/abs/1506.02434.
克里希南德·查特吉（Krishnendu Chatterjee）和拉斯穆斯·易卜森·延森（Rasmus Ibsen-Jensen）。遍历意义回报游戏的复杂性。在ICALP 2014中，第122-1332014页。
L.de Alfaro、T.A.Henzinger和F.Y.C.Mang。同步系统的控制。CONCUR'00，LNCS 1877，第458-473页。斯普林格，2000年。
L.de Alfaro、T.A.Henzinger和F.Y.C.Mang。同步系统的控制，第二部分。在CONCUR’01中，LNCS 2154，第566-580页。斯普林格，2001年。
卢卡·德·阿尔法罗（Luca de Alfaro）、托马斯·汉津格（Thomas A.Henzinger）和奥尔娜·库普夫曼（Orna Kupferman）。并发可达性游戏。西奥。计算。科学，386（3）：188-2172007。
K.Etessami和M.Yannakakis。递归并发随机博弈。在ICALP’06（2），LNCS 4052，Springer，第324-3352006页。
H.埃弗雷特。递归游戏。在CTG中，AMS第39卷，第47-78页，1957年。
J.Filar和K.Vrieze。竞争马尔可夫决策过程。Springer-Verlag，1997年。
K.A.Hansen、R.Ibsen-Jensen和P.B.Miltersen。使用值和策略迭代求解可达性博弈的复杂性。《企业社会责任》，第77-90页，2011年。
K.A.Hansen、M.Koucký和P.B.Miltersen。赢得并发可达性游戏需要双重指数的耐心。在LICS中，第332-341页，2009年。
C.J.Himmelberg、T.Parthasarathy、T.E.S.Raghavan和F.S.Van Vleck。随机博弈中p-均衡和最优平稳策略的存在性。程序。阿默尔。数学。Soc.，60:245-2511976年。
R.易卜生-延森。两层零和游戏的策略复杂性。奥胡斯大学博士论文，2013年。
拉斯穆斯·易卜森·延森（Rasmus Ibsen-Jensen）和彼得·布罗·米尔特森（Peter Bro Miltersen）。用很少的投币位置求解简单的随机游戏。《欧洲账户体系》，第636-647页，2012年。
R.J.Lipton、E.Markakis和A.Mehta。使用简单的策略玩大型游戏。EC 03：电子商务，第36-41页。ACM出版社，2003年。
P.B.Miltersen和T.B.Sörensen。一个接近最佳的策略，为一个不受限制的德克萨斯扑克锦标赛。AAMAS’07，第191-197页，2007年。
G.欧文。博弈论。学术出版社，1995年。
T.Parthasarathy公司。折扣和正随机博弈。牛市。阿默尔。数学。Soc，77:134-1361971年。
A.Pnueli和R.Rosner。关于反应模的合成。过程中。第179-190页。ACM出版社，1989年。
P.J.Ramadge和W.M.Wonham。一类离散事件过程的监督控制。SIAM控制与优化期刊，25（1）：206-2301987。
L.S.沙普利。随机游戏。美国国家科学院院刊，39:1095-11001953年。
艾伦·索兰和尼古拉斯·维耶。计算两层随机对策中的一致最优策略。经济理论，42（1）：237-2532010。
M.Y.瓦尔迪。概率并发有限状态系统的自动验证。在FOCS’85中，第327-338页。IEEE，1985年。
J.von Neumann和O.Morgenstern。博弈论与经济行为。普林斯顿大学出版社，1947年。
O.J.Vrieze和F.Thuijsman。关于具有吸收状态的重复博弈的均衡。国际博弈论杂志，18（3）：293-3101989。
O.J.Vrieze和S.H.Tijs。虚拟游戏适用于游戏序列和折扣随机游戏。国际博弈论杂志，11（2）：71-851982。

并发安全游戏的策略复杂性

作者克里希南德·查特吉, 克里斯托弗·阿恩斯费尔特·汉森, 拉斯穆斯·易卜生-延森

文件

文件标识符

作者详细信息

引用为获取BibTex

摘要

关键词

韵律学

工具书类

感谢您的反馈！

无法发送消息

并发安全游戏的策略复杂性

作者 克里希南德·查特吉, 克里斯托弗·阿恩斯费尔特·汉森, 拉斯穆斯·易卜生-延森

文件

文件标识符

作者详细信息

引用为获取BibTex

摘要

关键词

韵律学

工具书类

感谢您的反馈！

无法发送消息

作者克里希南德·查特吉, 克里斯托弗·阿恩斯费尔特·汉森, 拉斯穆斯·易卜生-延森