文件Zbl 1447.91018-zbMATH Open

克里希南德·查特吉;Hansen，Kristoffer Arnsfelt;拉斯穆斯·易卜森·延森

并发安全游戏的策略复杂性。（英语） Zbl 1447.91018号

Larsen，Kim G.（编辑）等人，第42届计算机科学数学基础国际研讨会，2017年8月21日至25日，丹麦奥尔堡，MFCS 2017。Wadern：Schloss Dagstuhl–Leibniz Zentrum für Informatik。LIPIcs–莱布尼茨国际程序。通知。83，第55条，第13页（2017年）。

小结：我们考虑两人零和有限状态并发可达性游戏，游戏进行了无限多轮，其中每一轮中，每个玩家同时独立于其他玩家选择一个动作，然后，后继状态由当前状态和所选动作给定的概率分布确定。如果最终到达指定的目标状态，球员1获胜。我们对用耐心来衡量平稳策略的复杂性感兴趣，耐心被定义为所用最小非零概率的倒数。
我们的主要结果如下：我们证明了：（i）最优和（ε）最优策略的耐心的最优界对于两个参与者都是双指数的；（ii）即使是在具有单一非吸收状态指数（动作数）的游戏中，耐心也是必要的。
关于整个系列，请参见[Zbl 1376.68011号].

引用于4文件

MSC公司：

91A20型	多阶段重复游戏
91A43型	涉及图形的游戏
91A05型	2人游戏
91A68型	算法博弈论与复杂性

关键词：

并发游戏;可达性;安全;策略的耐心

PDF格式 BibTeX公司 XML格式引用

全文：内政部

参考文献：

[2]	R.Alur、T.Henzinger和O.Kupferman。交替时间时序逻辑。《美国医学会杂志》，49:672-7132002·Zbl 1326.68181号
[3]	查特吉。带有尾部目标的并发游戏。{\it理论计算机科学}，388:181-1982007·兹比尔1177.91031
[4]	K.Chatterjee、L.de Alfaro和T.Henzinger。定性并行平价游戏。｛\it ACM｝｛\it ToCL｝，2011年·Zbl 1351.68179号
[5]	K.Chatterjee、K.A.Hansen和R.Ibsen-Jensen。具有安全性和可达性目标的并发随机博弈的策略复杂性。{\it CoRR}，abs/1506.024342015年。
[6]	K.Chatterjee和R.Ibsen-Jensen。遍历意义回报游戏的复杂性。在{it ICALP 2014}中，第122-133页，2014年·Zbl 1410.68156号
[7]	L.de Alfaro、T.Henzinger和F.Mang。同步系统的控制。在{it CON-}{it CUR'00}中，LNCS 1877，第458-473页。斯普林格，2000年·Zbl 0999.68531号
[8]	L.de Alfaro、T.Henzinger和F.Mang。同步系统的控制，第二部分。在{it CONCUR'01}，LNCS 2154，第566-580页。斯普林格，2001年·Zbl 1006.68534号
[9]	L.de Alfaro、T.A.Henzinger和O.Kupferman。并发可达性游戏。{理论}{计算科学}，386（3）：188-2172007·Zbl 1154.91306号
[10]	K.Etessami和M.Yannakakis。递归并发随机博弈。在{\it ICALP'06（2）}，LNCS 4052，Springer，第324-335页，2006·Zbl 1133.91317号
[11]	H.埃弗雷特。递归游戏。在{it CTG}中，{it AMS}第39卷，第47-78页，1957年·Zbl 0078.32802号
[12]	J.Filar和K.Vrieze。{竞争马尔可夫决策过程}。Springer-Verlag，1997年·Zbl 0934.91002号
[13]	K.A.Hansen、R.Ibsen Jensen和P.B.Miltersen。使用值和策略迭代求解可达性博弈的复杂性。在{it CSR}中，第77-90页，2011年·兹比尔1330.68112
[14]	K·A·汉森、M·库克和P·B·米尔特森。赢得并发可达性游戏需要双重指数的耐心。在LICS中，第332-341页，2009年。
[15]	C.J.Himmelberg、T.Parthasarathy、T.E.S.Raghavan和F.S.V.Vleck。随机博弈中{\itp}均衡和最优平稳策略的存在性。《程序美国数学》，第60:245-2511976页·Zbl 0358.90083号
[16]	R.易卜生-延森。{双层零和博弈的策略复杂性}。奥胡斯大学博士论文，2013年。
[17]	R.Ibsen-Jensen和P.B.Miltersen。用很少的投币位置求解简单的随机游戏。在《欧洲账户体系》第636-647页，2012年·Zbl 1365.68283号
[18]	R.Lipton、E.Markakis和A.Mehta。使用简单的策略玩大型游戏。在{it EC}{it 03:电子商务}中，第36-41页。ACM出版社，2003年。
[19]	P.B.Miltersen和T.B.Sörensen。一个接近最佳的策略，为一个不受限制的德克萨斯扑克锦标赛。在{it AAMAS’07}中，第191-197页，2007年。
[20]	G.欧文。{博弈论}。学术出版社，1995年·Zbl 1284.91004号
[21]	T.Parthasarathy公司。折扣和正随机博弈。{\it Bull.Amer.Math.Soc}，77:134-1361971年·Zbl 0208.47401号
[22]	A.Pnueli和R.Rosner。关于反应模的合成。在《流行文学杂志》第179-190页。ACM出版社，1989年·Zbl 0686.68015号
[23]	P.J.Ramadge和W.M.Wonham。一类离散事件过程的监督控制。{SIAM控制与优化杂志}，25（1）：206-2301987·Zbl 0618.93033号
[24]	L.沙普利。随机游戏。{\it PNAS}，39:1095-11001953年·Zbl 0051.35805号
[25]	E.Solan和N.Vieille。两人随机博弈中一致最优策略的计算。{经济理论}，42（1）：237-2532010·Zbl 1182.91030号
[26]	M.瓦尔迪。概率并发有限状态系统的自动验证。在{it FOCS’85}中，第327-338页。IEEE，1985年。
[27]	J.von Neumann和O.Morgenstern。{博弈论与经济行为}。普林斯顿大学出版社，1947年·Zbl 1241.91002号
[28]	O.Vrieze和F.Thuijsman。关于具有吸收状态的重复博弈的均衡。{国际}{国家博弈论杂志}，18（3）：293-3101989·Zbl 0678.90107号
[29]	O.Vrieze和S.Tijs。虚拟游戏适用于游戏序列和折扣随机游戏。{国际博弈论杂志}，11（2）：71-851982·Zbl 0497.90081号
[30]	:13

此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配，可能包含数据转换错误。在某些情况下，zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献，而不要求完整或完全匹配。

任何	在任何地方
一个	内部文档标识符
澳大利亚	作者、编辑
人工智能	内部作者标识符
钛	标题
洛杉矶	语言
所以	来源
ab公司	回顾，摘要
第页	出版年份
右心室	评审员
立方厘米	MSC代码
美国犹他州	关键字
日期	文档类型(j个：期刊文章；b条：book；一：书籍文章）

一&b条	逻辑和
一\|b条	逻辑或
!ab公司	逻辑不
美国广播公司*	右通配符
"ab c公司"	短语
(ab c公司)	圆括号

示例

领域

操作员

并发安全游戏的策略复杂性。（英语） Zbl 1447.91018号

MSC公司：

关键词：

参考文献：

示例

领域

操作员

并发安全游戏的策略复杂性。 （英语） Zbl 1447.91018号

MSC公司：

关键词：

参考文献：

并发安全游戏的策略复杂性。（英语） Zbl 1447.91018号