文件Zbl 1390.91073-zbMATH打开

安舒尔·古普塔；斯文·舍韦；阿舒托什·特里维迪；迪帕克（Deepak），玛兰·赛·克里希纳（Maram Sai Krishna）；巴拉特·库马尔·帕达西

奖励Stackelberg mean-payoff游戏。（英语） Zbl 1390.91073号

De Nicola，Rocco（编辑）等人，《软件工程和形式化方法》。2016年7月4日至8日，作为2016年STAF的一部分，在奥地利维也纳举行了2016年SEFM第14届国际会议。诉讼程序。查姆：施普林格（ISBN 978-3-319-41590-1/pbk；978-3-316-41591-8/电子书）。计算机科学课堂讲稿9763304-320（2016）。

摘要：我们引入并研究了多层平手博弈的激励均衡。激励均衡概括了经过充分研究的解决方案概念，如纳什均衡和领导者均衡。回想一下，如果没有玩家能够通过单方面改变策略来提高他的收益，那么策略配置就是纳什均衡。在激励和领导平衡的设置中，有一个杰出的参与者，称为领导者，可以将策略分配给所有其他参与者，称之为追随者。如果除领导者外，没有任何参与者能够通过单方面改变策略来提高其回报，那么战略配置文件就是领导者的战略配置文件，而领导者均衡是领导者获得最大回报的领导者战略配置文件。在建议的激励均衡情况下，领导者还可以通过将部分奖金转移给追随者来影响追随者的行为。激励追随者的能力为领导者提供了选择策略的更多自由档案，我们表明这确实可以提高领导者在此类游戏中的回报。本文的关键基本结果是均值对价博弈中激励均衡的存在性。我们进一步证明了与构建激励均衡相关的决策问题是NP-完全的。在一个积极的方面，我们表明，当玩家数量固定时，问题的复杂性与两层平手游戏属于同一类。我们给出了所提算法的实现，并讨论了证明分析可行性的实验结果。
关于整个系列，请参见[Zbl 1346.68008号].

MSC公司：

91A43型	涉及图形的游戏
91A06型	\（n）-人游戏，（n>2）
91A65型	分级游戏（包括Stackelberg游戏）

PDF格式 BibTeX公司 XML格式引用

全文：内政部 arXiv公司

参考文献：

[1]	1
[2]	2.Björklund，H.，Vorobyov，S.：一种用于均值对均值博弈的组合强次指数策略改进算法。离散应用程序。数学。155(2), 210-229 (2007) ·Zbl 1176.68087号 ·doi:10.1016/j.dam.2006.04.029
[3]	3.Boros，E.、Elbassioni，K.、Fouz，M.、Gurvich，V.、Makino，K.和Manthey，B.：随机平均收益博弈：平滑分析和近似方案。收录于：Aceto，L.，Henzinger，M.，Sgall，J.（编辑）ICALP 2011，第一部分LNCS，第6755卷，第147-158页。斯普林格，海德堡（2011）·Zbl 1332.68064号 ·文件编号：10.1007/978-3-642-22006-7_13
[4]	4.Brihaye，T.，Bruyère，V.，De Pril，J.：定量可达性博弈中的均衡。摘自：Ablayev，F.，Mayr，E.W.（编辑）CSR 2010。LNCS，第6072卷，第72-83页。斯普林格，海德堡（2010）·Zbl 1285.91023号 ·doi:10.1007/978-3642-13182-07
[5]	5.Brihaye，T.，De Pril，J.，Schewe，S.：具有简单纳什均衡的多人成本游戏。收录：Artemov，S.，Nerode，A.（编辑）LFCS 2013。LNCS，第7734卷，第59-73页。斯普林格，海德堡（2013）·Zbl 1422.91043号 ·doi:10.1007/978-3-642-35722-0_5
[6]	6.Brim，L.、Chaloupka，J.、Doyen，L.，Gentilini，R.、Raskin，J.-F.：平均对赌游戏的更快算法。形式方法系统。设计。38(2), 97-118 (2011) ·Zbl 1213.68430号 ·文件编号：10.1007/s10703-010-0105-x
[7]	7.Chatterjee，K.，Henzinger，T.A.，Jurdzinski，M.：Mean-payoff平价游戏。摘自：《2005年LICS会议录》，第178-187页（2005）
[8]	8.Chatterjee，K.，Henzinger，T.A.，Jurdzinski，M.：安全均衡博弈。Theor。计算。科学。67-82 (2006) ·Zbl 1108.91007号
[9]	9.Ehrenfeucht，A.，Mycielski，J.：平均回报博弈的位置策略。《国际博弈论杂志》8（2），109-113（1979）·兹比尔0499.90098 ·doi:10.1007/BF01768705
[10]	10.Etessami，K.，Yannakakis，M.：关于纳什均衡和其他不动点的复杂性。SIAM J.计算。39(6), 2531-2597 (2010) ·Zbl 1204.91003号 ·doi:10.1137/080720826
[11]	11.弗里德曼，J.W.：寡头垄断与博弈论。高级经济学教科书。北荷兰公社。Co.（1977年）·Zbl 0385.90001号
[12]	12.弗里德曼，J.W.：超级游戏的非合作均衡。经济收益率。螺柱1-12（1971）·Zbl 0274.90072号
[13]	13.Gupta，A.，Schewe，S.：理性环境中的定量验证。摘自：《时代周刊》，第123-131页（2014年）
[14]	14.古普塔（Gupta，A.）、舍韦（Schewe，S.）：用双矩阵Ggmes支付是值得的，这是对贿赂的合理解释。摘自：AAMAS会议记录，第1361-1369页（2015年）
[15]	15.Henzinger，T.A.：定量反应建模和验证。计算。科学。研发28（4），331-344（2013）
[16]	16.尤尔金斯基（Jurdziánski，M.）：在平价赛中决定胜利者是UP·Zbl 1338.68109号 ·doi:10.1016/S0020-0190（98）00150-1
[17]	17.Karmarkar，N.：线性规划的一种新的多项式时间算法。摘自：《STOC会议录》，第302-311页（1984年）·Zbl 0557.90065号
[18]	18.Khachian，L.G.：线性规划中的多项式算法。多克。阿卡德。诺克SSSR 244，1093-1096（1979）·Zbl 0414.90086号
[19]	19.纳什，J.F.：n人博弈中的平衡点。程序。国家。阿卡德。科学。36(1), 48-49 (1950) ·Zbl 0036.01104号 ·doi:10.1073/pnas.36.1.48
[20]	20.M.J.奥斯本、A.鲁宾斯坦：博弈论课程。麻省理工学院出版社，剑桥（1994）。电子版·兹比尔1194.91003
[21]	21.Puterman，M.L.：马尔可夫决策过程：离散随机动态规划。霍博肯·威利（1994）·兹伯利0829.90134 ·doi:10.1002/9780470316887
[22]	22.Pnueli，A.，Rosner，R.：关于反应模的合成。摘自：《POPL学报》，第179-190页（1989年）·兹伯利0686.68015
[23]	23.Ramadge，P.J.G.，Wonham，W.M.：离散事件系统的控制。程序。IEEE 77（2），81-98（1989）·数字对象标识代码：10.1109/5.21072
[24]	24.Schewe，S.：求解平价和支付博弈的最优策略改进算法。收录：Kaminski，M.，Martini，S.（编辑）CSL 2008。LNCS，第5213卷，第369-384页。斯普林格，海德堡（2008）·兹比尔1156.68478 ·doi:10.1007/978-3-540-87531-4_27
[25]	25.Schewe，S.：从平价和支付博弈到线性规划。收录于：Králović，R.，Niwinñski，D.（编辑）MFCS 2009。LNCS，第5734卷，第675-686页。斯普林格，海德堡（2009）·Zbl 1250.68131号 ·doi:10.1007/978-3642-03816-7_57
[26]	26.Ummels，M.：无限多人游戏中的理性行为和策略构建。收录：Arun-Kumar，S.，Garg，N.（编辑）FSTTCS 2006。LNCS，第4337卷，第212-223页。斯普林格，海德堡（2006）·Zbl 1177.91060号 ·doi:10.1007/11944836_21
[27]	27.Ummels，M.：无限多人游戏中纳什均衡的复杂性。收录：Amadio，R.M.（编辑）FOSSACS 2008。LNCS，第4962卷，第20-34页。斯普林格，海德堡（2008）·Zbl 1138.91359号 ·doi:10.1007/978-3-540-78499-93
[28]	28.Ummels，M.，Wojtczak，D.：极限平均博弈中纳什均衡的复杂性。收录：Katoen，J.-P.，König，B.（编辑）CONCUR 2011。LNCS，第6901卷，第482-496页。斯普林格，海德堡（2011）·Zbl 1343.68177号 ·doi:10.1007/978-3642-23217-6_32
[29]	29.von Stackelberg，H.：Marktform und Gleichgewicht。施普林格，维也纳（1934年）·Zbl 1405.91003号
[30]	30.美国兹威克（Zwick，U.）、帕特森（Paterson，M.S.）：图上平均值游戏的复杂性。西奥。计算。科学。158(1-2), 343-359 (1996) ·Zbl 0871.68138号 ·doi:10.1016/0304-3975（95）00188-3

此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配，可能包含数据转换错误。在某些情况下，zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献，而不要求完整或完全匹配。

任何	在任何地方
一个	内部文档标识符
澳大利亚	作者、编辑
人工智能	内部作者标识符
钛	标题
洛杉矶	语言
所以	来源
实验室	回顾，摘要
第页	出版年份
车辆	评审员
复写的副本	MSC代码
美国犹他州	关键字
日期	文档类型(j个：期刊文章；b条：book；一：图书文章）

一&b条	逻辑和
一\|b条	逻辑或
!实验室	逻辑不
美国广播公司*	右通配符
"ab c公司"	短语
(ab c公司)	圆括号

示例

领域

操作员

奖励Stackelberg mean-payoff游戏。（英语） Zbl 1390.91073号

MSC公司：

参考文献：

示例

领域

操作员

奖励Stackelberg mean-payoff游戏。 （英语） Zbl 1390.91073号

MSC公司：

参考文献：

奖励Stackelberg mean-payoff游戏。（英语） Zbl 1390.91073号