×

奖励Stackelberg mean-payoff游戏。 (英语) Zbl 1390.91073号

De Nicola,Rocco(编辑)等人,《软件工程和形式化方法》。2016年7月4日至8日,作为2016年STAF的一部分,在奥地利维也纳举行了2016年SEFM第14届国际会议。诉讼程序。查姆:施普林格(ISBN 978-3-319-41590-1/pbk;978-3-316-41591-8/电子书)。计算机科学课堂讲稿9763304-320(2016)。
摘要:我们引入并研究了多层平手博弈的激励均衡。激励均衡概括了经过充分研究的解决方案概念,如纳什均衡和领导者均衡。回想一下,如果没有玩家能够通过单方面改变策略来提高他的收益,那么策略配置就是纳什均衡。在激励和领导平衡的设置中,有一个杰出的参与者,称为领导者,可以将策略分配给所有其他参与者,称之为追随者。如果除领导者外,没有任何参与者能够通过单方面改变策略来提高其回报,那么战略配置文件就是领导者的战略配置文件,而领导者均衡是领导者获得最大回报的领导者战略配置文件。在建议的激励均衡情况下,领导者还可以通过将部分奖金转移给追随者来影响追随者的行为。激励追随者的能力为领导者提供了选择策略的更多自由档案,我们表明这确实可以提高领导者在此类游戏中的回报。本文的关键基本结果是均值对价博弈中激励均衡的存在性。我们进一步证明了与构建激励均衡相关的决策问题是NP-完全的。在一个积极的方面,我们表明,当玩家数量固定时,问题的复杂性与两层平手游戏属于同一类。我们给出了所提算法的实现,并讨论了证明分析可行性的实验结果。
关于整个系列,请参见[Zbl 1346.68008号].

MSC公司:

91A43型 涉及图形的游戏
91A06型 \(n)-人游戏,(n>2)
91A65型 分级游戏(包括Stackelberg游戏)
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] 1
[2] 2.Björklund,H.,Vorobyov,S.:一种用于均值对均值博弈的组合强次指数策略改进算法。离散应用程序。数学。155(2), 210-229 (2007) ·Zbl 1176.68087号 ·doi:10.1016/j.dam.2006.04.029
[3] 3.Boros,E.、Elbassioni,K.、Fouz,M.、Gurvich,V.、Makino,K.和Manthey,B.:随机平均收益博弈:平滑分析和近似方案。收录于:Aceto,L.,Henzinger,M.,Sgall,J.(编辑)ICALP 2011,第一部分LNCS,第6755卷,第147-158页。斯普林格,海德堡(2011)·Zbl 1332.68064号 ·文件编号:10.1007/978-3-642-22006-7_13
[4] 4.Brihaye,T.,Bruyère,V.,De Pril,J.:定量可达性博弈中的均衡。摘自:Ablayev,F.,Mayr,E.W.(编辑)CSR 2010。LNCS,第6072卷,第72-83页。斯普林格,海德堡(2010)·Zbl 1285.91023号 ·doi:10.1007/978-3642-13182-07
[5] 5.Brihaye,T.,De Pril,J.,Schewe,S.:具有简单纳什均衡的多人成本游戏。收录:Artemov,S.,Nerode,A.(编辑)LFCS 2013。LNCS,第7734卷,第59-73页。斯普林格,海德堡(2013)·Zbl 1422.91043号 ·doi:10.1007/978-3-642-35722-0_5
[6] 6.Brim,L.、Chaloupka,J.、Doyen,L.,Gentilini,R.、Raskin,J.-F.:平均对赌游戏的更快算法。形式方法系统。设计。38(2), 97-118 (2011) ·Zbl 1213.68430号 ·文件编号:10.1007/s10703-010-0105-x
[7] 7.Chatterjee,K.,Henzinger,T.A.,Jurdzinski,M.:Mean-payoff平价游戏。摘自:《2005年LICS会议录》,第178-187页(2005)
[8] 8.Chatterjee,K.,Henzinger,T.A.,Jurdzinski,M.:安全均衡博弈。Theor。计算。科学。67-82 (2006) ·Zbl 1108.91007号
[9] 9.Ehrenfeucht,A.,Mycielski,J.:平均回报博弈的位置策略。《国际博弈论杂志》8(2),109-113(1979)·兹比尔0499.90098 ·doi:10.1007/BF01768705
[10] 10.Etessami,K.,Yannakakis,M.:关于纳什均衡和其他不动点的复杂性。SIAM J.计算。39(6), 2531-2597 (2010) ·Zbl 1204.91003号 ·doi:10.1137/080720826
[11] 11.弗里德曼,J.W.:寡头垄断与博弈论。高级经济学教科书。北荷兰公社。Co.(1977年)·Zbl 0385.90001号
[12] 12.弗里德曼,J.W.:超级游戏的非合作均衡。经济收益率。螺柱1-12(1971)·Zbl 0274.90072号
[13] 13.Gupta,A.,Schewe,S.:理性环境中的定量验证。摘自:《时代周刊》,第123-131页(2014年)
[14] 14.古普塔(Gupta,A.)、舍韦(Schewe,S.):用双矩阵Ggmes支付是值得的,这是对贿赂的合理解释。摘自:AAMAS会议记录,第1361-1369页(2015年)
[15] 15.Henzinger,T.A.:定量反应建模和验证。计算。科学。研发28(4),331-344(2013)
[16] 16.尤尔金斯基(Jurdziánski,M.):在平价赛中决定胜利者是UP·Zbl 1338.68109号 ·doi:10.1016/S0020-0190(98)00150-1
[17] 17.Karmarkar,N.:线性规划的一种新的多项式时间算法。摘自:《STOC会议录》,第302-311页(1984年)·Zbl 0557.90065号
[18] 18.Khachian,L.G.:线性规划中的多项式算法。多克。阿卡德。诺克SSSR 244,1093-1096(1979)·Zbl 0414.90086号
[19] 19.纳什,J.F.:n人博弈中的平衡点。程序。国家。阿卡德。科学。36(1), 48-49 (1950) ·Zbl 0036.01104号 ·doi:10.1073/pnas.36.1.48
[20] 20.M.J.奥斯本、A.鲁宾斯坦:博弈论课程。麻省理工学院出版社,剑桥(1994)。电子版·兹比尔1194.91003
[21] 21.Puterman,M.L.:马尔可夫决策过程:离散随机动态规划。霍博肯·威利(1994)·兹伯利0829.90134 ·doi:10.1002/9780470316887
[22] 22.Pnueli,A.,Rosner,R.:关于反应模的合成。摘自:《POPL学报》,第179-190页(1989年)·兹伯利0686.68015
[23] 23.Ramadge,P.J.G.,Wonham,W.M.:离散事件系统的控制。程序。IEEE 77(2),81-98(1989)·数字对象标识代码:10.1109/5.21072
[24] 24.Schewe,S.:求解平价和支付博弈的最优策略改进算法。收录:Kaminski,M.,Martini,S.(编辑)CSL 2008。LNCS,第5213卷,第369-384页。斯普林格,海德堡(2008)·兹比尔1156.68478 ·doi:10.1007/978-3-540-87531-4_27
[25] 25.Schewe,S.:从平价和支付博弈到线性规划。收录于:Králović,R.,Niwinñski,D.(编辑)MFCS 2009。LNCS,第5734卷,第675-686页。斯普林格,海德堡(2009)·Zbl 1250.68131号 ·doi:10.1007/978-3642-03816-7_57
[26] 26.Ummels,M.:无限多人游戏中的理性行为和策略构建。收录:Arun-Kumar,S.,Garg,N.(编辑)FSTTCS 2006。LNCS,第4337卷,第212-223页。斯普林格,海德堡(2006)·Zbl 1177.91060号 ·doi:10.1007/11944836_21
[27] 27.Ummels,M.:无限多人游戏中纳什均衡的复杂性。收录:Amadio,R.M.(编辑)FOSSACS 2008。LNCS,第4962卷,第20-34页。斯普林格,海德堡(2008)·Zbl 1138.91359号 ·doi:10.1007/978-3-540-78499-93
[28] 28.Ummels,M.,Wojtczak,D.:极限平均博弈中纳什均衡的复杂性。收录:Katoen,J.-P.,König,B.(编辑)CONCUR 2011。LNCS,第6901卷,第482-496页。斯普林格,海德堡(2011)·Zbl 1343.68177号 ·doi:10.1007/978-3642-23217-6_32
[29] 29.von Stackelberg,H.:Marktform und Gleichgewicht。施普林格,维也纳(1934年)·Zbl 1405.91003号
[30] 30.美国兹威克(Zwick,U.)、帕特森(Paterson,M.S.):图上平均值游戏的复杂性。西奥。计算。科学。158(1-2), 343-359 (1996) ·Zbl 0871.68138号 ·doi:10.1016/0304-3975(95)00188-3
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。