×

计算具有多个追随者的悲观Stackelberg均衡:混合纯情况。 (英语) Zbl 1435.91046号

摘要:科学文献中对计算Stackelberg(或领导者-追随者)平衡(也称为承诺的最优策略)的搜索问题进行了广泛的研究,几乎完全是在单个追随者的环境中。尽管该问题的乐观和悲观版本,即单个跟随者打破了支持或反对领导者的多重均衡之间的任何联系,是用不同的方法解决的,但这两种情况都允许基于线性规划的高效多项式算法。这种情况与多个追随者不同,他们的结果只是零星的,并且严格取决于追随者游戏的性质。在本文中,我们研究了一个具有单个领导者和多个追随者的正态博弈的设置,他们在观察领导者的承诺后,发挥纳什均衡。当领导者和追随者都被允许使用混合策略时,相应的搜索问题,无论是乐观版本还是悲观版本,在多项式时间内都是不可接近的,除非\(\text{P}=\text{NP}\)。只有乐观情况下才知道精确算法。我们关注的是追随者在悲观的假设下玩纯策略的情况——这一限制适用于许多现实世界的场景,原则上使问题更容易——(问题的乐观版本可以在多项式时间内直接解决)。将这个搜索问题(跟随者执行纯策略)转化为一个悲观的双层规划问题后,我们证明了,对于两个跟随者,这个问题是NP-hard问题,对于三个或更多的跟随者,它不能在多项式时间内近似于在正态形式博弈大小中是多项式的任何乘法因子内,也不是,假设效用在\([0,1]\)中,在任何常数的加性损失范围内严格小于1,除非\(\text{P}=\text{NP}\)。这表明,与乐观版本中的情况不同,悲观问题中的困难和不可接近性并不是由于采用了混合策略。然后我们证明,在一般情况下,该问题允许一个上确界而不是最大值,并且我们提出了一个单层数学规划重新公式,该公式要求在由线性和二次约束定义的无界非凸可行域上非凹二次函数的最大化。由于只允许一个上确界而不允许一个最大值,因此只有这个公式的一个限制版本才能用最新的方法求解到最优,因此我们提出了一个精确的特设算法(我们也将其嵌入到分支定界方案中),该算法能够计算问题的上确界,并且,对于没有领导者策略的情况,如果达到了这样的值,也可以使用近似策略,其中(alpha>0)是任意的附加损失(最多与上确值一样大)。我们通过在一个完善的游戏实例测试平台上的计算实验来评估我们的算法的可伸缩性,从而得出本文的结论。

MSC公司:

91A65型 分级游戏(包括Stackelberg游戏)
91A11号机组 平衡优化
90立方 非线性规划
91A68型 算法博弈论与复杂性
2017年第68季度 问题的计算难度(下限、完备性、近似难度等)
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Al-Khayyal,FA;Falk,JE,联合约束双凸编程,数学。操作。研究,8,2,273-286(1983)·Zbl 0521.90087号 ·doi:10.1287/门8.2.273
[2] 阿马尔迪,E。;Capone,A。;Coniglio,S。;Gianoli,LG,最大公平流量分配下的网络优化问题,IEEE Commun。莱特。,17, 7, 1463-1466 (2013) ·doi:10.1109/LCOMM.2013.060513.130351
[3] 安,B。;Pita,J。;谢赫,E。;Tambe,M。;基金特维尔德,C。;Marecki,J.,《守卫与保护:安全游戏的下一代应用》,ACM SIGecom Exch。,10, 1, 31-34 (2011) ·doi:10.1145/1978721.1978729
[4] Basilico,N.,Coniglio,S.,Gatti,N.:寻找具有多个追随者的领导-追随者均衡的方法:(扩展抽象)。收录于:AAMAS,第1363-1364页(2016年)
[5] Basilico,N.,Coniglio,S.,Gatti,N.:寻找多追随者领导-追随者均衡的方法。CoRR(2017a)。网址:http://arxiv.org/abs/1707.02174, 1707.02174 ·Zbl 1436.91018号
[6] Basilico,N.、Coniglio,S.、Gatti,N.和Marchesi,A.:乐观和悲观的单领导-多跟随均衡计算的双层规划方法。摘自:第16届实验算法国际研讨会(SEA 2017),莱布尼茨国际信息学论文集,Schloss Dagstuhl-Leibniz-Zentrum für Informatik,Dagstuhl出版社,德国,第69:1-69:14页(2017b)·Zbl 1436.91018号
[7] 巴西利科,北。;德尼蒂斯,G。;北卡罗来纳州加蒂(Gatti,N.),具有空间不确定警报信号的敌方巡逻,Artif。智力。,246220-257(2017)·Zbl 1422.91167号 ·doi:10.1016/j.artint.2017.02.007
[8] 巴西利科,北。;Coniglio,S。;加蒂,N。;Marchesi,A.,计算正常形式和多矩阵游戏中单领导-多跟随者均衡的双层规划方法,EURO J.Compute。最佳方案。(2019) ·Zbl 1435.91045号 ·doi:10.1007/s13675-019-00114-8
[9] Bertsimas,D。;Tsitsiklis,JN,《线性优化导论》(1997),马萨诸塞州贝尔蒙特:雅典娜科学出版社,马萨诸塞诸塞州贝尔蒙特
[10] 卡普拉拉。;卡瓦略,M。;洛迪,A。;GJ,Woeginger,带遮断约束的双层背包,Inform。J.计算。,28, 2, 319-333 (2016) ·Zbl 1343.90075号 ·doi:10.1287/ijoc.2015.0676
[11] Castiglioni,M.,Marchesi,A.,Gatti,N.,Coniglio,S.:单点拥塞游戏中的领导力:什么是困难的,什么是容易的。Artif公司。智力。277 (2019) ·Zbl 1482.91015号
[12] Coniglio,S.,Gatti,N.,Marchesi,A.:悲观的多追随者领导-追随者均衡。收录于:IJCAI,第171-177页(2017年)
[13] Conitzer,V.,Korzhyk,D.:致力于相关战略。收录于:AAAI,第632-637页(2011年)
[14] Conitzer,V.,Sandholm,T.:计算承诺的最佳策略。摘自:ACM EC,第82-90页(2006)
[15] Farina,G.,Marchesi,A.,Kroer,C.,Gatti,N.,Sandholm,T.:具有承诺的广泛形式游戏中的颤抖与完美。摘自:《第二十七届国际人工智能联合会议论文集》,2018年7月13日至19日,瑞典斯德哥尔摩,第233-239页(2018)
[16] 卡普,RM。:组合问题中的可约性。In:计算机计算的复杂性。施普林格,第85-103页(1972年)·Zbl 1467.68065号
[17] Kiekintveld,C.、Jain,M.、Tsai,J.、Pita,J.,Ordóñez,F.、Tambe,M.:计算大规模安全游戏的最佳随机资源分配。收录于:AAMAS,第689-696页(2009年)·Zbl 1241.91033号
[18] Korzhyk,D.,Conitzer,V.,Parr,R.:具有多个攻击者资源的安全游戏。参加:第二十二届国际人工智能联合会议(2011年)
[19] 拉贝,M。;Violin,A.,《双层编程和定价问题》,Ann.Oper。第240号、第1号、第141-169号决议(2016年)·兹比尔1342.90185 ·doi:10.1007/s10479-015-2016-0
[20] Marchesi,A.,Coniglio,S.,Gatti,N.:单点拥堵游戏的领导力。载:《第27届国际人工智能联合会议论文集》,AAAI出版社,第447-453页(2018)
[21] Marchesi,A.,Castiglioni,M.,Gatti,N.:拥塞游戏中的领导力:多用户类和非单一动作。载于:《第二十届国际人工智能联合会议论文集》,2019年8月10日至16日,中国澳门,2019,第485-491页(2019a)
[22] Marchesi,A.,Farina,G.,Kroer,C.,Gatti,N.,Sandholm,T.:拟完美斯塔克伯格平衡。摘自:第三十三届AAAI人工智能会议,2019年AAAI,第三十届人工智能创新应用会议,2019IAAI,2019EAAI,美国夏威夷檀香山,20191年1月27日至2月1日,第2117-2124(2019b)页
[23] Matuschke,J。;麦考密克,ST;奥里奥洛,G。;贝斯,B。;Skutella,M.,《目标攻击下的流量保护》,Oper。Res.Lett.公司。,45, 1, 53-59 (2017) ·Zbl 1409.90042号 ·doi:10.1016/j.orl.2016.11.005
[24] McCormick,G.,可分解非凸程序全局解的可计算性:第一部分-凸低估问题,数学。程序。,10, 1, 147-175 (1976) ·Zbl 0349.90100号 ·doi:10.1007/BF01580665
[25] Monderer博士。;Shapley,LS,潜在游戏,游戏经济。行为。,14, 1, 124-143 (1996) ·Zbl 0862.90137号 ·doi:10.1006/游戏.1996.0044
[26] Nash,JF,非合作游戏,Ann.Math。,54, 2, 286-295 (1951) ·Zbl 0045.08202号 ·doi:10.2307/1969529
[27] Nudelman,E.,Wortman,J.,Leyton-Brown,K.,Shoham,Y.:运行GAMUT:评估游戏理论算法的综合方法。收录于:AAMAS,第880-887页(2004年)
[28] Paruchuri,P.,Pearce,JP.,Marecki,J.,Tambe,M.,Ordonez,F.,Kraus,S.:安全游戏:求解贝叶斯stackelberg游戏的有效精确算法。收录于:AAMAS,第895-902页(2008年)
[29] 罗森塔尔,RW,一类具有纯策略纳什均衡的博弈,国际博弈论,2,1,65-67(1973)·Zbl 0259.90059号 ·doi:10.1007/BF01737559
[30] Sahinidis,N.V.:BARON 14.3.1:混合整数非线性程序的全局优化用户手册(2014)
[31] Sandholm,T.,Gilpin,A.,Conitzer,V.:寻找纳什均衡的混合整数规划方法。摘自:AAAI,第495-501页(2005)
[32] 肖姆,Y。;Leyton-Brown,K.,《多智能体系统:算法、博弈论和逻辑基础》(2008),剑桥:剑桥大学出版社,剑桥·Zbl 1163.91006号
[33] Stanford,W.,关于矩阵对策中k纯纳什均衡概率的注记,对策经济学。行为。,9, 2, 238-246 (1995) ·Zbl 0829.90139号 ·doi:10.1006/游戏.1995.1019
[34] 冯·斯坦格尔,B。;Zamir,S.,具有凸策略集的领导力博弈,博弈经济学。行为。,69, 446-457 (2010) ·Zbl 1230.91022号 ·doi:10.1016/j.geb.20009.11.008(文件编号:10.1016/j.geb.20009.11.008)
[35] Zemkoho,A.,《求解不适定双层规划》。,集值分析。,24233-448(2016)·Zbl 1362.90346号 ·doi:10.1007/s11228-016-0371-x
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。