瓦迪姆·莱维特;佐哈尔·科马罗夫斯基;塔尔·格林斯彭;Ana L.C.巴赞。;Amnon Meisels公司 布尔博弈中基于激励的均衡搜索。 (英语) Zbl 1427.91012号 约束条件 24,编号3-4,288-319(2019). 摘要:在博弈中寻找均衡是一个难题,许多博弈都没有纯纳什均衡(PNE)。激励机制已被证明可以在某些游戏家族中确保PNE。本研究利用非对称分布约束优化问题(ADCOPs)与博弈之间的相似性,构造搜索算法来寻找布尔博弈中确保纯纳什均衡的结果和激励。所选激励机制的搜索算法返回的值集称为激励计划。本研究使用的两种激励机制是税收和附带支付。对这两种算法进行了描述,并对它们在布尔博弈中的PNE搜索性能进行了评估。税收机制的激励计划由征收税款的价值组成,而侧面支付机制的激励方案由一组转移函数的价值组成。分布式搜索算法满足两种不同的要求。一是找到一个能够确保PNE的激励计划。另一个要求是,算法返回满足某些全局目标的PNE,例如最大化社会福利的PNE。布尔游戏首先转换为ADCOP。然后,使用指定的分布式搜索算法来查找期望的结果。描述了两种分布式搜索算法,包括与全局目标相关的k元约束和软约束。实验发现,新的创新算法——并发非对称分支和绑定——比前一个算法快得多。对几种基于社会网络的布尔博弈进行了广泛的实验评估。两种激励机制对博弈的干预程度都很小。换言之,总税收或副付款总额只是一般公用事业的一小部分。网络的密度对解的质量以及找到它们的计算工作量有很大影响。 引用于1文件 MSC公司: 91A10号 非合作游戏 68宽15 分布式算法 90C57型 多面体组合学,分支与绑定,分支与切割 关键词:分布式约束推理;分布式搜索;基于激励的均衡;布尔游戏;多代理博弈中的副支付 软件:CP网络 PDF格式BibTeX公司 XML格式引用 \textit{V.Levit}等人,《限制条件24》,编号3--4,288--319(2019年;Zbl 1427.91012) 全文: 内政部 参考文献: [1] Anshelevich,E.,Dasgupta,A.,Kleinberg,J.,Tardos,E.,Wexler,T.,Roughgarden,T.(2008)。具有公平成本分配的网络设计的稳定性价格。SIAM计算机杂志,38(4),1602-1623·兹比尔1173.91321 ·数字对象标识代码:10.1137/070680096 [2] Barabási,A.-L.和Albert,R.(1999)。随机网络中尺度的出现。《科学》,286(5439),509-512·Zbl 1226.05223号 ·doi:10.1126/science.286.5439.509 [3] Bonzon,E.,Lagasquie-Schiex,M.-C.,Lang,J.(2009)。布尔游戏中玩家之间的依赖关系。Int.J.近似推理,50(6),899-914·Zbl 1186.91018号 ·doi:10.1016/j.ijar.2009.02.008 [4] Bonzon,E.,Lagasquie-Schiex,M.-C.,Lang,J.,Zanuttini,B.(2006年)。布尔游戏重温。单位:17欧元。Conf.Artif公司。智能-ECAI,第265-269页,意大利里瓦德尔加达。 [5] Bonzon,E.,Lagasquie-Schiex,M.-C.,Lang,J.,Zanuttini,B.(2009年)。紧凑偏好表示和布尔游戏。自治代理和多代理系统,18,1-35·doi:10.1007/s10458-008-9040-2 [6] Boutiler,C.,Brafman,R.I.,Hoos,H.H.,Poole,D.(2003)。CP-Nets:用条件Ceteris Paribus偏好语句表示和推理的工具。人工智能研究杂志,21135-191·Zbl 1080.68685号 ·doi:10.1613/jair.1234 [7] De Clercq,S.、Bauters,K.、Schockaert,S.,Mihaylov,M.、Nowö,A.、De Cock,M.(2017)。求解布尔博弈的精确和启发式方法。自治代理和多代理系统,31(1),66-106·doi:10.1007/s10458-015-9313-5 [8] 库珀,R.(1999)。协调游戏。剑桥:剑桥大学出版社·Zbl 0941.91018号 ·doi:10.1017/CBO9780511609428 [9] Cordes,J.J.(1999)。横向股权。收录:税收和税收政策百科全书。城市研究所出版社。 [10] De Clercq,S.、Bauters,K.、Schockaert,S.和De Cock,M.、Nowé,A.(2014)。使用答案集编程解决布尔游戏。收件人:第14名实习生。王子会议。知识。代表。原因。(KR),奥地利维也纳。 [11] De Clercq,S.、Bauters,K.、Schockaert,S.,Mihaylov,M.、De Cock,M.和Nowé,A.(2014)。考虑隐私问题的布尔博弈帕累托最优纯纳什均衡的分散计算。摘自:ICAART,第50-59页。 [12] Dunne,P.E.和van der Hoek,W.(2004)。布尔游戏中的表示和复杂性。在:欧洲人工智能逻辑研讨会,第347-359页。斯普林格·Zbl 1111.91308号 [13] Dunne,P.E.,van der Hoek,W.,Kraus,S.,Wooldridge,M.(2008)。合作布尔游戏。收件人:第七名实习生。Conf.自动。Agent多Agent系统。(AAMAS-08),第1015-1022页,葡萄牙埃斯托利尔。 [14] Dunne,P.E.和Wooldridge,M.(2012年)。走向易于驾驭的布尔游戏。收件人:第11名实习生。Conf.自动。Agent多Agent系统。(AAMAS-2012),第939-946页,西班牙巴伦西亚。 [15] Erdȯs,P.和Rényi,A.(1959年)。关于随机图。出版物Mathematicae Debrecen,6,290-297·Zbl 0092.15705号 [16] Gamson,W.A.(1961年)。联盟形成理论。《美国社会学评论》,26,373-382·doi:10.2307/2090664 [17] Gershman,A.、Grubshtein,A.、Meisels,A.、Rokach,L.、Zivan,R.(2008)。代理人安排会议。In:程序。第7名实习生。实践与共识提奥。自动时间表(PATAT 2008),蒙特利尔。 [18] Grant,J.、Kraus,S.、Wooldridge,M.、Zuckerman,I.(2014)。通过共享信息操纵游戏。《逻辑研究》,102(2),267-295·Zbl 1329.91007号 ·doi:10.1007/s11225-014-9544-5 [19] Grinshpoun,T.、Grubshtein,A.、Zivan,R.、Netzer,A.、Meisels,A.(2013)。非对称分布约束优化问题。《人工智能研究杂志》,47613-647·Zbl 1269.68101号 ·doi:10.1613/jair.3945 [20] Grubshtein,A.和Meisels,A.(2012年)。一种用于优化网络游戏族的分布式协作方法。摘自:智能分布式计算V——第五届智能分布式计算国际研讨会论文集——IDC 2011,荷兰代尔夫特,2011年10月,《计算智能研究》第382卷,第49-62页。斯普林格。 [21] Grubshtein,A.和Meisels,A.(2012年)。通过异步回溯找到纳什均衡。收录于:约束规划的原则和实践——第18届国际会议,2012年10月8日至12日,加拿大魁北克市,2012年CP。会议记录,第925-940页。 [22] Harrenstein,P.、Turrini,P.和Wooldridge,M.(2014)。布尔博弈中的硬平衡和软平衡。输入:第13名实习生。Conf.自动。Agent多Agent系统。(AAMAS-2014),第845-852页,法国巴黎·Zbl 1422.91157号 [23] Harrenstein,P.、van der Hoek,W.、Meyer,J.-J.、Witteveen,C.(2001)。布尔游戏。摘自:TARK,第287-298页。 [24] Hirayama,K.和Yokoo,M.(1997)。分布式局部约束满足问题。收录于:CP,第222-236页。 [25] Jackson,M.O.和Wilkie,S.(2005年)。内生游戏和机制:玩家之间的附带支付。《经济研究评论》,72(2),543-566·Zbl 1121.91013号 ·文件编号:10.1111/j.1467-937X.2005.00342.x [26] Kun,J.、Powers,B.、Reyzin,L.(2013)。反协调游戏和稳定的图形着色。摘自:SAGT,第122-133页·Zbl 1319.91047号 [27] Léauté,T.,&Faltings,B.(2011年)。随机不确定性下的分布式约束优化。2011年8月7日至11日,美国加利福尼亚州旧金山市,第25届AAAI人工智能会议记录,。 [28] Levit,V.、Grinshpun,T.、Meisels,A.(2013年)。电动汽车充电的布尔游戏。包含:IAT,第86-93页。 [29] Levit,V.、Grinshpoun,T.、Meisels,A.、Bazzan,A.L.C.(2013)。布尔游戏中的税务搜索。收件人:第12名实习生。Conf.自动。代理多代理系统。(AAMAS-13),第183-190页,美国明尼苏达州圣保罗。 [30] Levit,V.、Komarovsky,Z.、Grinshpoun,T.、Meisels,A.(2015)。布尔博弈中激励机制之间的权衡。收件人:第24名实习生。工艺联合会议。智力。(IJCAI-2015),第68-74页,阿根廷布宜诺斯艾利斯。 [31] Litov,O.和Meisels,A.(2017)。dcop和adcop在伪树上的前向绑定。人工智能,25283-99·Zbl 1419.68097号 ·doi:10.1016/j.artint.2017.07.003 [32] Lynch,N.A.(1997年)。分布式算法。摩根考夫曼系列。 [33] Mavronicolas,M.,Monien,B.,Wagner,K.W.(2007年)。加权布尔公式游戏。摘自:《葡萄酒》,第469-481页·Zbl 1331.68112号 [34] Meisels,A.、Razgon,I.、Kaplansky,E.、Zivan,R.(2002)。比较分布式约束处理算法的性能。In:程序。AAMAS-2002分布式约束推理DCR研讨会,第86-93页,博洛尼亚。 [35] Meisels,A.(2007年)。受限代理的分布式搜索:算法、性能、通信。斯普林格·弗拉格·Zbl 1135.68381号 [36] Modi,J.和Veloso,M.(2004)。具有重新安排的多代理会议安排。In:程序。分布式约束推理DCR-04第五次研讨会,多伦多。 [37] Modi,P.J.、Shen,W.、Tamber,M.、Yokoo,M.(2005)。采用:具有质量保证的异步分布式约束优化。人工智能,161,11-2:49-180·Zbl 1132.68706号 ·doi:10.1016/j.artint.2004.09.003 [38] Monderer,D.和Tennenholtz,M.(2004)。k实施。《人工智能研究杂志》,21,37-62·Zbl 1059.91009号 ·doi:10.1613/jair.1231 [39] Netzer,A.、Grubshtein,A.、Meisels,A.(2012年)。分布式约束优化问题的并发前向边界。人工智能。,193, 186-216. ·Zbl 1270.68275号 ·doi:10.1016/j.artint.2012.09.002 [40] Nguyen T.-V.-A.和Lallouet,A.(2014)。约束游戏的完整解算器。2014年9月8日至12日,在法国里昂举行的第20届国际会议《约束规划的原则与实践》中。会议记录,第58-74页。 [41] Nisan,N.、Roughgarden,T、Tardos,E.、Vazirani,V.V.(2007年)。算法博弈论。剑桥:剑桥大学出版社·Zbl 1130.91005号 ·doi:10.1017/CBO9780511800481 [42] Osborne,M.和Rubinstein,A.(1994年)。博弈论课程。麻省理工学院出版社·Zbl 1194.91003号 [43] Papadimitriou,C.H.(1994)。计算复杂性。艾迪森·韦斯利·Zbl 0833.68049号 [44] 波特、瑞安、努德曼、尤金、肖姆、约夫。(2008). 寻找纳什均衡的简单搜索方法。游戏与经济行为,63(2),642-662·Zbl 1142.91313号 ·doi:10.1016/j.geb.2006.03.015 [45] Roughgarden,T.(2005)。自私的路线和无政府状态的代价。麻省理工学院出版社·Zbl 1318.68065号 [46] Sauro、Luigi和Villata、Serena。(2013). 合作布尔博弈中的依赖性。《逻辑与计算杂志》,23(2),425-444·Zbl 1262.68168号 ·doi:10.1093/log.com/exr030 [47] Turrini,P.(2013)。内生布尔游戏。收件人:第24名实习生。人工制品联合会议。智力。(IJCAI-2013),第390-396页,中国北京。 [48] Wooldridge,M.,Endriss,U.,Kraus,S.,Lang,J.(2013)。布尔博弈的激励工程。人工智能,195418-439·Zbl 1270.68340号 ·doi:10.1016/j.artint.2012.11.003 [49] Zhang,W.,Xing,Z.,Wang,G.,Wittenburg,L.(2005年)。分布式随机搜索和分布式突破:传感器网络中约束优化问题的特性、比较和应用。人工智能,161,1-2:55-88·Zbl 1132.68718号 ·doi:10.1016/j.artint.2004.10.004 [50] Zivan,R.和Meisels,A.(2005年)。磁盘异步回溯的动态排序。收录于:CP-2005,第32-46页,西格特斯(巴塞罗那),西班牙·Zbl 1153.68498号 [51] Zivan,R.和Meisels,A.(2006年)。分布式csp的并发搜索。人工智能,170440-461·Zbl 1131.68529号 ·doi:10.1016/j.artint.2005.12.005 [52] Zivan,R.和Meisels,A.(2006年)。消息延迟和disCSP搜索算法。数学与人工智能年鉴(AMAI),46,415-439·Zbl 1107.68106号 ·doi:10.1007/s10472-006-9033-2 [53] Zivan,R.、Glinton,R.和Sycara,K.P.(2009年)。大型移动传感代理团队的分布式约束优化。摘自:2009年IEEE/WIC/ACM智能代理技术国际会议论文集,IAT 2009,意大利米兰,2009年9月15-18日,第347-354页。 此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。