×

定性和定量目标相结合的博弈均衡。 (英语) Zbl 1483.68193号

总结:我们研究的总体目标是开发技术来推理多智能体系统的平衡特性。我们将多智能体系统建模为并发博弈,其中每个参与者都是一个过程,假设其独立地、战略性地行动,以追求个人偏好。在本文中,我们在有限记忆策略的背景下研究这些游戏,我们假设玩家的偏好由一个定性和定量目标定义,这两个目标由一个词典顺序关联:玩家首先倾向于满足其定性目标(以线性时间逻辑的公式给出)然后倾向于最小化成本(由平均值函数给出)。我们的主要结果是,在这种博弈中决定严格纳什均衡的存在性是2到期时间-完全(因此是可判定的),即使玩家的偏离被实现为无限记忆策略。

MSC公司:

60年第68季度 规范和验证(程序逻辑、模型检查等)
03B44号 时间逻辑
68T42型 Agent技术与人工智能
91A80型 博弈论的应用
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Alechina,N.、Logan,B.、Nga,N.H.、Raimondi,F.:以资源为基础的ATL与资源生产和消耗的模型选择。CoRR,arXiv:1504.06766(2015)·Zbl 1371.68173号
[2] Almagor,S.,Kupferman,O.,Perelli,G.:定量目标博弈中可控Nash均衡的合成。摘自:《第二十七届国际人工智能联合会议论文集》,2018年7月13日至19日,瑞典斯德哥尔摩,第35-41页(2018)
[3] Alur,R.,《网络物理系统原理》(2015),剑桥:麻省理工学院出版社,剑桥
[4] 阿鲁尔(Alur,R.)。;田纳西州亨辛格;Kupferman,O.,《交替时间时序逻辑》,J.ACM,49,5,672-713(2002)·Zbl 1326.68181号 ·doi:10.1145/585265.585270
[5] Bang-Jensen,J。;Gutin,G.,《有向图:理论、算法和应用》(2008),柏林:施普林格出版社,柏林·兹比尔1001.0002
[6] Binmore,K.,《趣味与游戏:博弈论文本》(1992),列克星敦:D.C.Heath and Company,列克星顿·Zbl 0757.90087号
[7] Bloem,R.、Chatterjee,K.、Henzinger,T.A.、Jobstmann,B.:通过定量目标提高合成质量。收录于:CAV’09,第140-156页(2009)·Zbl 1242.68151号
[8] Bonzon,E.,Lagasquie,M.-C.,Lang,J.,Zanuttini,B.:重新审视布尔游戏。摘自:《第十七届欧洲人工智能会议记录》(ECAI-2006),意大利Riva del Garda(2006)
[9] 鲍耶,P。;Brenguier,R。;马基,N。;Ummels,M.,并发确定性博弈中的纯纳什均衡,Log。方法计算。科学。(2015) ·Zbl 1320.91010号 ·doi:10.2168/LMCS-11(2:9)2015年
[10] 布拉夫曼,R。;Domshlak,C.,《关于代理团队规划的复杂性及其对单代理规划的影响》,Artif。智力。,198, 52-71 (2013) ·Zbl 1284.68564号 ·doi:10.1016/j.artint.2012.08.05
[11] Brafman,R.、Domshlak,C.、Engel,Y.、Tennenholtz,M.:规划游戏。In:第二十届国际人工智能联合会议记录(IJCAI-09)(2009)
[12] Bruyère,V.,Meunier,N.,Raskin,J.-F.:加权博弈中的安全均衡。收录于:CSL-LICS’14,第26:1-26:26页(2014)·Zbl 1401.91012号
[13] Bulling,N.,Goranko,V.:如何既富有又快乐:关于多层游戏的定量和定性战略推理相结合(扩展抽象)。收录于:SR'13,第33-41页(2013年·Zbl 1464.68408号
[14] 查特吉,K。;Doyen,L.,《能源平价游戏》,Theor。计算。科学。,458, 49-60 (2012) ·Zbl 1260.91039号 ·doi:10.1016/j.tcs.2012.07.038
[15] Chatterjee,K.,Henzinger,T.A.,Jurdzinski,M.:Mean-payoff平价游戏。收录于:LICS’05,第178-187页(2005)
[16] 查特吉,K。;TA Henzinger;彼得曼,N.,战略逻辑,信息计算。,208, 6, 677-693 (2010) ·Zbl 1205.68197号 ·doi:10.1016/j.ic.2009.07.004
[17] 克拉克,EM;Grumberg,O。;Peled,DA,模型检验(2000),剑桥:麻省理工学院出版社,剑桥·Zbl 1423.68002号
[18] Demri,S。;V.戈兰科。;Lange,M.,《计算机科学中的时间逻辑》(2017),剑桥:剑桥大学出版社,剑桥·Zbl 1380.68003号
[19] Dunne,P.E.,Kraus,S.,van der Hoek,W.,Wooldridge,M.:合作布尔游戏。收录于:葡萄牙埃斯特里尔第七届国际自主代理和多代理系统联合会议(AAMAS-2008)会议记录(2008)
[20] 埃伦菲赫特,A。;Mycielski,J.,平均收益博弈的位置策略,国际博弈论,8,2,109-113(1979)·Zbl 0499.90098号 ·doi:10.1007/BF01768705
[21] 艾默生,EA;van Leeuwen,J.,时间和模态逻辑,《理论计算机科学手册B卷:形式模型和语义》,996-1072(1990),阿姆斯特丹:Elsevier,Amsterdam·Zbl 0900.03030号
[22] Fisman,D.,Kupferman,O.,Lustig,Y.:理性合成。收录于:TACAS’10,第190-204页。施普林格(2010)·Zbl 1284.68396号
[23] Grant,J.,Kraus,S.,Wooldridge,M.,Zuckerman,I.:通过通信操纵布尔游戏。摘自:第二十二届国际人工智能联合会议(IJCAI-11)会议记录,西班牙加泰罗尼亚巴塞罗那(2011)
[24] 古铁雷斯,J。;Harrenstein,P。;Wooldridge,M.,迭代布尔游戏,信息计算。,242, 53-79 (2015) ·Zbl 1318.91012号 ·doi:10.1016/j.ic.2015.03.011
[25] 古铁雷斯,J。;Harrenstein,P。;Wooldridge,M.,《从模型检查到平衡检查:理性验证的反应模块》,Artif。智力。,248, 123-157 (2017) ·Zbl 1420.68129号 ·doi:10.1016/j.artint.2017.04.003
[26] 古铁雷斯,J。;哈伦斯坦,P。;佩雷利,G。;伍德里奇,MJ,纳什均衡和互模拟不变性,Log。方法计算。科学。(2019) ·Zbl 1442.68142号 ·doi:10.23638/LMCS-15(3:32)2019年
[27] Gutierrez,J.,Murano,A.,Perelli,G.,Rubin,S.,Wooldridge,M.J.:具有词汇偏好的并发游戏中的纳什均衡。在:IJCAI,第1067-1073页(2017)
[28] Harrenstein,P.,van der Hoek,W.,Meyer,J.-J.Ch.,Witteveen,C.:布尔游戏。摘自:van Benthem,J.(编辑)《第八届理性与知识理论方面会议记录》(TARK VIII),意大利锡耶纳,第287-298页(2001)
[29] 伊诺夫斯基,E。;Ong,L.,关于两层布尔对策中平衡点的决策问题的复杂性,Artif。智力。,261, 1-15 (2018) ·Zbl 1452.91012号 ·doi:10.1016/j.artint.2018.04.006
[30] Jurdzinski,M.,决定平价游戏的获胜者是在UP(\cap)co-UP,Inf.过程中。莱特。,68, 3, 119-124 (1998) ·Zbl 1338.68109号 ·doi:10.1016/S0020-0190(98)00150-1
[31] Kosaraju,S.R.,Sullivan,G.:检测多项式时间内动态图中的循环。收录于:STOC'88,第398-406页。ACM(1988)
[32] 库普夫曼,O。;佩雷利,G。;瓦尔迪,MY,《理性环境的综合》,《数学年鉴》。Artif公司。智力。,78, 1, 3-20 (2016) ·Zbl 1372.68173号 ·doi:10.1007/s10472-016-9508-8
[33] 马图塞克,J。;Gärtner,B.,《理解和使用线性规划》(2007),柏林:施普林格出版社,柏林·Zbl 1133.90001号
[34] 梅吉多,N。;Papadimitriou,CH,关于全函数,存在定理和计算复杂性,Theor。计算。科学。,81, 2, 317-324 (1991) ·Zbl 0731.68036号 ·doi:10.1016/0304-3975(91)90200-L
[35] 奥斯本,MJ;Rubinstein,A.,《博弈论课程》(1994),剑桥:麻省理工学院出版社,剑桥·Zbl 1194.91003号
[36] Piterman,N.,《从非确定性Büchi和Streett自动机到确定性奇偶自动机》,Log。方法计算。科学。,3, 3, 255-264 (2007) ·Zbl 1125.68067号 ·doi:10.2168/LMCS3(3:5)2007年
[37] 普努利:程序的时序逻辑。摘自:第十八届IEEE计算机科学基础研讨会论文集,第46-57页(1977年)
[38] Pnueli,A.,Rosner,R.:关于反应模的合成。收录于:POPL'89,第179-190页。ACM(1989)·Zbl 0686.68015号
[39] 罗斯纳,R.:反应系统的模块化合成。魏茨曼博士论文(1991)
[40] 肖姆,Y。;Leyton-Brown,K.,《多智能体系统:算法、博弈论和逻辑基础》(2008),剑桥:剑桥大学出版社,剑桥·Zbl 1163.91006号 ·doi:10.1017/CBO9780511811654
[41] 史密斯,JM,《进化与游戏理论》(1982),剑桥:剑桥大学出版社,剑桥·Zbl 0526.90102号 ·doi:10.1017/CBO9780511806292
[42] Tarjan,RE,深度优先搜索和线性图算法,SIAM J.Compute。,1, 2, 146-160 (1972) ·Zbl 0251.05107号 ·数字对象标识代码:10.1137/0201010
[43] Ummels,M.,Wojtczak,D.:极限平均博弈中纳什均衡的复杂性。收录于:CONCUR’11,第482-496页(2011年)·Zbl 1343.68177号
[44] Vardi,M.Y.:线性时序逻辑的自动机理论方法。收录于:并行结构与自动机的逻辑(第八届班夫高阶研讨会,1995年8月27日至9月3日,会议记录),第238-266页(1995)
[45] Velner,Y。;查特吉,K。;Doyen,L。;TA Henzinger;拉比诺维奇,AM;Raskin,J-F,《多平均路径和多能量游戏的复杂性》,Inf.Compute。,241, 177-196 (2015) ·Zbl 1309.68082号 ·doi:10.1016/j.ic.2015.03.001
[46] 伍尔德里奇,M。;Endriss,美国。;克劳斯,S。;Lang,J.,《布尔游戏的激励工程》,Artif。智力。,195, 418-439 (2013) ·兹比尔1270.68340 ·doi:10.1016/j.artint.2012.11.003
[47] Wooldridge,M.,Gutierrez,J.,Harrenstein,P.,Marchioni,E.,Perelli,G.,Toumi,A.:理性验证:从模型检验到均衡检验。摘自:AAAI’16,第4184-4191页(2016)
[48] 美国兹威克。;Paterson,M.,图上平均支付博弈的复杂性,TCS,158,1-2,343-359(1996)·Zbl 0871.68138号 ·doi:10.1016/0304-3975(95)00188-3
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。