朱利安·古铁雷斯;阿尼埃洛·穆拉诺;朱塞佩·佩雷利;萨沙·鲁宾;托马斯·斯蒂普尔斯;迈克尔·伍尔德里奇 定性和定量目标相结合的博弈均衡。 (英语) Zbl 1483.68193号 学报信息。 58,第6号,585-610(2021)。 总结:我们研究的总体目标是开发技术来推理多智能体系统的平衡特性。我们将多智能体系统建模为并发博弈,其中每个参与者都是一个过程,假设其独立地、战略性地行动,以追求个人偏好。在本文中,我们在有限记忆策略的背景下研究这些游戏,我们假设玩家的偏好由一个定性和定量目标定义,这两个目标由一个词典顺序关联:玩家首先倾向于满足其定性目标(以线性时间逻辑的公式给出)然后倾向于最小化成本(由平均值函数给出)。我们的主要结果是,在这种博弈中决定严格纳什均衡的存在性是2到期时间-完全(因此是可判定的),即使玩家的偏离被实现为无限记忆策略。 引用于三文件 MSC公司: 60年第68季度 规范和验证(程序逻辑、模型检查等) 03B44号 时间逻辑 68T42型 Agent技术与人工智能 91A80型 博弈论的应用 PDF格式BibTeX公司 XML格式引用 \textit{J.Gutierrez}等人,《信息学报》58,第6期,585--610(2021年;Zbl 1483.68193) 全文: 内政部 arXiv公司 链接 参考文献: [1] Alechina,N.、Logan,B.、Nga,N.H.、Raimondi,F.:以资源为基础的ATL与资源生产和消耗的模型选择。CoRR,arXiv:1504.06766(2015)·Zbl 1371.68173号 [2] Almagor,S.,Kupferman,O.,Perelli,G.:定量目标博弈中可控Nash均衡的合成。摘自:《第二十七届国际人工智能联合会议论文集》,2018年7月13日至19日,瑞典斯德哥尔摩,第35-41页(2018) [3] Alur,R.,《网络物理系统原理》(2015),剑桥:麻省理工学院出版社,剑桥 [4] 阿鲁尔(Alur,R.)。;田纳西州亨辛格;Kupferman,O.,《交替时间时序逻辑》,J.ACM,49,5,672-713(2002)·Zbl 1326.68181号 ·doi:10.1145/585265.585270 [5] Bang-Jensen,J。;Gutin,G.,《有向图:理论、算法和应用》(2008),柏林:施普林格出版社,柏林·Zbl 1001.05002号 [6] Binmore,K.,《趣味与游戏:博弈论文本》(1992),列克星敦:D.C.Heath and Company,列克星顿·Zbl 0757.90087号 [7] Bloem,R.、Chatterjee,K.、Henzinger,T.A.、Jobstmann,B.:通过定量目标提高合成质量。载于:CAV’09,第140-156页(2009年)·Zbl 1242.68151号 [8] Bonzon,E.,Lagasquie,M.-C.,Lang,J.,Zanuttini,B.:重新审视布尔游戏。摘自:《第十七届欧洲人工智能会议记录》(ECAI-2006),意大利Riva del Garda(2006) [9] 鲍耶,P。;Brenguier,R。;马基,N。;Ummels,M.,并发确定性博弈中的纯纳什均衡,Log。方法计算。科学。(2015) ·Zbl 1320.91010号 ·doi:10.2168/LMCS-11(2:9)2015年 [10] 布拉夫曼,R。;Domshlak,C.,《关于代理团队规划的复杂性及其对单代理规划的影响》,Artif。智力。,198, 52-71 (2013) ·兹比尔1284.68564 ·doi:10.1016/j.artint.2012.08.05 [11] Brafman,R.、Domshlak,C.、Engel,Y.、Tennenholtz,M.:规划游戏。收录于:第二十一届国际人工智能联合会议论文集(IJCAI-09)(2009年) [12] Bruyère,V.,Meunier,N.,Raskin,J.-F.:加权博弈中的安全均衡。收录于:CSL-LICS’14,第26:1-26:26页(2014)·Zbl 1401.91012号 [13] Bulling,N.,Goranko,V.:如何既富有又快乐:关于多层游戏的定量和定性战略推理相结合(扩展抽象)。收录于:SR'13,第33-41页(2013年·Zbl 1464.68408号 [14] 查特吉,K。;Doyen,L.,《能源平价游戏》,Theor。计算。科学。,458, 49-60 (2012) ·Zbl 1260.91039号 ·doi:10.1016/j.tcs.2012.07.038 [15] Chatterjee,K.,Henzinger,T.A.,Jurdzinski,M.:Mean-payoff平价游戏。收录于:LICS’05,第178-187页(2005) [16] 查特吉,K。;田纳西州亨辛格;彼得曼,N.,战略逻辑,信息计算。,208, 6, 677-693 (2010) ·Zbl 1205.68197号 ·doi:10.1016/j.ic.2009.07.004 [17] EM克拉克;格伦伯格,O。;Peled,DA,模型检验(2000),剑桥:麻省理工学院出版社,剑桥·Zbl 1423.68002号 [18] Demri,S。;V.戈兰科。;Lange,M.,《计算机科学中的时间逻辑》(2017),剑桥:剑桥大学出版社,剑桥·Zbl 1380.68003号 [19] Dunne,P.E.,Kraus,S.,van der Hoek,W.,Wooldridge,M.:合作布尔游戏。收录于:葡萄牙埃斯特里尔第七届国际自主代理和多代理系统联合会议(AAMAS-2008)会议记录(2008) [20] 埃伦菲赫特,A。;Mycielski,J.,平均收益博弈的位置策略,国际博弈论,8,2109-113(1979)·Zbl 0499.90098号 ·doi:10.1007/BF01768705 [21] 艾默生,EA;van Leeuwen,J.,时间和模态逻辑,《理论计算机科学手册B卷:形式模型和语义》,996-1072(1990),阿姆斯特丹:Elsevier,Amsterdam·Zbl 0900.03030号 [22] Fisman,D.,Kupferman,O.,Lustig,Y.:理性合成。收录于:TACAS’10,第190-204页。施普林格(2010)·Zbl 1284.68396号 [23] Grant,J.,Kraus,S.,Wooldridge,M.,Zuckerman,I.:通过通信操纵布尔游戏。摘自:第二十二届国际人工智能联合会议(IJCAI-11)会议记录,西班牙加泰罗尼亚巴塞罗那(2011) [24] 古铁雷斯,J。;Harrenstein,P。;Wooldridge,M.,迭代布尔游戏,信息计算。,242, 53-79 (2015) ·兹比尔1318.91012 ·doi:10.1016/j.ic.2015.03.011 [25] 古铁雷斯,J。;Harrenstein,P。;Wooldridge,M.,从模型检验到平衡检验:用于理性验证的反应模块,人工制品。智力。,248, 123-157 (2017) ·Zbl 1420.68129号 ·doi:10.1016/j.artint.2017.04.003 [26] 古铁雷斯,J。;Harrenstein,P。;佩雷利,G。;伍德里奇,MJ,纳什均衡和互模拟不变性,Log。方法计算。科学。(2019) ·Zbl 1442.68142号 ·doi:10.23638/LMCS-15(3:32)2019年 [27] Gutierrez,J.,Murano,A.,Perelli,G.,Rubin,S.,Wooldridge,M.J.:具有词汇偏好的并发游戏中的纳什均衡。收录于:IJCAI,第1067-1073页(2017年) [28] Harrenstein,P.,van der Hoek,W.,Meyer,J.-J.Ch.,Witteveen,C.:布尔游戏。摘自:van Benthem,J.(编辑)《第八届理性与知识理论方面会议记录》(TARK VIII),意大利锡耶纳,第287-298页(2001) [29] 伊诺夫斯基,E。;Ong,L.,关于两层布尔对策中平衡点的决策问题的复杂性,Artif。智力。,261, 1-15 (2018) ·Zbl 1452.91012号 ·doi:10.1016/j.artint.2018.04.006 [30] Jurdzinski,M.,决定平价游戏的获胜者是在UP(\cap)co-UP,Inf.过程中。莱特。,68, 3, 119-124 (1998) ·Zbl 1338.68109号 ·doi:10.1016/S0020-0190(98)00150-1 [31] Kosaraju,S.R.,Sullivan,G.:在多项式时间内检测动态图中的循环。收录于:STOC'88,第398-406页。ACM(1988) [32] 库普夫曼,O。;佩雷利,G。;瓦尔迪,MY,《理性环境的综合》,《数学年鉴》。Artif公司。智力。,78, 1, 3-20 (2016) ·Zbl 1372.68173号 ·doi:10.1007/s10472-016-9508-8 [33] 马图塞克,J。;Gärtner,B.,《理解和使用线性规划》(2007),柏林:施普林格出版社,柏林·Zbl 1133.90001号 [34] 梅吉多,N。;Papadimitriou,CH,关于全函数,存在定理和计算复杂性,Theor。计算。科学。,81, 2, 317-324 (1991) ·Zbl 0731.68036号 ·doi:10.1016/0304-3975(91)90200-L [35] 奥斯本,MJ;Rubinstein,A.,《博弈论课程》(1994),剑桥:麻省理工学院出版社,剑桥·Zbl 1194.91003号 [36] Piterman,N.,从非确定性Büchi和Street自动机到确定性奇偶自动机,Log。方法计算。科学。,3, 3, 255-264 (2007) ·Zbl 1125.68067号 ·doi:10.2168/LMCS-3(3:5)2007年 [37] 普努利:程序的时序逻辑。摘自:第十八届IEEE计算机科学基础研讨会论文集,第46-57页(1977年) [38] Pnueli,A.,Rosner,R.:关于反应模的合成。收录于:POPL'89,第179-190页。ACM(1989)·Zbl 0686.68015号 [39] Rosner,R.:反应系统的模块化合成。魏茨曼博士论文(1991) [40] 肖姆,Y。;Leyton-Brown,K.,《多智能体系统:算法、博弈论和逻辑基础》(2008),剑桥:剑桥大学出版社,剑桥·Zbl 1163.91006号 ·doi:10.1017/CBO9780511811654 [41] 史密斯,JM,《进化与游戏理论》(1982),剑桥:剑桥大学出版社,剑桥·Zbl 0526.90102号 ·doi:10.1017/CBO9780511806292 [42] Tarjan,RE,深度优先搜索和线性图算法,SIAM J.Compute。,1, 2, 146-160 (1972) ·Zbl 0251.05107号 ·doi:10.1137/201010 [43] Ummels,M.,Wojtczak,D.:极限平均博弈中纳什均衡的复杂性。收录于:CONCUR’11,第482-496页(2011年)·兹比尔1343.68177 [44] Vardi,M.Y.:线性时序逻辑的自动机理论方法。收录于:并行结构与自动机的逻辑(第八届班夫高阶研讨会,1995年8月27日至9月3日,会议记录),第238-266页(1995) [45] Velner,Y。;查特吉,K。;Doyen,L。;田纳西州亨辛格;拉比诺维奇,AM;Raskin,J-F,《多平均路径和多能量游戏的复杂性》,Inf.Compute。,241, 177-196 (2015) ·Zbl 1309.68082号 ·doi:10.1016/j.ic.2015.03.001 [46] 伍尔德里奇,M。;Endriss,美国。;克劳斯,S。;Lang,J.,布尔游戏激励工程,人工制品。智力。,195, 418-439 (2013) ·Zbl 1270.68340号 ·doi:10.1016/j.artint.2012.11.003(文件编号:10.1016/j.artint.2012.11.003) [47] Wooldridge,M.,Gutierrez,J.,Harrenstein,P.,Marchioni,E.,Perelli,G.,Toumi,A.:理性验证:从模型检验到均衡检验。摘自:AAAI’16,第4184-4191页(2016) [48] 美国兹威克。;Paterson,M.,图上平均支付博弈的复杂性,TCS,158,1-2,343-359(1996)·Zbl 0871.68138号 ·doi:10.1016/0304-3975(95)00188-3 此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。