文件Zbl 1483.68193-zbMATH Open

朱利安·古铁雷斯;阿尼埃洛·穆拉诺;朱塞佩·佩雷利;萨沙·鲁宾;托马斯·斯蒂普尔斯;迈克尔·伍尔德里奇

定性和定量目标相结合的博弈均衡。（英语） Zbl 1483.68193号

学报信息。 58，第6号，585-610（2021）.

总结：我们研究的总体目标是开发技术来推理多智能体系统的平衡特性。我们将多智能体系统建模为并发博弈，其中每个参与者都是一个过程，假设其独立地、战略性地行动，以追求个人偏好。在本文中，我们在有限记忆策略的背景下研究这些游戏，我们假设玩家的偏好由一个定性和定量目标定义，这两个目标由一个词典顺序关联：玩家首先倾向于满足其定性目标（以线性时间逻辑的公式给出）然后倾向于最小化成本（由平均值函数给出）。我们的主要结果是，在这种博弈中决定严格纳什均衡的存在性是2到期时间-完全（因此是可判定的），即使玩家的偏离被实现为无限记忆策略。

引用于三文件

MSC公司：

60年第68季度	规范和验证（程序逻辑、模型检查等）
03B44号	时间逻辑
68T42型	Agent技术与人工智能
91A80型	博弈论的应用

PDF格式 BibTeX公司 XML格式引用

全文：内政部 arXiv公司链接

参考文献：

[1]	Alechina，N.、Logan，B.、Nga，N.H.、Raimondi，F.：以资源为基础的ATL与资源生产和消耗的模型选择。CoRR，arXiv:1504.06766（2015）·Zbl 1371.68173号
[2]	Almagor，S.，Kupferman，O.，Perelli，G.：定量目标博弈中可控Nash均衡的合成。摘自：《第二十七届国际人工智能联合会议论文集》，2018年7月13日至19日，瑞典斯德哥尔摩，第35-41页（2018）
[3]	Alur，R.，《网络物理系统原理》（2015），剑桥：麻省理工学院出版社，剑桥
[4]	阿鲁尔（Alur，R.）。；田纳西州亨辛格；Kupferman，O.，《交替时间时序逻辑》，J.ACM，49，5，672-713（2002）·Zbl 1326.68181号 ·doi:10.1145/585265.585270
[5]	Bang-Jensen，J。；Gutin，G.，《有向图：理论、算法和应用》（2008），柏林：施普林格出版社，柏林·兹比尔1001.0002
[6]	Binmore，K.，《趣味与游戏：博弈论文本》（1992），列克星敦：D.C.Heath and Company，列克星顿·Zbl 0757.90087号
[7]	Bloem，R.、Chatterjee，K.、Henzinger，T.A.、Jobstmann，B.：通过定量目标提高合成质量。收录于：CAV’09，第140-156页（2009）·Zbl 1242.68151号
[8]	Bonzon，E.，Lagasquie，M.-C.，Lang，J.，Zanuttini，B.：重新审视布尔游戏。摘自：《第十七届欧洲人工智能会议记录》（ECAI-2006），意大利Riva del Garda（2006）
[9]	鲍耶，P。；Brenguier，R。；马基，N。；Ummels，M.，并发确定性博弈中的纯纳什均衡，Log。方法计算。科学。(2015) ·Zbl 1320.91010号 ·doi:10.2168/LMCS-11（2:9）2015年
[10]	布拉夫曼，R。；Domshlak，C.，《关于代理团队规划的复杂性及其对单代理规划的影响》，Artif。智力。，198, 52-71 (2013) ·Zbl 1284.68564号 ·doi:10.1016/j.artint.2012.08.05
[11]	Brafman，R.、Domshlak，C.、Engel，Y.、Tennenholtz，M.：规划游戏。In:第二十届国际人工智能联合会议记录（IJCAI-09）（2009）
[12]	Bruyère，V.，Meunier，N.，Raskin，J.-F.：加权博弈中的安全均衡。收录于：CSL-LICS’14，第26:1-26:26页（2014）·Zbl 1401.91012号
[13]	Bulling，N.，Goranko，V.：如何既富有又快乐：关于多层游戏的定量和定性战略推理相结合（扩展抽象）。收录于：SR'13，第33-41页（2013年·Zbl 1464.68408号
[14]	查特吉，K。；Doyen，L.，《能源平价游戏》，Theor。计算。科学。，458, 49-60 (2012) ·Zbl 1260.91039号 ·doi:10.1016/j.tcs.2012.07.038
[15]	Chatterjee，K.，Henzinger，T.A.，Jurdzinski，M.：Mean-payoff平价游戏。收录于：LICS’05，第178-187页（2005）
[16]	查特吉，K。；TA Henzinger；彼得曼，N.，战略逻辑，信息计算。，208, 6, 677-693 (2010) ·Zbl 1205.68197号 ·doi:10.1016/j.ic.2009.07.004
[17]	克拉克，EM；Grumberg，O。；Peled，DA，模型检验（2000），剑桥：麻省理工学院出版社，剑桥·Zbl 1423.68002号
[18]	Demri，S。；V.戈兰科。；Lange，M.，《计算机科学中的时间逻辑》（2017），剑桥：剑桥大学出版社，剑桥·Zbl 1380.68003号
[19]	Dunne，P.E.，Kraus，S.，van der Hoek，W.，Wooldridge，M.：合作布尔游戏。收录于：葡萄牙埃斯特里尔第七届国际自主代理和多代理系统联合会议（AAMAS-2008）会议记录（2008）
[20]	埃伦菲赫特，A。；Mycielski，J.，平均收益博弈的位置策略，国际博弈论，8，2，109-113（1979）·Zbl 0499.90098号 ·doi:10.1007/BF01768705
[21]	艾默生，EA；van Leeuwen，J.，时间和模态逻辑，《理论计算机科学手册B卷：形式模型和语义》，996-1072（1990），阿姆斯特丹：Elsevier，Amsterdam·Zbl 0900.03030号
[22]	Fisman，D.，Kupferman，O.，Lustig，Y.：理性合成。收录于：TACAS’10，第190-204页。施普林格（2010）·Zbl 1284.68396号
[23]	Grant，J.，Kraus，S.，Wooldridge，M.，Zuckerman，I.：通过通信操纵布尔游戏。摘自：第二十二届国际人工智能联合会议（IJCAI-11）会议记录，西班牙加泰罗尼亚巴塞罗那（2011）
[24]	古铁雷斯，J。；Harrenstein，P。；Wooldridge，M.，迭代布尔游戏，信息计算。，242, 53-79 (2015) ·Zbl 1318.91012号 ·doi:10.1016/j.ic.2015.03.011
[25]	古铁雷斯，J。；Harrenstein，P。；Wooldridge，M.，《从模型检查到平衡检查：理性验证的反应模块》，Artif。智力。，248, 123-157 (2017) ·Zbl 1420.68129号 ·doi:10.1016/j.artint.2017.04.003
[26]	古铁雷斯，J。；哈伦斯坦，P。；佩雷利，G。；伍德里奇，MJ，纳什均衡和互模拟不变性，Log。方法计算。科学。(2019) ·Zbl 1442.68142号 ·doi:10.23638/LMCS-15（3:32）2019年
[27]	Gutierrez，J.，Murano，A.，Perelli，G.，Rubin，S.，Wooldridge，M.J.：具有词汇偏好的并发游戏中的纳什均衡。在：IJCAI，第1067-1073页（2017）
[28]	Harrenstein，P.，van der Hoek，W.，Meyer，J.-J.Ch.，Witteveen，C.：布尔游戏。摘自：van Benthem，J.（编辑）《第八届理性与知识理论方面会议记录》（TARK VIII），意大利锡耶纳，第287-298页（2001）
[29]	伊诺夫斯基，E。；Ong，L.，关于两层布尔对策中平衡点的决策问题的复杂性，Artif。智力。，261, 1-15 (2018) ·Zbl 1452.91012号 ·doi:10.1016/j.artint.2018.04.006
[30]	Jurdzinski，M.，决定平价游戏的获胜者是在UP（\cap）co-UP，Inf.过程中。莱特。，68, 3, 119-124 (1998) ·Zbl 1338.68109号 ·doi:10.1016/S0020-0190（98）00150-1
[31]	Kosaraju，S.R.，Sullivan，G.：检测多项式时间内动态图中的循环。收录于：STOC'88，第398-406页。ACM（1988）
[32]	库普夫曼，O。；佩雷利，G。；瓦尔迪，MY，《理性环境的综合》，《数学年鉴》。Artif公司。智力。，78, 1, 3-20 (2016) ·Zbl 1372.68173号 ·doi:10.1007/s10472-016-9508-8
[33]	马图塞克，J。；Gärtner，B.，《理解和使用线性规划》（2007），柏林：施普林格出版社，柏林·Zbl 1133.90001号
[34]	梅吉多，N。；Papadimitriou，CH，关于全函数，存在定理和计算复杂性，Theor。计算。科学。，81, 2, 317-324 (1991) ·Zbl 0731.68036号 ·doi:10.1016/0304-3975（91）90200-L
[35]	奥斯本，MJ；Rubinstein，A.，《博弈论课程》（1994），剑桥：麻省理工学院出版社，剑桥·Zbl 1194.91003号
[36]	Piterman，N.，《从非确定性Büchi和Streett自动机到确定性奇偶自动机》，Log。方法计算。科学。，3, 3, 255-264 (2007) ·Zbl 1125.68067号 ·doi:10.2168/LMCS3（3:5）2007年
[37]	普努利：程序的时序逻辑。摘自：第十八届IEEE计算机科学基础研讨会论文集，第46-57页（1977年）
[38]	Pnueli，A.，Rosner，R.：关于反应模的合成。收录于：POPL'89，第179-190页。ACM（1989）·Zbl 0686.68015号
[39]	罗斯纳，R.：反应系统的模块化合成。魏茨曼博士论文（1991）
[40]	肖姆，Y。；Leyton-Brown，K.，《多智能体系统：算法、博弈论和逻辑基础》（2008），剑桥：剑桥大学出版社，剑桥·Zbl 1163.91006号 ·doi:10.1017/CBO9780511811654
[41]	史密斯，JM，《进化与游戏理论》（1982），剑桥：剑桥大学出版社，剑桥·Zbl 0526.90102号 ·doi:10.1017/CBO9780511806292
[42]	Tarjan，RE，深度优先搜索和线性图算法，SIAM J.Compute。，1, 2, 146-160 (1972) ·Zbl 0251.05107号 ·数字对象标识代码：10.1137/0201010
[43]	Ummels，M.，Wojtczak，D.：极限平均博弈中纳什均衡的复杂性。收录于：CONCUR’11，第482-496页（2011年）·Zbl 1343.68177号
[44]	Vardi，M.Y.：线性时序逻辑的自动机理论方法。收录于：并行结构与自动机的逻辑（第八届班夫高阶研讨会，1995年8月27日至9月3日，会议记录），第238-266页（1995）
[45]	Velner，Y。；查特吉，K。；Doyen，L。；TA Henzinger；拉比诺维奇，AM；Raskin，J-F，《多平均路径和多能量游戏的复杂性》，Inf.Compute。，241, 177-196 (2015) ·Zbl 1309.68082号 ·doi:10.1016/j.ic.2015.03.001
[46]	伍尔德里奇，M。；Endriss，美国。；克劳斯，S。；Lang，J.，《布尔游戏的激励工程》，Artif。智力。，195, 418-439 (2013) ·兹比尔1270.68340 ·doi:10.1016/j.artint.2012.11.003
[47]	Wooldridge，M.，Gutierrez，J.，Harrenstein，P.，Marchioni，E.，Perelli，G.，Toumi，A.：理性验证：从模型检验到均衡检验。摘自：AAAI’16，第4184-4191页（2016）
[48]	美国兹威克。；Paterson，M.，图上平均支付博弈的复杂性，TCS，158，1-2，343-359（1996）·Zbl 0871.68138号 ·doi:10.1016/0304-3975（95）00188-3

此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配，可能包含数据转换错误。在某些情况下，zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献，而不要求完整或完全匹配。

任何	在任何地方
一个	内部文档标识符
澳大利亚	作者、编辑
人工智能	内部作者标识符
钛	标题
洛杉矶	语言
所以	来源
ab公司	回顾，摘要
第页	出版年份
右心室	评审员
复写的副本	MSC代码
美国犹他州	关键字
日期	文件类型(j个：期刊文章；b条：book；一：图书文章）

一&b条	逻辑和
一\|b条	逻辑或
!ab公司	逻辑不
美国广播公司*	右通配符
"ab c公司"	短语
(ab c公司)	圆括号

示例

领域

操作员

定性和定量目标相结合的博弈均衡。（英语） Zbl 1483.68193号

MSC公司：

参考文献：

示例

领域

操作员

定性和定量目标相结合的博弈均衡。 （英语） Zbl 1483.68193号

MSC公司：

参考文献：

定性和定量目标相结合的博弈均衡。（英语） Zbl 1483.68193号