×

纳什均衡与互模拟不变性。 (英语) 兹布1442.68142

摘要:博弈论为并发和多智能体系统的分析提供了一个成熟的框架。其基本思想是并发进程(代理)可以理解为对应于博弈中的玩家;plays表示系统可能的计算运行;策略定义了代理人的行为。通常,策略被建模为从系统状态序列到玩家动作的函数。在这种情况下分析一个系统涉及到计算并发博弈中的(纳什)均衡集。然而,我们发现,对于上述策略模型(可以说是计算机科学文献中的“标准”模型),双相似性不能保持纳什均衡的存在. 因此,从语义的角度来看,两个行为上等价的,并且从逻辑的角度满足相同的时间逻辑公式的并发博弈,从博弈论的角度来看,它们可能具有根本不同的性质(解)。本文旨在探讨这一发现所引发的问题。在用一个激励性的例子说明了这个问题之后,我们提出了三个在双相似性下保持纳什均衡存在的策略模型。我们使用这些策略模型中的一些来为策略推理提供新的语义基础,并且研究了在计算机科学文献中,相对于传统的策略模型,可以证明二相似性以保持纳什均衡的存在的限制场景。

理学硕士:

6885年 并行和分布式计算的模型和方法(过程代数、互模拟、转移网等)
03B70型 计算机科学中的逻辑
68T42型 Agent技术与人工智能
91A10型 非合作博弈
PDF格式 BibTeX公司 XML 引用

参考文献:

[1] [AH99]拉吉夫·阿鲁尔和托马斯·A·亨辛格。反应模块。系统设计中的形式化方法,15(1):7-481999。
[2] [AHK02]R.Alur、T.A.Henzinger和O.Kupferman。交替时间时序逻辑。ACM杂志,49(5):672-7132002·Zbl 1326.68181
[3] [AHKV98]拉吉耶夫·阿鲁尔、托马斯·A·亨辛格、奥娜·库普尔曼和莫希·Y·瓦迪。交替求精关系。CONCUR,LNCS第1466卷,第163-178页。斯普林格,1998年·Zbl 1070.68524
[4] [AHM+98]拉吉耶夫·阿鲁尔、托马斯·A·亨辛格、弗雷迪·Y·C·曼格、沙兹·卡迪尔、斯里拉姆·K·拉贾马尼和塞尔达尔·塔什兰。MOCHA:模型检查中的模块化。在CAV,LNCS第1427卷,第521-525页。斯普林格,1998年。
[5] [BBMU11]P.Bouyer、R.Brenguier、Nicolas Markey和M.Ummels。具有B¨uchi目标的并发博弈中的纳什均衡。在S.Chakraborty和A.Kumar,第31届国际会议编辑·Zbl 1246.68122号
[6] [BBMU15]P.Bouyer、R.Brenguier、Nicolas Markey和M.Ummels。并发确定性对策中的纯纳什均衡。《计算机科学中的逻辑方法》,11(2:9):1-722015·Zbl 1320.91010号
[7] [BK08]C.Baier和J.-P.Katoen。模型检查原理。麻省理工学院出版社,2008年。
[8] [Bre13]罗曼·布伦圭尔。PRALINE:计算并发博弈中纳什均衡的工具。在CAV,LNCS第8044卷,第890-895页。斯普林格,2013年。
[9] [Bry92]兰德尔·E·布莱恩特。有序二元决策图的符号布尔操作。ACM计算机。调查。,24(3):293-3181992年。
[10] [CC02]帕特里克·库索和拉迪娅·库索。软件验证中的抽象。在CAV,LNCS第2404卷,第37-56页。斯普林格,2002年·Zbl 1010.68506
[11] [CE81]埃德蒙·M·克拉克和E·艾伦·爱默生。用分支时间时序逻辑设计和合成同步骨架。在程序逻辑中,LNCS第131卷,第52-71页。斯普林格,1981年。
[12] [CGL94]埃德蒙·M·克拉克、奥娜·格鲁伯格和大卫·E·朗。模型检查和抽象。ACM传输。程序。语言系统。,16(5):1512-15421994年。
[13] [CGP02]E.M.克拉克、O.格鲁伯格和D.A.佩雷德。模型检查。麻省理工学院出版社,2002年。
[14] [CHP10]克莉什南杜·查特吉、托马斯·A·亨辛格和尼尔皮特曼。战略逻辑。信息计算。,208(6):677-6932010年·Zbl 1205.68197
[15] [CLMM14]彼得塞尔姆阿克、阿莱西奥·洛穆西奥、法比奥·莫加韦罗和阿尼埃洛·穆拉诺。MCMAS-SLK:一个用于验证策略逻辑规范的模型检查器。在CAV,LNCS第8559卷,第525-532页。斯普林格,2014年。
[16] [DGL16]S.Demri,V.Goranko和M.Lange。计算机科学中的时间逻辑,剑桥理论计算机科学丛书第58卷。剑桥大学出版社,2016年。
[17] [DV95]R.De Nicola和F.W.Vaandrager。分支互模拟的三种逻辑。ACM杂志,42(2):458-4871995年·Zbl 0886.68064
[18] [FKL10]达娜·菲斯曼、奥娜·库普尔曼和尤德·拉斯蒂格。理性综合。塔卡斯,LNCS第6015卷,第190-204页。斯普林格,2010年·Zbl 1284.68396
[19] [FS10]伯纳德·芬克贝纳和斯文·舍维。协调逻辑。Anuj Dawar和Helmut Veith,编辑,CSL,LNCS第6247卷,第305-319页。斯普林格,2010年·Zbl 1287.03070
[20] [GHPW17]朱利安·古铁雷斯、保罗·哈伦斯坦、朱塞佩·佩雷利和迈克尔·伍尔德里奇。纳什均衡与互模拟不变性。CONCUR,LIPIcs第85卷,第17:1-17:16页。Schloss Dagstuhl,2017年。
[21] [GHW15a]朱利安·古铁雷斯、保罗·哈伦斯坦和迈克尔·伍尔德里奇。策略推理的可扩展性和复杂性结果。同意,LIPIcs第42卷,268-282页。Schloss Dagstuhl,2015年·Zbl 1374.68332
[22] [GHW15b]朱利安·古铁雷斯、保罗·哈伦斯坦和迈克尔·伍尔德里奇。迭代布尔对策。信息计算。,242:53-792015年·Zbl 1318.91012号
[23] [GHW17a]朱利安·古铁雷斯、保罗·哈伦斯坦和迈克尔·伍尔德里奇。从模型检验到平衡检验:理性验证的反应模块。人工智能,248:123-1572017年·Zbl 1420.68129
[24] [GHW17b]朱利安·古铁雷斯、保罗·哈伦斯坦和迈克尔·伍尔德里奇。关于类博弈并发系统均衡的推理。安。纯应用程序。逻辑,168(2):373-4032017年·Zbl 1400.03057
[25] [GNPW18]朱利安·古铁雷斯、穆罕默德·纳吉布、朱塞佩·佩雷利和迈克尔·伍尔德里奇。EVE:时间均衡分析工具。在阿特瓦,LNCS。斯普林格,2018年。
[26] [GW14]朱利安·古铁雷斯和迈克尔·伍尔德里奇。事件结构上并发博弈的均衡。在CSL-LICS中,第46:1-46:10页。ACM,2014年·Zbl 1401.68228
[27] [HM85]马修·轩尼诗和罗宾·米尔纳。不确定性和并发性的代数定律。J、 ACM,32(1):137-1611985年·Zbl 0629.68021
[28] [KNP11]玛塔·Z·奎亚特科夫斯卡、格钦·诺曼和大卫·帕克。Prism4.0:概率实时系统的验证。在CAV,LNCS第6806卷,第585-591页。斯普林格,2011年。
[29] [Koz83]德克斯特·科赞。关于命题mu演算的结果。理论计算机科学,27:333-3541983·Zbl 0553.03007
[30] [KPW16]Marta Kwiatkowska,David Parker和Clemens Wiltsche。Prism games 2.0:随机对策的多目标策略综合工具。塔卡斯,LNCS第9636卷,第560-566页。斯普林格,2016年。
[31] [Mil80]R.米尔纳。通信系统微积分,LNCS第92卷。斯普林格,1980年。
[32] [Mil89]R.米尔纳。通信和并发。普伦蒂斯·霍尔,1989年。
[33] [MMPV16]F.莫加韦罗、A.穆拉诺、G.佩雷利和M.Y.瓦尔迪。策略推理:关于可满足性问题。更正,abs/1611.08541,2016年·Zbl 1448.68312
[34] [MSZ13]M.Maschler、E.Solan和S.Zamir。博弈论。剑桥大学出版社,2013年·Zbl 1403.91003号
[35] [或94]M.J.奥斯本和A.鲁宾斯坦。博弈论课程。麻省理工学院出版社,1994年·Zbl 1194.91003号
[36] [Pau02]马克·保利。博弈中联盟力量的模态逻辑。J、 日志。计算机。,12(1):149-1662002年·Zbl 1003.91006号
[37] [Pnu77]埃米尔·普努埃利。程序的时序逻辑。FOBS,第46-57页。IEEE计算机协会,1977年。
[38] [PP03]马克·保利和罗希特·帕里克。游戏逻辑概述。逻辑研究,75(2):165-1822003·Zbl 1040.03013
[39] [San09]戴维德·桑吉奥吉。关于相互刺激和共同创造的起源。ACM传输。程序。语言系统。,2009年4月31日·兹布1285.68112
[40] [SR12]Davide Sangiorgi和Jan Rutten,编辑。在相互模拟和共同推导的高级课题,剑桥计算机科学理论丛书第52卷。剑桥大学出版社,2012年。
[41] [TGW15]亚历克西斯·图米、朱利安·古铁雷斯和迈克尔·伍尔德里奇。在并发博弈中自动验证纳什均衡的工具。ICTAC,LNCS第9399卷,第583-594页。斯普林格,2015年·Zbl 1471.68157
[42] [van76]J.范本瑟姆。模态对应理论。阿姆斯特丹大学博士论文,1976年。
[43] [vB02]约翰·范本瑟姆。广泛的游戏作为过程模型。逻辑、语言与信息杂志,11(3):289-3132002·Zbl 1003.03530
[44] [vdHLW06]维比·范德霍克、阿莱西奥·洛穆西奥和迈克尔·伍尔德里奇。实用ATL模型检验的复杂性。在AAMAS,201-208页。ACM,2006年。
[45] [vGW96]R:J.van Glabbeek和W.P.Weijland。双模拟语义中的分支时间和抽象。ACM杂志,43(3):555-6001996·Zbl 0882.68085
[46] [WGH+16]迈克尔·伍尔德里奇、朱利安·古铁雷斯、保罗·哈伦斯坦、恩里科·马尔基奥尼、朱塞佩·佩雷利和亚历克西斯·图米。理性验证:从模型检验到均衡检验。AAAI,第4184-4191页。AAI出版社,2016年。
此参考列表基于出版商或数字数学图书馆提供的信息。它的项被试探性地匹配到zbMATH标识符,并且可能包含数据转换错误。它试图尽可能准确地反映原始论文中列出的参考文献,而不要求匹配的完整性或精确性。