×

理性游戏的时间属性推理。 (英语) 兹比尔1187.03016

本文提出并研究了交替时间时序逻辑((mathbf{ATL})的一种扩展,称为(mathbf{ATLP})(具有合理性的),这使得我们能够表达智能代理的各种理性假设,并在这种理性假设下推理代理实现正式指定结果的能力。特别是,作者证明了各种经典解概念,如标准和子博弈完美纳什均衡、帕累托最优等,可以用(mathbf{ATLP})来表征,然后可以对由此产生的行为和结果进行形式化分析。该逻辑还通过使用路径公式\(mathbf{ATL}\)来表征支付模式,从而产生了经典解概念的广义版本。本文研究了几类公式的模型检查(mathbf{ATLP})的复杂性,并证明了它在一般情况下的范围是从(Delta{mathbf}3}}^{mathbf{P}})到(mathbf{PSPACE}),而对于最有趣的子类,并且大致对应于解决具有不完美信息的广泛博弈。

MSC公司:

03B44号 时间逻辑
68T27型 人工智能中的逻辑
68T42型 Agent技术与人工智能
91A26型 博弈论中的理性与学习
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 奥戈特内斯,T.,戈兰科,V.,贾姆罗加,W.:具有不可撤销策略的交替时间时序逻辑。摘自:Samet,D.(编辑)《TARK XI会议录》,第15-24页(2007年)
[2] Alur,R.,Henzinger,T.A.,Kupferman,O.:交替时间时序逻辑。摘自:第38届计算机科学基础年度研讨会论文集,第100-109页。IEEE计算机学会出版社,银泉出版社(1997)·Zbl 1326.68181号
[3] Alur,R.,Henzinger,T.A.,Kupferman,O.:交替时间时序逻辑。J.ACM 49,672–713(2002)·Zbl 1326.68181号 ·doi:10.1145/585265.585270
[4] Bacharach,M.:博弈中的理性决策理论。埃尔肯特尼斯27、17–55(1987)·doi:10.1007/BF00169710
[5] Baltag,A.:一种针对可疑玩家的逻辑。牛市。经济。第54(1)号决议,1-46(2002)·数字对象标识代码:10.1111/1467-8586.00138
[6] 博纳诺:完美信息游戏中理性游戏的逻辑。经济。菲洛斯。7, 37–65 (1991) ·doi:10.1017/S0266267100000900
[7] Brihaye,T.、Da Costa,A.、Laroussinie,F.、Markey,N.:具有策略上下文和有限记忆的ATL。技术报告LSV-08-14,ENS Cachan(2008)·Zbl 1211.03031号
[8] Bulling,N.:游戏、时间和信念的模态逻辑。克劳斯塔尔理工大学硕士论文(2006)
[9] Bulling,N.和Jamroga,W.:时间背景下的代理、信念和似是而非的行为。技术报告IfI-06-05,克劳斯塔尔理工大学(2006)
[10] Bulling,N.和Jamroga,W.:时间背景下的代理、信念和似是而非的行为。摘自:AAMAS’07会议记录,第570-577页(2007年)
[11] Bulling,N.,Jamroga,W.:推理理性代理人的逻辑:又一次尝试。载于:Czaja,L.(编辑)《加拿大注册会计师协会议事录》,第87-99页(2007年)
[12] Chu,F.,Halpern,J.:关于在具有共同回报的博弈中找到最优策略的NP-完备性。国际博弈论杂志。30(1), 99–106 (2001) ·Zbl 1052.91004号 ·doi:10.1007/s001820100066
[13] Clarke,E.M.,Emerson,E.A.:使用分支时间时序逻辑设计和合成同步骨架。收录:程序逻辑研讨会论文集。《计算机科学讲义》,第131卷,第52-71页(1981年)
[14] Clarke,E.M.,Emerson,E.A.,Sistla,A.P.:使用时序逻辑规范对有限状态并发系统进行自动验证。ACM变速器。程序。语言系统。8(2), 244–263 (1986) ·Zbl 0591.68027号 ·doi:10.1145/5397.5399
[15] Conitzer,V.,Sandholm,T.:纳什均衡的复杂性结果。技术报告CMU-CS-02-135,卡内基梅隆大学计算机科学学院(2002)·Zbl 1142.91365号
[16] Friedman,N.、Halpern,J.Y.:基于知识的信念改变框架,第一部分:基础。摘自:TARK会议记录,第44-64页(1994年)
[17] Garey,M.R.,Johnson,D.S.:《计算机与不可修复性:NP完全性理论指南》。弗里曼,W.H.,旧金山(1979)·Zbl 0411.68039号
[18] Gilboa,I.,Zemel,E.:纳什和相关均衡:一些复杂性考虑。游戏经济。行为。1, 80–93 (1989) ·Zbl 0755.9003号 ·doi:10.1016/0899-8256(89)90006-7
[19] Goranko,V.,Jamroga,W.:比较多智能体系统逻辑的语义。合成139(2),241-280(2004)·Zbl 1106.03009号 ·doi:10.1023/B:同步0000024915.66183.d1
[20] Harrenstein,B.P.,van der Hoek,W.,Meyer,J.-J.,Witteveen,C.:纳什均衡的模态表征。芬丹。通知。57(2–4), 281–321 (2003) ·Zbl 1041.03016号
[21] Harrenstein,P.,van der Hoek,W.,Meijer,J-J.,Witteveen,C.:动态逻辑中的亚博弈完美纳什均衡。摘自:Pauly,M.,Baltag,A.(编辑)ILLC逻辑与游戏研讨会论文集,第29-30页。阿姆斯特丹大学(2002)技术报告PP-1999-25。
[22] Herzig,A.,Troquard,N.:知道如何游戏:代理逻辑中的统一选择。摘自:AAMAS’06会议记录,第209–216页(2006)
[23] Jamroga,W.:在模型检查的背景下减少知识操作符。技术报告IfI-07-09,克劳森工业大学(2007年)
[24] Jamroga,W.,Au gotnes,T.:代理人在不完全信息下可以实现什么。摘自:《2006年美国原子能机构会议记录》,第232-234页。ACM,纽约(2006)·Zbl 1186.03031号
[25] Jamroga,W.,Bulling,N.:理性代理人推理框架。摘自:AAMAS’07会议记录,第592-594页(2007年)·Zbl 1175.68439号
[26] Jamroga,W.,Bulling,N.:关于理性主体的推理逻辑。收录:Sadri,F.,Satoh,K.(编辑)《多智能体系统中的计算逻辑》,第八届国际研讨会,CLIMA VIII,修订版精选论文和邀请论文。讲稿,葡萄牙波尔图,9月。第42-61页。施普林格(2007)·Zbl 1175.68439号
[27] Jamroga,W.,Dix,J.:模型检查ATL ir确实是完成的。摘自:欧盟金融管理体系2006年会议记录(2006)
[28] Jamroga,W.,Dix,J.:特工的模型检查能力:仔细观察。计算系统理论,42(3):366–410,(2008)·Zbl 1136.68036号 ·doi:10.1007/s00224-007-9080-z
[29] 贾姆罗加·W·、范德霍克·W·:知道如何打球的经纪人。芬丹。通知。63(2–3):185–219 (2004) ·Zbl 1102.68106号
[30] Jamroga,W.、van der Hoek,W.和Wooldridge,M.:游戏场景中的意图和策略。收录:Bento,C.,Cardoso,A.,Dias,G.(编辑)《人工智能进展:2005年EPIA会议录》。《人工智能课堂讲稿》,第3808卷,第512-523页。施普林格,纽约(2005)
[31] Koller,D.,Megiddo,N.:广泛形式的两人零和游戏的复杂性。游戏经济学。行为。4, 528–552 (1992) ·Zbl 0758.90084号 ·doi:10.1016/0899-8256(92)90035-Q
[32] Laroussinie,F.,Markey,N.,Schnoebelen博士:模型检查CTL+和FCTL很难。摘自:FoSSaCS’01会议记录。计算机科学课堂讲稿,第2030卷,第318-331页。施普林格,纽约(2001)·Zbl 0986.68067号
[33] Andreu Mas-Colell,Michael Whinston,D.,Jerry Green,R.:微观经济理论。牛津大学(1995)
[34] Moses,Y.,Tennenholz,M.:人工社会系统。计算。Artif公司。智力。14(6), 533–562 (1995)
[35] Osborne,M.,Rubinstein,A.:博弈论课程。麻省理工学院,剑桥(1994)·Zbl 1194.91003号
[36] Papadimitriou,C.H.:计算复杂性。艾迪森·卫斯理,雷丁(1994)·Zbl 0833.68049号
[37] Tuomas Sandholm,W.:分布式理性决策。收录:Gerhard Weiss(编辑)《多智能体系统:分布式人工智能的现代方法》,第201–258页。麻省理工学院,剑桥,马萨诸塞州,美国(1999年)
[38] Schobbens,P.Y.:具有不完全回忆的交替时间逻辑。理论计算机科学电子笔记,85(2),82–93(2004)·Zbl 1270.68287号 ·doi:10.1016/S1571-0661(05)82604-0
[39] Shoham,Y.,Tennenholz,M.:关于人工智能社会有用社会规律的综合。In:AAAI-92(1992)会议记录
[40] Stáhl,I.:谈判理论。斯德哥尔摩经济学院,斯德哥尔摩(1972年)·Zbl 0348.90190号
[41] Stalnaker,R.:关于解决方案概念的评估。理论决策。37(1), 49–73 (1994) ·Zbl 0805.90150 ·doi:10.1007/BF01079205
[42] Stalnaker,R.:游戏中的知识、信念和反事实推理。经济。菲洛斯。12, 133–163 (1996) ·Zbl 1384.03110号 ·网址:10.1017/S0266267100004132
[43] Su,K.,Sattar,A.,Governatori,G.,Chen,Q.:基于计算的知识、信念和确定性逻辑。摘自:《2005年澳大利亚会计准则汇编》,第149-156页。ACM,纽约(2005)
[44] 范·本特姆,J.:游戏中的理性动力学和认知逻辑。收录于:Vannucci,S.(编辑)《逻辑、博弈论和社会选择III》,第19-23页(2003年)
[45] van der Hoek,W.、Jamroga,W.和Wooldridge,M.:战略推理的逻辑。摘自:AAMAS’05会议记录,第157-164页(2005)
[46] van der Hoek,W.,Roberts,M.,Wooldridge,M.:交替时间中的社会规律:有效性、可行性和综合。合成156(1),1-19(2005)·Zbl 1120.68097号
[47] van der Hoek,W.,Wooldridge,M.:认知目标的可追踪多智能体规划。收录于:Castelfranchi,C.,Johnson,W.L.(编辑)《第一届国际自治代理和多代理系统联合会议论文集》(AAMAS-02),第1167-1174页。ACM,纽约(2002)
[48] van Otterloo,S.,Jonker,G.:关于认知时间战略逻辑。摘自:LCMAS’04会议记录。理论计算机科学电子笔记,第二十卷,第35–45页(2004)·兹比尔1272.68384
[49] van Otterloo,S.,Roy,O.:投票协议的验证。阿姆斯特丹大学工作文件(2005年)
[50] van Otterloo,S.,van der Hoek,W.,Wooldridge,M.:游戏逻辑中的偏好。初版,未出版手稿(2004年)
[51] van Otterloo,S.,van der Hoek,W.,Wooldridge,M.:游戏逻辑中的偏好。摘自:AAMAS-04会议记录,第152-159页(2004年)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。