文件Zbl 1187.03016-zbMATH Open

理性游戏的时间属性推理。（英语）兹比尔1187.03016

安。数学。Artif公司。智力。 53，编号1-4，51-114（2008）.

本文提出并研究了交替时间时序逻辑（（mathbf{ATL}）的一种扩展，称为（mathbf{ATLP}）（具有合理性的），这使得我们能够表达智能代理的各种理性假设，并在这种理性假设下推理代理实现正式指定结果的能力。特别是，作者证明了各种经典解概念，如标准和子博弈完美纳什均衡、帕累托最优等，可以用（mathbf{ATLP}）来表征，然后可以对由此产生的行为和结果进行形式化分析。该逻辑还通过使用路径公式\（mathbf{ATL}\）来表征支付模式，从而产生了经典解概念的广义版本。本文研究了几类公式的模型检查（mathbf{ATLP}）的复杂性，并证明了它在一般情况下的范围是从（Delta{mathbf}3}}^{mathbf{P}}）到（mathbf{PSPACE}），而对于最有趣的子类，并且大致对应于解决具有不完美信息的广泛博弈。

审核人：瓦伦丁·F·戈兰科（约翰内斯堡）

引用于6文件

MSC公司：

03B44号	时间逻辑
68T27型	人工智能中的逻辑
68T42型	Agent技术与人工智能
91A26型	博弈论中的理性与学习

关键词：

博弈论;多agent系统的逻辑;模态逻辑;时序逻辑;合理性

PDF格式 BibTeX公司 XML格式引用

全文：内政部

参考文献：

[1]	奥戈特内斯，T.，戈兰科，V.，贾姆罗加，W.：具有不可撤销策略的交替时间时序逻辑。摘自：Samet，D.（编辑）《TARK XI会议录》，第15-24页（2007年）
[2]	Alur，R.，Henzinger，T.A.，Kupferman，O.：交替时间时序逻辑。摘自：第38届计算机科学基础年度研讨会论文集，第100-109页。IEEE计算机学会出版社，银泉出版社（1997）·Zbl 1326.68181号
[3]	Alur，R.，Henzinger，T.A.，Kupferman，O.：交替时间时序逻辑。J.ACM 49，672–713（2002）·Zbl 1326.68181号 ·doi:10.1145/585265.585270
[4]	Bacharach，M.：博弈中的理性决策理论。埃尔肯特尼斯27、17–55（1987）·doi:10.1007/BF00169710
[5]	Baltag，A.：一种针对可疑玩家的逻辑。牛市。经济。第54（1）号决议，1-46（2002）·数字对象标识代码：10.1111/1467-8586.00138
[6]	博纳诺：完美信息游戏中理性游戏的逻辑。经济。菲洛斯。7, 37–65 (1991) ·doi:10.1017/S0266267100000900
[7]	Brihaye，T.、Da Costa，A.、Laroussinie，F.、Markey，N.：具有策略上下文和有限记忆的ATL。技术报告LSV-08-14，ENS Cachan（2008）·Zbl 1211.03031号
[8]	Bulling，N.：游戏、时间和信念的模态逻辑。克劳斯塔尔理工大学硕士论文（2006）
[9]	Bulling，N.和Jamroga，W.：时间背景下的代理、信念和似是而非的行为。技术报告IfI-06-05，克劳斯塔尔理工大学（2006）
[10]	Bulling，N.和Jamroga，W.：时间背景下的代理、信念和似是而非的行为。摘自：AAMAS’07会议记录，第570-577页（2007年）
[11]	Bulling，N.，Jamroga，W.：推理理性代理人的逻辑：又一次尝试。载于：Czaja，L.（编辑）《加拿大注册会计师协会议事录》，第87-99页（2007年）
[12]	Chu，F.，Halpern，J.：关于在具有共同回报的博弈中找到最优策略的NP-完备性。国际博弈论杂志。30(1), 99–106 (2001) ·Zbl 1052.91004号 ·doi:10.1007/s001820100066
[13]	Clarke，E.M.，Emerson，E.A.：使用分支时间时序逻辑设计和合成同步骨架。收录：程序逻辑研讨会论文集。《计算机科学讲义》，第131卷，第52-71页（1981年）
[14]	Clarke，E.M.，Emerson，E.A.，Sistla，A.P.：使用时序逻辑规范对有限状态并发系统进行自动验证。ACM变速器。程序。语言系统。8(2), 244–263 (1986) ·Zbl 0591.68027号 ·doi:10.1145/5397.5399
[15]	Conitzer，V.，Sandholm，T.：纳什均衡的复杂性结果。技术报告CMU-CS-02-135，卡内基梅隆大学计算机科学学院（2002）·Zbl 1142.91365号
[16]	Friedman，N.、Halpern，J.Y.：基于知识的信念改变框架，第一部分：基础。摘自：TARK会议记录，第44-64页（1994年）
[17]	Garey，M.R.，Johnson，D.S.：《计算机与不可修复性：NP完全性理论指南》。弗里曼，W.H.，旧金山（1979）·Zbl 0411.68039号
[18]	Gilboa，I.，Zemel，E.：纳什和相关均衡：一些复杂性考虑。游戏经济。行为。1, 80–93 (1989) ·Zbl 0755.9003号 ·doi:10.1016/0899-8256（89）90006-7
[19]	Goranko，V.，Jamroga，W.：比较多智能体系统逻辑的语义。合成139（2），241-280（2004）·Zbl 1106.03009号 ·doi:10.1023/B:同步0000024915.66183.d1
[20]	Harrenstein，B.P.，van der Hoek，W.，Meyer，J.-J.，Witteveen，C.：纳什均衡的模态表征。芬丹。通知。57(2–4), 281–321 (2003) ·Zbl 1041.03016号
[21]	Harrenstein，P.，van der Hoek，W.，Meijer，J-J.，Witteveen，C.：动态逻辑中的亚博弈完美纳什均衡。摘自：Pauly，M.，Baltag，A.（编辑）ILLC逻辑与游戏研讨会论文集，第29-30页。阿姆斯特丹大学（2002）技术报告PP-1999-25。
[22]	Herzig，A.，Troquard，N.：知道如何游戏：代理逻辑中的统一选择。摘自：AAMAS’06会议记录，第209–216页（2006）
[23]	Jamroga，W.：在模型检查的背景下减少知识操作符。技术报告IfI-07-09，克劳森工业大学（2007年）
[24]	Jamroga，W.，Au gotnes，T.：代理人在不完全信息下可以实现什么。摘自：《2006年美国原子能机构会议记录》，第232-234页。ACM，纽约（2006）·Zbl 1186.03031号
[25]	Jamroga，W.，Bulling，N.：理性代理人推理框架。摘自：AAMAS’07会议记录，第592-594页（2007年）·Zbl 1175.68439号
[26]	Jamroga，W.，Bulling，N.：关于理性主体的推理逻辑。收录：Sadri，F.，Satoh，K.（编辑）《多智能体系统中的计算逻辑》，第八届国际研讨会，CLIMA VIII，修订版精选论文和邀请论文。讲稿，葡萄牙波尔图，9月。第42-61页。施普林格（2007）·Zbl 1175.68439号
[27]	Jamroga，W.，Dix，J.：模型检查ATL ir确实是完成的。摘自：欧盟金融管理体系2006年会议记录（2006）
[28]	Jamroga，W.，Dix，J.：特工的模型检查能力：仔细观察。计算系统理论，42（3）：366–410，（2008）·Zbl 1136.68036号 ·doi:10.1007/s00224-007-9080-z
[29]	贾姆罗加·W·、范德霍克·W·：知道如何打球的经纪人。芬丹。通知。63(2–3):185–219 (2004) ·Zbl 1102.68106号
[30]	Jamroga，W.、van der Hoek，W.和Wooldridge，M.：游戏场景中的意图和策略。收录：Bento，C.，Cardoso，A.，Dias，G.（编辑）《人工智能进展：2005年EPIA会议录》。《人工智能课堂讲稿》，第3808卷，第512-523页。施普林格，纽约（2005）
[31]	Koller，D.，Megiddo，N.：广泛形式的两人零和游戏的复杂性。游戏经济学。行为。4, 528–552 (1992) ·Zbl 0758.90084号 ·doi:10.1016/0899-8256（92）90035-Q
[32]	Laroussinie，F.，Markey，N.，Schnoebelen博士：模型检查CTL+和FCTL很难。摘自：FoSSaCS’01会议记录。计算机科学课堂讲稿，第2030卷，第318-331页。施普林格，纽约（2001）·Zbl 0986.68067号
[33]	Andreu Mas-Colell，Michael Whinston，D.，Jerry Green，R.：微观经济理论。牛津大学（1995）
[34]	Moses，Y.，Tennenholz，M.：人工社会系统。计算。Artif公司。智力。14(6), 533–562 (1995)
[35]	Osborne，M.，Rubinstein，A.：博弈论课程。麻省理工学院，剑桥（1994）·Zbl 1194.91003号
[36]	Papadimitriou，C.H.：计算复杂性。艾迪森·卫斯理，雷丁（1994）·Zbl 0833.68049号
[37]	Tuomas Sandholm，W.：分布式理性决策。收录：Gerhard Weiss（编辑）《多智能体系统：分布式人工智能的现代方法》，第201–258页。麻省理工学院，剑桥，马萨诸塞州，美国（1999年）
[38]	Schobbens，P.Y.：具有不完全回忆的交替时间逻辑。理论计算机科学电子笔记，85（2），82–93（2004）·Zbl 1270.68287号 ·doi:10.1016/S1571-0661（05）82604-0
[39]	Shoham，Y.，Tennenholz，M.：关于人工智能社会有用社会规律的综合。In:AAAI-92（1992）会议记录
[40]	Stáhl，I.：谈判理论。斯德哥尔摩经济学院，斯德哥尔摩（1972年）·Zbl 0348.90190号
[41]	Stalnaker，R.：关于解决方案概念的评估。理论决策。37(1), 49–73 (1994) ·Zbl 0805.90150 ·doi:10.1007/BF01079205
[42]	Stalnaker，R.：游戏中的知识、信念和反事实推理。经济。菲洛斯。12, 133–163 (1996) ·Zbl 1384.03110号 ·网址：10.1017/S0266267100004132
[43]	Su，K.，Sattar，A.，Governatori，G.，Chen，Q.：基于计算的知识、信念和确定性逻辑。摘自：《2005年澳大利亚会计准则汇编》，第149-156页。ACM，纽约（2005）
[44]	范·本特姆，J.：游戏中的理性动力学和认知逻辑。收录于：Vannucci，S.（编辑）《逻辑、博弈论和社会选择III》，第19-23页（2003年）
[45]	van der Hoek，W.、Jamroga，W.和Wooldridge，M.：战略推理的逻辑。摘自：AAMAS’05会议记录，第157-164页（2005）
[46]	van der Hoek，W.，Roberts，M.，Wooldridge，M.：交替时间中的社会规律：有效性、可行性和综合。合成156（1），1-19（2005）·Zbl 1120.68097号
[47]	van der Hoek，W.，Wooldridge，M.：认知目标的可追踪多智能体规划。收录于：Castelfranchi，C.，Johnson，W.L.（编辑）《第一届国际自治代理和多代理系统联合会议论文集》（AAMAS-02），第1167-1174页。ACM，纽约（2002）
[48]	van Otterloo，S.，Jonker，G.：关于认知时间战略逻辑。摘自：LCMAS’04会议记录。理论计算机科学电子笔记，第二十卷，第35–45页（2004）·兹比尔1272.68384
[49]	van Otterloo，S.，Roy，O.：投票协议的验证。阿姆斯特丹大学工作文件（2005年）
[50]	van Otterloo，S.，van der Hoek，W.，Wooldridge，M.：游戏逻辑中的偏好。初版，未出版手稿（2004年）
[51]	van Otterloo，S.，van der Hoek，W.，Wooldridge，M.：游戏逻辑中的偏好。摘自：AAMAS-04会议记录，第152-159页（2004年）

此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配，可能包含数据转换错误。在某些情况下，zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献，而不要求完整或完全匹配。

任何	在任何地方
一个	内部文档标识符
澳大利亚	作者、编辑
人工智能	内部作者标识符
钛	标题
洛杉矶	语言
所以	来源
ab公司	回顾，摘要
第页	出版年份
右心室	评审员
立方厘米	MSC代码
美国犹他州	关键字
日期	文档类型(j个：期刊文章；b条：book；一：书籍文章）

一&b条	逻辑和
一\|b条	逻辑或
!ab公司	逻辑不
美国广播公司*	右通配符
"ab c公司"	短语
(ab c公司)	圆括号

示例

领域

操作员

理性游戏的时间属性推理。（英语）兹比尔1187.03016

MSC公司：

关键词：

参考文献：

示例

领域

操作员

理性游戏的时间属性推理。 （英语） 兹比尔1187.03016

MSC公司：

关键词：

参考文献：

理性游戏的时间属性推理。（英语）兹比尔1187.03016