×

针对策略逻辑,验证具有公共操作的多代理系统。 (英语) Zbl 1451.68290号

摘要:模型检查多代理系统,其中代理是分布式的,因此可能对世界有不同的观察结果,针对战略行为,这在许多情况下是一个复杂的问题。传统上,有两种方法可以改善这种复杂性:对代理的观察结果施加层次结构,或限制代理的操作,以便所有代理都能观察到它们。我们研究后一类系统,因为它们更适合建模理性主体。特别地,我们定义了所有动作都是公开的多智能体系统,并研究了此类系统的模型检查问题,该问题与等式策略逻辑相对应,等式策略是一种非常丰富的策略逻辑,可以表达纳什均衡、帕累托最优等相关概念,并且由于等式的新增,也是进化稳定策略。主要结果是相应的模型检验问题是可判定的。

MSC公司:

68T42型 Agent技术与人工智能
60年第68季度 规范和验证(程序逻辑、模型检查等)
68T27型 人工智能中的逻辑
PDF格式BibTeX公司 XML格式引用
全文: 内政部 链接

参考文献:

[1] Pauly,M.,《博弈中联盟权力的模态逻辑》,J.Log。计算。,12, 1, 149-166 (2002) ·Zbl 1003.91006号
[2] 阿鲁尔(Alur,R.)。;Henzinger,T。;Kupferman,O.,《交替时间时序逻辑》,J.ACM,49,5,672-713(2002)·Zbl 1326.68181号
[3] 奥戈特内斯,T。;V.戈兰科。;查姆罗加,W。;Wooldridge,M.,《知识与能力》(《知识与信仰逻辑手册》(2015),大学出版社),543-589
[4] 雷蒙迪,F。;Lomuscio,A.,通过有序二进制决策图的模型检查对多智能体系统进行自动验证,J.Appl。日志。,5, 2, 235-251 (2007) ·Zbl 1122.68076号
[5] 霍克,W.v。;伍尔德里奇,M.,《合作、知识与时间:交替时间时间认知逻辑及其应用》,研究日志。,75, 1, 125-157 (2003) ·Zbl 1034.03013号
[6] Jamroga,W.,关于交替时间认知逻辑的一些评论,(《多智能体系统形式化方法国际研讨会论文集》(FAMAS03)(2004)),133-140
[7] 阿勒奇纳,N。;洛根,B。;Nguyen,H.N。;雷蒙迪,F。;Mostada,L.,资源型ATL的符号模型检验,(第14届国际自治代理和多代理系统会议(AAMAS15)(2015)),1809-1810
[8] 查特吉,K。;Henzinger,T。;彼得曼,N.,战略逻辑,信息计算。,208, 6, 677-693 (2010) ·Zbl 1205.68197号
[9] 莫加维罗,F。;Murano,A。;Vardi,M.,《战略推理》,(第30届IARCS软件技术与理论计算机科学基础年会论文集(FSTTCS10)(2010)),133-144·兹比尔1245.68138
[10] 莫加维罗,F。;穆拉诺,A。;佩雷利,G。;Vardi,M.,《战略推理:模型选择问题》,ACM Trans。计算。日志。,第15、4条,第34页(2014年)·Zbl 1354.68178号
[11] 莫加维罗,F。;Murano,A。;佩雷利,G。;Vardi,M.Y.,《关于策略的推理:关于可满足性问题》,Log。方法计算。科学。,13, 1, 1-37 (2017) ·Zbl 1448.68312号
[12] 黄,X。;van der Meyden,R.,《战略知识的时间逻辑》,第14届知识表示与推理原则国际会议论文集(KR14)(2014),418-427
[13] 乔马克,P。;Lomuscio,A。;Murano,A.,《根据单目标策略逻辑规范验证和合成多智能体系统》,(第29届AAAI人工智能会议论文集(2015)),2038-2044
[14] 乔马克,P。;Lomuscio,A。;莫加维罗,F。;Murano,A.,根据SLk规范对多代理系统进行实际验证,Inf.Compute。,261, 588-614 (2018) ·Zbl 1395.68255号
[15] 莫伯特,B。;Murano,A.,《分层信息下知识与策略的推理》(《第十六届知识表示与推理原则国际会议论文集》(KR18)(2018)),530-540
[16] 克拉克,E。;格伦伯格,O。;Peled,D.,《模型检验》(2002),麻省理工学院出版社
[17] 阿鲁尔(Alur,R.)。;Henzinger,T。;Mang,F。;卡迪尔,S。;拉贾马尼,S。;Tasiran,S.,MOCHA:模型检查中的模块化,(第十届计算机辅助验证国际会议论文集(CAV98)(1998)),521-525
[18] Lomuscio,A。;Qu,H。;Raimondi,F.,MCMAS:用于验证多代理系统的模型检查器,国际J.Softw。技术工具。传输。,19, 1, 9-30 (2017)
[19] 卡普扎克,M。;Nabialek,W。;涅维亚多姆斯基,A。;彭泽克,W。;波罗拉,A。;Szreter,M。;沃纳(Woźna,B.)。;Zbrzezny,A.,Verics 2007-Fundam的知识和实时模型检查器。通知。,85, 1, 313-328 (2008) ·Zbl 1167.68381号
[20] Kwiatkowska,M。;诺曼,G。;帕克,D。;Santos,G.,基于均衡的并发随机博弈概率模型检验,CoRR
[21] 古铁雷斯,J。;纳吉布,M。;佩雷利,G。;Wooldridge,M.J.,EVE:一种用于时间平衡分析的工具,(ATVA.AVA,计算机科学讲义,第11138卷(2018),施普林格),551-557
[22] 费希尔,M。;洛杉矶丹尼斯。;Webster,M.P.,《验证自治系统》,Commun。ACM,56,9,84-93(2013)
[23] 以西结,J。;Lomuscio,A。;莫尔纳,L。;Veres,S.,《验证自动水下航行器的容错性和自诊断性》,(第22届国际人工智能联合会议(IJCAI11)(2011)会议记录),1659-1664
[24] 迪马,C。;Tiopse,F.,不完全信息和完全回忆语义下的模型检查ATL是不可判定的,CoRR
[25] 彭泽克,W。;Lomuscio,A.,《通过有界模型检查验证多智能体系统的认知属性》,Fundam。通知。,55, 2, 167-185 (2003) ·Zbl 1111.68512号
[26] 查姆罗加,W。;Murano,A.,《战略能力的模块检查》,(第十四届自主代理和多代理系统国际会议论文集(AAMAS15)(2015)),227-235
[27] 鲍耶,P。;Gardy,P。;Markey,N.,《论战略逻辑的语义》,Inf.Process。莱特。,116,2,75-79(2016)·Zbl 1346.68121号
[28] Gardy,P。;鲍耶,P。;Markey,N.,《战略逻辑中的依赖性》,(第35届计算机科学理论方面研讨会论文集(STACS18)(2018)),第34条,pp·Zbl 1484.68101号
[29] 查尔顿,C。;布鲁内尔,J。;Chemouil,D.,《具有可撤销和可再融资策略的逻辑》,Inf.Compute。,242, 157-182 (2015) ·Zbl 1319.68142号
[30] Chareton,C.,《过去的战略知识——表现力和复杂性》,(第十五届欧洲多代理系统会议(EUMAS17)和第五届国际协议技术会议(AT17)(2018)),115-130
[31] 黄,X。;van der Meyden,R.,《认知策略逻辑》,ACM Trans。计算。日志。,第19、4条第26页(2018年)·Zbl 1407.03020号
[32] 查姆罗加,W。;Dix,J.,不完全信息下的模型检验能力确实是完整的(operatorname{\Delta}_p^2),(第四届欧洲多智能体系统研讨会论文集(EUMAS06)(2006)),14-15
[33] R.伯顿。;莫伯特,B。;Murano,A.,《信息不完全和召回完全的ATL*的可决定性结果》(《第16届自治代理和多代理系统会议记录》(AAMAS17)(2017)),1250-1258
[34] 彼得森,G。;Reif,J。;Azhar,S.,《不完全信息多人非合作博弈的决策算法》,计算。数学。申请。,第43页,第179-206页(2002年)·Zbl 1011.91026号
[35] Schewe,S。;Finkbeiner,B.,交替时间逻辑的分布式合成,(第五届自动技术验证与分析国际研讨会论文集(ATVA07)(2007)),268-283·Zbl 1141.68516号
[36] Berwanger,D。;马修,A.B。;van den Bogaard,M.,《分层信息模式和分布式策略综合》,(第13届自动技术验证与分析国际研讨会论文集(ATVA15)(2015)),378-393·Zbl 1408.91003号
[37] R.伯顿。;莫伯特,B。;Murano,A。;鲁宾,S。;Vardi,M.Y.,《信息不完全的战略逻辑》,(第32届ACM/IEEE计算机科学逻辑研讨会论文集(LICS17)(2017)),1-12·Zbl 1458.68113号
[38] 费金,R。;哈尔彭,J。;摩西,Y。;Vardi,M.,《知识推理》(1995),麻省理工学院·Zbl 0839.68095号
[39] Lomuscio,A。;范德梅登,R。;Ryan,M.,《多代理系统知识:初始配置和广播》,ACM Trans。计算。日志。,1, 2, 246-282 (2000)
[40] 范德梅登,R。;Wilke,T.,《基于知识的规范对分布式系统的综合》,(第16届并发理论国际会议论文集(CONCUR05)(2005)),562-576·Zbl 1134.68460号
[41] 查姆罗加,W。;科纳皮克,M。;Kurpiewski,D.,不完全信息下战略能力的不动点近似,(第16届自治代理和多代理系统会议论文集(AAMAS17)(2017)),1241-1249
[42] Baltag,A。;莫斯,L.S。;Solecki,S.,《公开宣布、常识和私人怀疑的逻辑》(《第七届理性与知识理论方面会议论文集》(TARK-98)(1998)),第125-132页
[43] van Ditmarsch,H。;范德霍克,W。;Kooi,B.,《动态认识逻辑》,《综合图书馆》,第337卷(2007年),施普林格出版社·兹比尔1156.03320
[44] Lomuscio,A。;Ryan,M.,《理想代理人分享(一些!)知识》,(第13届欧洲人工智能会议论文集(ECAI98)(1998)),557-561
[45] Bolander,T。;Jensen,M.H。;Schwarzentruber,F.,《复杂性导致认知规划》,第24届国际人工智能联合会议(IJCAI15)(2015),2791-2797
[46] Bolander,T。;Andersen,M.B.,《单智能体和多智能体系统的认识规划》,J.Appl。非类别。日志。,21, 1, 9-34 (2011) ·Zbl 1242.68285号
[47] 科米斯,F。;Geffner,H.,《多智能体规划的信念:从一个智能体到多个智能体》(《第二十五届国际自动规划与调度会议论文集》(ICAPS15)(2015)),147-155
[48] 科米斯,F。;Geffner,H.,具有嵌套信念和对话的多智能体在线规划,(第二十七届自动规划与调度国际会议(ICAPS17)(2017)会议记录),186-194
[49] 库普夫曼,O。;佩雷利,G。;Vardi,M.,《理性环境的综合》,《数学年鉴》。Artif公司。智力。,78, 1, 3-20 (2016) ·Zbl 1372.68173号
[50] 古铁雷斯,J。;Harrenstein,P。;Wooldridge,M.,《关于类游戏并发系统平衡的推理》,《纯粹应用》。日志。,168, 2, 373-403 (2017) ·Zbl 1400.03057号
[51] 古铁雷斯,J。;佩雷利,G。;Wooldridge,M.J.,反应模块游戏中的不完全信息,Inf.Comput。,261, 650-675 (2018) ·Zbl 1395.68188号
[52] Littman,M.L.,《顺序决策算法》(1996),布朗大学博士论文
[53] Bonet,B.,《重新审视确定性POMDP》,(第25届人工智能不确定性会议论文集(UAI09)(2009)),59-66
[54] Belardinelli,F。;Lomuscio,A。;Murano,A。;Rubin,S.,《具有不完全信息和公共行为的多智能体系统的验证》,(第16届自治智能体和多智能体体系会议论文集(AAMAS17)(2017)),1268-1276
[55] Belardinelli,F。;Lomuscio,A。;穆拉诺,A。;Rubin,S.,《根据认知策略逻辑验证广播多智能体系统》,(第24届国际人工智能联合会议(IJCAI17)(2017)),91-97
[56] Belardinelli,F。;Lomuscio,A。;Murano,A。;Rubin,S.,《具有有限私人行为的多智能体系统的可判定验证》(第17届自主智能体和多智能体体系国际会议(AAMAS18),2018年)
[57] Manna,Z。;Pnueli,A.,《反应和并发系统的时间逻辑》,第1卷(1992),Springer
[58] 奥斯本,M.J。;Rubinstein,A.,《博弈论课程》(1994),麻省理工出版社·Zbl 1194.91003号
[59] 查姆罗加,W。;范德霍克,W.,知道如何打球的经纪人,芬丹。通知。,62, 1-35 (2004) ·Zbl 1102.68106号
[60] 氨基f,B。;Malvone,V。;Murano,A。;Rubin,S.,《战略逻辑中的分级形式》,《信息计算》。,261, 634-649 (2018) ·Zbl 1395.68254号
[61] Lomuscio,A。;Raimondi,F.,《多智能体系统中的模型检验知识、策略和游戏》,(第五届国际自治智能体和多智能体联合会议论文集(AAMAS06)(2006)),161-168
[62] 乔马克,P。;Lomuscio,A。;莫加维罗,F。;Murano,A.,MCMAS-SLK:验证策略逻辑规范的模型检查器,(第26届计算机辅助验证国际会议(CAV14)(2014)论文集),525-532
[63] Ummels,M.,无限多人游戏中的理性行为和策略构建,(第26届IARCS软件技术和理论计算机科学基础年会论文集(FSTTCS06)(2006)),212-223·Zbl 1177.91060号
[64] 亚伯拉罕一世。;阿尔维西,L。;Halpern,J.,《分布式计算与博弈论:结合两个领域的见解》,SIGACT News,42,2,69-76(2011)
[65] 哈尔彭,J。;Teague,V.,《理性秘密共享和多方计算》,(第36届ACM计算理论年会论文集(STOC04)(2004)),623-632·Zbl 1192.94119号
[66] Szafron,D。;Gibson,R.G。;Sturtevant,N.R.,三人库恩扑克的参数化平衡曲线族,(第十二届自治代理和多代理系统国际会议论文集(AAMAS13)(2013)),247-254
[67] 阿尔马戈,S。;库普夫曼,O。;Perelli,G.,定量目标博弈中可控纳什均衡的合成,(第25届国际人工智能联合会议(IJCAI18)(2018)论文集),35-41
[68] 史密斯,J.M。;普莱斯,G.R.,《动物冲突的逻辑》,《自然》,第246、15-18页(1973年)·Zbl 1369.92134号
[69] 古铁雷斯,J。;Harrenstein,P。;佩雷利,G。;Wooldridge,M.,Nash均衡和互模拟不变性,(第28届并行理论国际会议论文集(CONCUR17)(2017)),第17条pp·Zbl 1442.68143号
[70] 古铁雷斯,J。;Harrenstein,P。;Wooldridge,M.,战略推理的表达性和复杂性结果,(第26届并发理论国际会议论文集(CONCUR 2015)(2015)),268-282·兹比尔1374.68332
[71] 古铁雷斯,J。;Wooldridge,M.,事件结构上并发游戏的均衡,(第23届EACSL计算机科学逻辑年会(CSL)和第29届ACM/IEEE计算机科学逻辑研讨会(LICS)联合会议记录(2014)),第46条pp·Zbl 1401.68228号
[72] 古铁雷斯,J。;Harrenstein,P。;佩雷利,G。;Wooldridge,M.,Nash均衡和互模拟不变性,CoRR·Zbl 1442.68143号
[73] J·纳什。;Shapley,L.,《一个简单的三人扑克游戏》(博弈论论文(1996),爱德华·埃尔加出版社),105-116·Zbl 0041.25602号
[74] 库恩,H.W.,《简化的两人扑克》,《康特里布理论游戏》,197-103(1950)·Zbl 0041.25601号
[75] Friedman,L.,《扑克中的最佳虚张声势策略》,Manag。科学。,17、12、B764-B771(1971)·Zbl 0219.90052号
[76] van Ditmarsch,H。;Kooi,B.,《一百名囚犯和一个灯泡》(2015),哥白尼·邮编1346.00006
[77] Lynch,N.,《分布式算法》(1996),Morgan Kaufmann·Zbl 0877.68061号
[78] 库普夫曼,O。;Vardi,M.Y.,《综合分布式系统》,(第16届IEEE计算机科学逻辑研讨会论文集(LICS01)(2001)),389-398
[79] 艾默生,E.A。;Sistla,A.P.,《决定完全分支时间逻辑》,《Inf.Control》,第61、3、175-201页(1984年)·Zbl 0593.03007号
[80] 拉鲁西尼,F。;Markey,N.,《量化CTL:表现力和复杂性》,Log。方法计算。科学。,10, 4, 1-45 (2014) ·Zbl 1448.68304号
[81] 拉鲁西尼,F。;Markey,N.,《利用战略背景增强ATL》,Inf.Compute。,245, 98-123 (2015) ·Zbl 1332.68140号
[82] Sistla,A。;瓦尔迪,M。;Wolper,P.,《Büchi自动机的互补问题及其在时序逻辑中的应用》,Theor。计算。科学。,49, 217-237 (1987) ·兹伯利0613.03015
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。