×

自动时间均衡分析:多层游戏的验证和合成。 (英语) Zbl 1493.68360号

摘要:在多代理系统的上下文中理性验证这个问题涉及到检查当系统的组成代理被假定为在追求个人目标的过程中理性地和战略性地行为时,系统中哪些时序逻辑属性将保持不变。通常,这些目标被表示为相关代理希望得到满足的时间逻辑公式。不幸的是,理性验证在计算上很复杂,需要专门的技术才能获得实际可用的实现。在本文中,我们提出了这样一种技术。这种技术依赖于将理性验证问题简化为一组奇偶博弈的解。我们的方法已在E类平衡V(V)鉴定E类环境(欧氏瓣心内膜炎)系统。这个欧氏瓣心内膜炎系统采用并发/多代理系统的模型作为输入,该模型使用简单反应模块语言(SRML)表示,其中代理目标用线性时序逻辑表示(长期贷款)公式以及关于系统平衡行为的声明,也表示为长期贷款公式。欧氏瓣心内膜炎然后可以检查该主张是否适用于通过代理选择纳什均衡策略可能产生的系统的某些(或每个)计算;它还可以检查一个系统是否具有纳什均衡,并为多层次博弈中的玩家综合个人策略。在介绍了我们的基本框架之后,我们描述了我们的新技术并证明了它的正确性。然后,我们在欧氏瓣心内膜炎系统,并给出实验结果,表明欧氏瓣心内膜炎与支持rational验证的其他现有工具相比,性能更好。

MSC公司:

68T42型 Agent技术与人工智能
60年第68季度 规范和验证(程序逻辑、模型检查等)
91A06型 \(n)-人游戏,(n>2)
91A10号 非合作游戏
91A80型 博弈论的应用
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] 克拉克,E.M。;格伦伯格,O。;Peled,D.A.,《模型检验》(2002年),麻省理工学院出版社:麻省理学院出版社,美国马萨诸塞州剑桥
[2] Wooldridge,M.,《多智能体系统简介》(2001),威利:英国威利奇切斯特出版社
[3] 肖姆,Y。;Leyton-Brown,K.,《多智能体系统:算法、博弈论和逻辑基础》(2008),CUP·Zbl 1163.91006号
[4] 奥斯本,M.J。;Rubinstein,A.,《博弈论课程》(1994),麻省理工出版社·Zbl 1194.91003号
[5] Halpern,J.Y.,《超越纳什均衡:21世纪的解决方案概念》(KR(2008),AAAI出版社),6-15·兹比尔1301.91008
[6] 亚伯拉罕一世。;阿尔维西,L。;Halpern,J.Y.,《分布式计算与博弈论:结合两个领域的见解》,SIGACT News,42,2,69-76(2011)
[7] 古铁雷斯,J。;Harrenstein,P。;Wooldridge,M.,《从模型检查到平衡检查:理性验证的反应模块》,Artif。智力。,248, 123-157 (2017) ·Zbl 1420.68129号
[8] 伍尔德里奇,M。;古铁雷斯,J。;Harrenstein,P。;马尔基奥尼,E。;佩雷利,G。;Toumi,A.,《理性验证:从模型检验到均衡检验》,(AAAI(2016)),4184-4191
[9] EVE:时间均衡分析工具(2019年)
[10] 范德霍克,W。;Lomuscio,A。;Wooldridge,M.,《关于实际ATL模型检查的复杂性》(AAMAS(2006),ACM),201-208
[11] Pnueli,A.,程序的时序逻辑,(FOCS(1977),IEEE),46-57
[12] 莫加维罗,F。;Murano,A。;佩雷利,G。;Vardi,M.Y.,《战略推理:模型选择问题》,ACM Trans。计算。日志。,15, 4, 34:1-34:47 (2014) ·Zbl 1354.68178号
[13] 古铁雷斯,J。;Harrenstein,P。;Wooldridge,M.,《关于类游戏并发系统平衡的推理》,《纯粹应用》。日志。,168, 2, 373-403 (2017) ·兹比尔1400.03057
[14] Fisman,D。;库普夫曼,O。;Lustig,Y.,《理性合成》,(TACAS.TACAS,LNCS,第6015卷(2010),施普林格出版社),190-204·Zbl 1284.68396号
[15] 古铁雷斯,J。;Harrenstein,P。;Wooldridge,M.,迭代布尔游戏,信息计算。,242, 53-79 (2015) ·Zbl 1318.91012号
[16] 查特吉,K。;Henzinger,T.A。;彼得曼,N.,战略逻辑,信息计算。,208, 6, 677-693 (2010) ·Zbl 1205.68197号
[17] 古铁雷斯,J。;佩雷利,G。;Wooldridge,M.,反应模块游戏中的不完美信息,Inf.Compute。,261,第650-675部分(2018年)·Zbl 1395.68188号
[18] Löding,C.,《树自动机基础》,(自动机理论的现代应用(2012),印度科学院:印度科学院,印度班加罗尔),79-110·Zbl 1256.68103号
[19] 爱默生,E.A。;Jutla,C.S.,树自动机,微积分和确定性,(FOCS,IEEE(1991)),368-377
[20] Jurdzinski,M.,决定平价游戏的获胜者是在UPüco-UP,Inf.过程中。莱特。,68, 3, 119-124 (1998) ·Zbl 1338.68109号
[21] Calude,C.S。;Jain,S。;库萨诺夫,B。;李伟(Li,W.)。;Stephan,F.,决定拟多项式时间中的奇偶博弈,(STOC(2017),ACM),252-263·Zbl 1369.68234号
[22] Kupferman,O.,《自动机理论和模型检验》(模型检验手册(2018),施普林格国际出版公司),107-151·Zbl 1392.68255号
[23] 古铁雷斯,J。;纳吉布,M。;佩雷利,G。;Wooldridge,M.,Eve:时间均衡分析工具,(ATVA.ATVA,LNCS,第11138卷(2018),Springer:Springer-Cham),551-557
[24] 阿鲁尔(Alur,R.)。;Henzinger,T.A.,反应模块,形式方法系统。设计。,15,1,7-48(1999年)
[25] 阿鲁尔(Alur,R.)。;Henzinger,T.A。;Mang,F.Y.C。;卡迪尔,S。;Rajamani,S.K。;Tasiran,S.,MOCHA:模型检查中的模块化,(CAV.CAV,LNCS,第1427卷(1998年),Springer),521-525
[26] Kwiatkowska,M.Z。;诺曼,G。;Parker,D.,PRISM:性能和可靠性分析的概率模型检查,ACM SIGMETRICS Perform.Eval。修订版,36、4、40-45(2009年)
[27] R.I.布拉夫曼。;Domshlak,C.,《从一到多:松散耦合多智能体系统的规划》(From one to many:planning for law-coupled multi-agent systems),(《第十八届自动规划与调度国际会议论文集》,第十八届国际自动规划与排程会议论文集,2008年9月14日至18日,澳大利亚悉尼(2008)),28-35
[28] 古铁雷斯,J。;Harrenstein,P。;佩雷利,G。;Wooldridge,M.,纳什平衡和双刺激不变性,(CONCUR.CCONUR,Schloss Dagstuhl.CONCUR.CONCUR,Schloss Dagstuhl,LIPIcs,第85卷(2017)),17:1-17:16·Zbl 1442.68143号
[29] 古铁雷斯,J。;Harrenstein,P。;佩雷利,G。;Wooldridge,M.J.,纳什均衡和互模拟不变性,Log。方法计算。科学。,15, 3 (2019) ·Zbl 1442.68142号
[30] Milner,R.,《沟通与并发》(1989),普伦蒂斯·霍尔·Zbl 0683.68008号
[31] 轩尼诗,M。;Milner,R.,《不确定性和并发性的代数定律》,J.ACM,32,1,137-161(1985)·Zbl 0629.68021号
[32] Sistla,A.P。;瓦尔迪,M.Y。;Wolper,P.,《Büchi自动机的互补问题及其在时序逻辑中的应用》,Theor。计算。科学。,49, 217-237 (1987) ·Zbl 0613.03015号
[33] Piterman,N.,《从非确定性Büchi和Streett自动机到确定性奇偶自动机》,Log。方法计算。科学。,3, 3, 1-21 (2007) ·Zbl 1125.68067号
[34] 古铁雷斯,J。;Harrenstein,P。;Wooldridge,M.,《战略推理的表达和复杂性结果》,(CONCUR.CONCUR,Schloss Dagstuhl.CONCUR.CONCUR、Schloss Dgstuhl,LIPIcs,第42卷(2015)),268-282·Zbl 1374.68332号
[35] 佩林,D。;Pin,J.,《无限词、纯数学和应用数学》(2004),爱思唯尔出版社·Zbl 1094.68052号
[36] 鲍耶,P。;Brenguier,R。;马基,N。;Ummels,M.,并发确定性博弈中的纯纳什均衡,Log。方法计算。科学。,11, 2, 1-72 (2015) ·Zbl 1320.91010号
[37] Zielonka,W.,《有限色图上的无限游戏与无限树上自动机的应用》,Theor。计算。科学。,200, 1-2, 135-183 (1998) ·Zbl 0915.68120号
[38] 高,T。;古铁雷斯,J。;Wooldridge,M.,《理性验证的迭代布尔游戏》(AAMAS(2017),ACM),705-713
[39] Brenguier,R.,PRALINE:并发博弈中计算纳什均衡的工具,(CAV.CAV,LNCS,第8044卷(2013),Springer),890-895
[40] Cermák,P。;Lomuscio,A。;莫加维罗,F。;Murano,A.,MCMAS-SLK:验证策略逻辑规范的模型检查器,(CAV.CAV,LNCS,第8559卷(2014),Springer),525-532
[41] 塞马克,P。;Lomuscio,A。;莫加维罗,F。;Murano,A.,根据SLK规范对多代理系统进行实际验证,Inf.Compute。,第261部分,588-614(2018)·Zbl 1395.68255号
[42] Lomuscio,A。;Qu,H。;Raimondi,F.,MCMAS:一个用于验证多代理系统的开源模型检查器,国际J.Softw。技术工具。传输。,19, 1, 9-30 (2017)
[43] 加斯丁,P。;Oddoux,D.,《快速LTL到Büchi自动机翻译》(CAV(2001),Springer),53-65·Zbl 0991.68044号
[44] (2019),LTL 2 BA:从LTL公式到Büchi自动机的快速转换
[45] 弗里德曼,O。;Lange,M.,《平价游戏解算器的PGsolver集合——第3版》(2010年)
[46] (2019),PGSolver
[47] 阿鲁尔(Alur,R.)。;Henzinger,T.A。;Kupferman,O.,《交替时间时序逻辑》,J.ACM,49,5,672-713(2002)·Zbl 1326.68181号
[48] 拉丁,R。;Liskov,B。;Shrra,L。;Ghemawat,S.,《使用延迟复制提供高可用性》,ACM Trans。计算。系统。,10,4360-391(1992年)
[49] 费舍尔,M.J。;Michael,A.,《牺牲可串行性以在不可靠的网络中实现数据的高可用性》(PODS(1982),ACM:ACM纽约,纽约,美国),70-75
[50] Wuu,G.T。;Bernstein,A.J.,复制日志和字典问题的有效解决方案,(PODC(1984),ACM:ACM纽约,纽约,美国),233-242
[51] Gifford,D.K.,复制数据的加权投票,(SOSP(1979),ACM:美国纽约州纽约市ACM),150-162
[52] 古铁雷斯,J。;纳吉布,M。;佩雷利,G。;Wooldridge,M.J.,《关于理性验证的计算可处理性》,(IJCAI(2019)),329-335,IJCAI.org
[53] Emerson,E.A.,《时间和模态逻辑》(理论计算机科学手册,B卷:形式模型和语义(B)(1990年),麻省理工学院出版社:麻省理学院出版社,马萨诸塞州剑桥),995-1072·Zbl 0900.03030号
[54] 库普夫曼,O。;佩雷利,G。;Vardi,M.Y.,《理性环境的综合》,《数学年鉴》。Artif公司。智力。,78, 1, 3-20 (2016) ·Zbl 1372.68173号
[55] Finkbeiner,B。;Schewe,S.,《协调逻辑》(CSL.CSL,LNCS,第6247卷(2010年),施普林格出版社),305-319·Zbl 1287.03070号
[56] 拉鲁西尼,F。;Markey,N.,《利用战略背景增强ATL》,Inf.Compute。,245, 98-123 (2015) ·Zbl 1332.68140号
[57] Cermák,P。;Lomuscio,A。;Murano,A.,《根据单目标策略逻辑规范验证和合成多智能体系统》(AAAI(2015),AAAI出版社),2038-2044
[58] Cermák,P。;Lomuscio,A。;莫加维罗,F。;Murano,A.,根据SLK规范对多代理系统进行实际验证,Inf.Compute。,第261部分,588-614(2018)·Zbl 1395.68255号
[59] Kwiatkowska,M。;帕克,D。;Wiltsche,C.,《Prism-games 2.0:随机博弈的多目标策略合成工具》,(TACAS.TACAS,LNCS,第9636卷(2016),Springer),560-566
[60] Toumi,A。;古铁雷斯,J。;Wooldridge,M.,并发游戏中纳什均衡的自动验证工具,(ICTAC.ICTAC,LNCS,第9399卷(2015),Springer),583-594·兹比尔1471.68157
[61] 大卫·A。;Larsen,K.G。;Legay,A。;米库乔尼斯,M。;Poulsen,D.B.,Uppaal SMC教程,Int.J.Softw。技术工具。传输。,17, 4, 397-415 (2015)
[62] Kwiatkowska,M。;诺曼,G。;帕克,D。;Santos,G.,并发随机博弈的基于均衡的概率模型检验,(FM.FM,LNCS,第11800卷(2019年),Springer),298-315
[63] 大卫·A。;Jensen,P.G。;Larsen,K.G。;米库乔尼斯,M。;Taankvist,J.H.,Uppaal stratego,(TACAS.TACAS,LNCS,第9035卷(2015年),施普林格出版社),206-211
[64] Bulychev,P.E。;大卫·A。;Larsen,K.G。;Legay,A。;Mikucionis,M.,《计算无线自组网中的纳什均衡:基于仿真的方法》, (《互动、游戏和议定书第二次国际研讨会论文集》。《互动、游戏和议定书第二次国际研讨会论文集》,IWIGP。《互动、游戏和议定书第二次国际研讨会论文集》。《互动、游戏和议定书第二次国际研讨会论文集》,IWIGP,EPTCS,第78卷 (2012)), 1-14
[65] Milner,R.,《通信系统微积分》,LNCS,第92卷(1980),Springer·兹比尔0452.68027
[66] 德尼古拉,R。;Vaandrager,F.W.,《分支互模拟的三种逻辑》,J.ACM,42,2,458-487(1995)·Zbl 0886.68064号
[67] 范·格拉贝克,R.J。;韦杰兰德,W.P.,互模拟语义中的分支时间和抽象,J.ACM,43,3,555-600(1996)·Zbl 0882.68085号
[68] 阿鲁尔(Alur,R.)。;Henzinger,T.A。;库普夫曼,O。;Vardi,M.Y.,《交替求精关系》,(CONCUR.CONCUR,LNCS,第1466卷(1998年),施普林格出版社),163-178·Zbl 1070.68524号
[69] van Benthem,J.,《作为过程模型的广泛游戏》,J.Log。语言信息,11,3,289-313(2002)·Zbl 1003.03530号
[70] 弗里德曼,O。;Lange,M.,《在实践中解决平价游戏》(ATVA.ATVA,LNCS,第5799卷(2009),Springer),182-196·Zbl 1258.68077号
[71] Ummels,M。;Wojtczak,D.,随机多人游戏中纳什均衡的复杂性,Log。方法计算。科学。,7, 3, 1-45 (2011) ·Zbl 1238.91025号
[72] 奥戈特内斯,T。;范德霍克,W。;Wooldridge,M.,《关于联盟游戏的推理》,Artif。智力。,173, 1, 45-79 (2009) ·Zbl 1180.68271号
[73] Belardinelli,F。;Lomuscio,A。;Murano,A。;Rubin,S.,《具有不完全信息和公共行为的多智能体系统的验证》(AAMAS(2017),ACM),1268-1276
[74] 阿米诺夫,B。;莫加维罗,F。;Murano,A.,《层级系统的合成》,科学。计算。程序。,83, 56-79 (2014)
[75] R.伯顿。;莫伯特,B。;Murano,A.,《信息不完全且召回完全的ATL*的可决定性结果》(AAMAS(2017),ACM),1250-1258
[76] Herzig,A。;Lorini,E。;Maffre,F。;Schwarzentruber,F.,《基于可见性和控制逻辑的认知布尔游戏》(IJCAI(2016),IJCAI/AAAI出版社),1116-1122
[77] 贝拉迪内利,F。;Lomuscio,A.,多智能体系统中知识推理的量化认知逻辑,Artif。智力。,173, 9-10, 982-1013 (2009) ·Zbl 1191.68646号
[78] 古铁雷斯,J。;Murano,A。;佩雷利,G。;鲁宾,S。;Wooldridge,M.J.,具有词汇偏好的并发游戏中的纳什均衡,(IJCAI(2017)),1067-1073,IJCAI.org
[79] 阿尔马戈,S。;库普夫曼,O。;Perelli,G.,定量客观博弈中可控纳什均衡的综合,(第二十七届国际人工智能联合会议论文集。第二十七届国际人工智能联合会议论文集,IJCAI 2018,2018年7月13-19日,瑞典斯德哥尔摩(2018)),35-41
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。