×

兹马思-数学第一资源

自动时间均衡分析:多人博弈的验证与综合。(英语) Zbl公司 07274584
摘要:在多代理系统的上下文中理性验证这个问题涉及到当系统的组成部分被假定为在追求个体目标的过程中具有合理的和战略性的行为时,系统中哪些时态逻辑属性将保持不变。通常,这些目标被表示为相关代理希望看到满足的时态逻辑公式。不幸的是,rational验证在计算上很复杂,需要专门的技术来获得实际可用的实现。在本文中,我们提出了这样一种技术。这种技术依赖于将理性验证问题简化为奇偶对策集合的解决方案。我们的方法已经在E平衡验证E环境(欧氏瓣心内膜炎)系统。这个欧氏瓣心内膜炎系统以并发/多智能体系统的模型为输入,该模型使用简单反应模块语言(SRML)表示,其中agent目标用线性时序逻辑表示(LTL公司)公式,连同关于系统平衡行为的声明,也表示为LTL公司公式。欧氏瓣心内膜炎然后,可以检查索赔是否适用于通过代理人选择纳什均衡策略而可能产生的系统的某些(或每一个)计算;它还可以检验一个系统是否存在纳什均衡,并在多人博弈中为玩家综合个体策略。在介绍了我们的基本框架之后,我们描述了我们的新技术并证明了它的正确性。然后,我们将在欧氏瓣心内膜炎并给出了实验结果欧氏瓣心内膜炎与其他支持rational验证的现有工具相比,它的性能更好。
理学硕士:
68吨 人工智能
PDF格式 BibTeX公司 XML 引用
全文: 内政部
参考文献:
[1] 克拉克,E。M、 。;格鲁贝格,O。;佩利德,D。A、 ,模型检查(2002),麻省理工学院出版社:麻省理工学院出版社剑桥,马萨诸塞州,美国
[2] 伍尔德里奇,M.,《多智能体系统导论》(2001),威利:威利奇切斯特,英国
[3] 肖厄姆,Y。;Leyton Brown,K.,多智能体系统:算法、博弈论和逻辑基础(2008),CUP·Zbl公司 1163.91006
[4] 奥斯本,M。J、 。;《博弈论课程》(1994),麻省理工学院出版社·Zbl公司 1194.91003
[5] 哈珀,J。Y、 《超越纳什均衡:21世纪的解决方案概念》(KR(2008),AAAI出版社),6-15·Zbl公司 1301.91008
[6] 亚伯拉罕,我。;阿尔维斯,L。;哈珀,J。Y、 《分布式计算与博弈论相遇:结合来自两个领域的见解》,SIGACT News,42,2,69-76(2011)
[7] 古铁雷斯,J。;哈伦斯坦,P。;Wooldridge,M.,《从模型检验到平衡检验:理性验证的反应性模块》,人工制品。国际,248123-157(2017年)·Zbl公司 1420.68129
[8] 伍尔德里奇,M。;古铁雷斯,J。;哈伦斯坦,P。;马尔基奥尼。;佩雷利,G。;Toumi,A.,理性验证:从模型检验到均衡检验,(AAAI(2016)),4184-4191
[9] EVE:时间均衡分析工具(2019)
[10] 范德霍克,W。;洛穆西奥,A。;Wooldridge,M.,《实用ATL模型检查的复杂性》,(AAMAS(2006),ACM),201-208
[11] 《程序的时序逻辑》,(FOCS(1977),IEEE),46-57
[12] 莫加韦罗,F。;穆拉诺,A。;佩雷利,G。;瓦尔迪,M。Y、 策略推理:关于模型检验问题,ACM Trans。计算机。日志,15,4,34:1-34:47(2014)·Zbl公司 1354.68178
[13] 古铁雷斯,J。;哈伦斯坦,P。;伍尔德里奇,M.,《博弈型并发系统中的均衡推理》,安。纯应用程序。日志,168,2373-403(2017年)·Zbl公司 1400.03057
[14] 菲斯曼,D。;库普费尔曼,O。;拉斯蒂格,Y.,《理性合成》,(塔卡斯。塔卡斯,LNCS,第6015卷(2010年),施普林格出版社,190-204页·Zbl公司 1284.68396
[15] 古铁雷斯,J。;哈伦斯坦,P。;Wooldridge,M.,《迭代布尔博弈》,Inf.Comput.,242,53-79(2015年)·Zbl公司 1318.91012
[16] 查特吉,K。;亨辛格,T。A、 。;Piterman,N.,战略逻辑,信息计算,208,6677-693(2010)·Zbl公司 1205.68197
[17] 古铁雷斯,J。;佩雷利,G。;Wooldridge,M.,《反应模块游戏中的不完全信息》,Inf.Comput.,261,Part,650-675(2018年)·Zbl公司 1395.68188
[18] ö丁,C.,树自动机基础(自动机理论的现代应用(2012年),印度科学院:印度班加罗尔科学研究所),79-110·Zbl公司 1256.68103
[19] 爱默生E。A、 。;日德拉,C。S、 ,树自动机,mu演算与确定性,(FOCS,IEEE(1991)),368-377
[20] Jurdzinski,M.,决定平价游戏的赢家是在UP联合,信息处理。利特,124,1998年·Zbl公司 1338.68109
[21] 卡鲁德,C。S、 。;贾恩,S。;霍萨伊诺夫,B。;李,W。;Stephan,F.,《决定准多项式时间中的平价博弈》,(STOC(2017),ACM),252-263·Zbl公司 1369.68234
[22] Kupferman,O.,《自动机理论与模型检验》,《模型检验手册》(2018年),斯普林格国际出版社,107-151·Zbl公司 1392.68255
[23] 古铁雷斯,J。;纳吉布,M。;佩雷利,G。;伍尔德里奇,M.,Eve:时间均衡分析的工具(ATVA)。ATVA,LNCS,第11138卷(2018年),Springer:Springer Cham,551-557
[24] 铝,R。;亨辛格,T。A、 ,反应模块,形式。方法系统。Des.,15,1,7-48(1999年)
[25] 铝,R。;亨辛格,T。A、 。;曼格,F。Y、 C。;卡德尔,S。;拉贾马尼,S。K、 。;Tasiran,S.,MOCHA:模型检查中的模块化(CAV。CAV,LNCS,卷1427(1998),斯普林格,521-525
[26] Kwiatkowska,M。Z、 。;诺曼,G。;Parker,D.,PRISM:性能和可靠性分析的概率模型检查,ACM SIGMETRICS Perform。评估。第36、4、40-45版(2009年)
[27] 布拉夫曼,R。一、 。;《从一到多:松散耦合多智能体系统的规划》,《第十八届自动规划和调度国际会议论文集》。《第十八届自动化规划和调度国际会议记录》,2008年9月14日至18日,澳大利亚悉尼,2008年9月28日至35日
[28] 古铁雷斯,J。;哈伦斯坦,P。;佩雷利,G。;伍尔德里奇,M.,《纳什均衡与互模拟不变性》,(CONCUR。同意,施洛斯·达格斯图尔。同意。CONCUR,Schloss Dagstuhl,LIPIcs,第85卷(2017年)),17:1-17:16·Zbl公司 1442.68143
[29] 古铁雷斯,J。;哈伦斯坦,P。;佩雷利,G。;伍尔德里奇,M。J、 纳什均衡与互模拟不变性。方法计算。科学,15,3(2019年)·Zbl公司 1442.68142
[30] 米尔纳,R.,《沟通与并发》(1989),普伦蒂斯·霍尔·Zbl公司 683.68008
[31] 轩尼诗,M。;米尔纳,R.,《不确定性和并发性的代数定律》,J。ACM,32,1137-161(1985年)·Zbl公司 629.68021
[32] 西斯特拉,A。P、 。;瓦尔迪,M。Y、 。;Wolper,P.,B的互补问题üchi自动机及其在时序逻辑中的应用。计算机。科学,49217-237(1987)·Zbl公司 613.03015
[33] 皮特曼,N.,来自不确定性Büchi和Streett自动机到确定性奇偶自动机,Log。方法计算。科学,3,3,1-21(2007)·Zbl公司 1125.68067
[34] 古铁雷斯,J。;哈伦斯坦,P。;Wooldridge,M.,《战略推理的可扩展性和复杂性结果》(CONCUR。同意,施洛斯·达格斯图尔。同意。CONCUR,Schloss Dagstuhl,LIPIcs,第42卷(2015年)),268-282·Zbl公司 1374.68332
[35] 佩林,D。;Pin,J.,《无限词汇,纯粹与应用数学》(2004),爱思唯尔
[36] 鲍耶,P。;布伦圭尔,R。;马基,N。;《并发确定性博弈中的纯纳什均衡》,日志。方法计算。科学,11,2,1-72(2015)·Zbl公司 1320.91010
[37] 齐隆卡,W.,有限着色图上的无限对策及其在无限树上自动机的应用,理论。计算机。《科学》第200卷,第1-2页,第135-183页(1998年)·Zbl公司 915.68120
[38] 高,T。;古铁雷斯,J。;Wooldridge,M.,《迭代布尔博弈用于理性验证》,(AAMAS(2017),ACM),705-713
[39] Brenguier,R.,PRALINE:计算并发博弈中纳什均衡的工具,(CAV。2013年第895卷,第895卷
[40] Cerm公司ák、 P。;洛穆西奥,A。;莫加韦罗,F。;Murano,A.,MCMAS-SLK:策略逻辑规范验证的模型检查器(CAV。CAV,LNCS,第8559卷(2014),斯普林格出版社,525-532
[41] Cerm公司ák、 P。;洛穆西奥,A。;莫加韦罗,F。;Murano,A.,根据SLK规范对多智能体系统进行实际验证,Inf.Comput.,261,Part,588-614(2018年)·Zbl公司 1395.68255
[42] 洛穆西奥,A。;屈,H。;雷蒙迪,F.,MCMAS:一个用于验证多智能体系统的开源模型检查器,国际期刊。软。工具技术。Transf.,19,1,9-30(2017年)
[43] 加斯汀,P。;Oddoux,D.,快速LTL到Büchi自动机翻译,(CAV(2001),Springer),53-65·Zbl公司 991.68044
[44] (2019年),LTL 2 BA:从LTL公式快速转换为Bü气自动机
[45] 弗里德曼,O。;Lange,M.,《奇偶游戏求解器的PGsolver集合-第3版》(2010)
[46] (2019年),PGSolver
[47] 铝,R。;亨辛格,T。A、 。;《交替时间时序逻辑》,J。ACM,49,5,672-713(2002年)·Zbl公司 1326.68181
[48] 拉丁,R。;利斯科夫,B。;施莱拉,L。;Ghemawat,S.,使用延迟复制提供高可用性,ACM Trans。计算机。系统,10,4,360-391(1992)
[49] 费舍尔,M。J、 。;Michael,A.,《牺牲串行性以在不可靠的网络中获得数据的高可用性》(PODS(1982),ACM:ACM纽约,纽约,美国),70-75
[50] Wuu,G。T、 。;伯恩斯坦,A。J、 ,高效解决复制日志和字典问题,(PODC(1984),ACM:ACM纽约,纽约,美国),233-242
[51] 吉福,D。K、 ,复制数据的加权投票,(SOSP(1979),ACM:ACM纽约,纽约,美国),150-162
[52] 古铁雷斯,J。;纳吉布,M。;佩雷利,G。;伍尔德里奇,M。J、 ,关于理性验证的计算可处理性,(IJCAI(2019)),329-335,IJCAI.org
[53] 爱默生E。A、 《时间和模态逻辑》,《理论计算机科学手册》,B卷:形式模型和语义(B)(1990年),麻省理工学院出版社:麻省理工学院剑桥出版社,美国,995-1072·Zbl公司 900.03030
[54] 库普费尔曼,O。;佩雷利,G。;瓦尔迪,M。Y、 《理性环境下的合成》,Ann。数学。人工制品。国际,78,1,3-20(2016年)·Zbl公司 1372.68173
[55] 芬克贝纳,B。;Schewe,S.,协调逻辑(CSL。CSL,LNCS,第6247卷(2010),斯普林格出版社,305-319·Zbl公司 1287.03070
[56] 拉鲁西尼,F。;Markey,N.,《用战略背景扩充ATL》,Inf.Comput.,245,98-123(2015年)·Zbl公司 1332.68140
[57] Cerm公司ák、 P。;洛穆西奥,A。;Murano,A.,根据单目标策略逻辑规范验证和综合多智能体系统,(AAAI(2015),AAAI出版社,2038-2044
[58] Cerm公司ák、 P。;洛穆西奥,A。;莫加韦罗,F。;Murano,A.,根据SLK规范对多智能体系统进行实际验证,Inf.Comput.,261,Part,588-614(2018年)·Zbl公司 1395.68255
[59] 奎亚特科夫斯卡,M。;帕克,D。;Wiltsche,C.,Prism games 2.0:随机博弈的多目标策略综合工具(TACAS)。塔卡斯,LNCS,第9636卷(2016),斯普林格出版社,560-566
[60] 图米,A。;古铁雷斯,J。;Wooldridge,M.,一个自动验证并发博弈中纳什均衡的工具(ICTAC)。ICTAC,LNCS,第9399卷(2015年),斯普林格,583-594·Zbl公司 06545749
[61] 大卫,A。;拉森,K。G、 。;勒盖,A。;米库西奥尼斯,M。;保尔森,D。B、 ,Uppaal SMC教程,国际期刊。软。工具技术。Transf.,17,4,397-415(2015年)
[62] 奎亚特科夫斯卡,M。;诺曼,G。;帕克,D。;Santos,G.,《基于均衡的并发随机对策概率模型检验》,(FM。FM,LNCS,第11800卷(2019年),施普林格,298-315
[63] 大卫,A。;詹森,P。G、 。;拉森,K。G、 。;米库西奥尼斯,M。;Taankvist,J。H、 ,乌帕阿尔战略,塔卡斯。塔卡斯,LNCS,第9035卷(2015年),施普林格,206-211
[64] 布里切夫,P。E、 。;大卫,A。;拉森,K。G、 。;勒盖,A。;Mikucionis,M.,《计算无线自组织网络中的纳什均衡:基于仿真的方法》,《第二届交互、游戏和协议国际研讨会论文集》。第二届互动、游戏和协议国际研讨会论文集。第二届互动、游戏和协议国际研讨会论文集。第二届互动、游戏和协议国际研讨会论文集,IWIGP,EPTCS,第78卷(2012年)),1-14
〔65〕 米尔纳,R.,《通信系统微积分》,LNCS,第92卷(1980年),斯普林格·Zbl公司 452.68027
[66] 德尼科拉,R。;沃德拉格,F。W、 分支互模拟的三种逻辑。ACM,42,2458-487(1995年)·Zbl公司 886.68064
[67] 范格拉贝克,R。J、 。;韦杰兰,W。P、 《双模拟语义中的分支时间与抽象》,J。ACM,43,3555-600(1996年)·Zbl公司 882.68085
[68] 铝,R。;亨辛格,T。A、 。;库普费尔曼,O。;瓦尔迪,M。Y、 ,交替求精关系,(同意。CONCUR,LNCS,第1466卷(1998年),斯普林格,163-178·Zbl公司 1070.68524
〔69〕 van Benthem,J.,作为过程模型的广泛博弈,J。日志。Lang.Inf.,11,3,289-313(2002年)·Zbl公司 1003.03530
[70] 弗里德曼,O。;兰格,M.,《在实践中解决平价博弈》(ATVA)。ATVA,LNCS,第5799卷(2009年),斯普林格,182-196·Zbl公司 1258.68077
[71] 乌默尔斯,M。;Wojtczak,D.,《随机多人博弈中纳什均衡的复杂性》,日志。方法计算。《科学》第7、3、1-45页(2011年)·Zbl公司 1238.91025
[72] Å哥特,T。;范德霍克,W。;伍尔德里奇,M.,关于联合博弈的推理,人工智能。国际期刊,173,1,45-79(2009年)·Zbl公司 1180.68271
[73] 贝拉迪内利,F。;洛穆西奥,A。;穆拉诺,A。;Rubin,S.,具有不完全信息和公共行为的多智能体系统验证,(AAMAS(2017),ACM),1268-1276
[74] 氨基F,B。;莫加韦罗,F。;Murano,A.,层次系统综合,Sci。计算机。计划,83,56-79(2014)
[75] 伯顿,R。;莫伯特,B。;Murano,A.,不完全信息和完全召回的ATL*可判定性结果,(AAMAS(2017),ACM),1250-1258
[76] 赫齐格,A。;洛里尼,E。;马夫雷,F。;Schwarzentruber,F.,《基于可见性和控制逻辑的认知布尔博弈》(IJCAI(2016),IJCAI/AAAI出版社),1116-1122
[77] 贝拉迪内利,F。;Lomuscio,A.,多智能体系统中知识推理的量化认知逻辑,人工智能。国际期刊,1739-101982-1013(2009)·Zbl公司 1191.68646
[78] 古铁雷斯,J。;穆拉诺,A。;佩雷利,G。;鲁宾,S。;伍尔德里奇,M。J、 ,具有词典偏好的并发博弈中的纳什均衡,(IJCAI(2017)),1067-1073,IJCAI.org
[79] 阿尔马戈,S。;库普尔曼。;Perelli,G.,《定量目标博弈中可控纳什均衡的综合》,《第二十七届国际人工智能联席会议论文集》。《第二十七届人工智能国际联席会议论文集》,2018年7月13日至19日,瑞典斯德哥尔摩(2018年),第35-41页
此参考列表基于出版商或数字数学图书馆提供的信息。它的项被试探性地匹配到zbMATH标识符,并且可能包含数据转换错误。它试图尽可能准确地反映原始论文中列出的参考文献,而不要求匹配的完整性或精确性。