×

资源受限游戏中策略的描述、验证和生成。 (英语) Zbl 1486.91014号

摘要:随着对确保分布式和交互式系统可靠性和效率的需求不断增加,模型检查技术得到了广泛研究,其中基于游戏的系统建模和所需属性的逻辑规范是两个重要部分。现有的研究主要集中于始终保证最佳响应的理想系统,而没有考虑几个现实方面,例如,行动只能在足够的资源下执行。在本文中,我们提出了一个具有资源约束的博弈模型,从而为此类博弈提出了一种新的逻辑LRC。这种逻辑能够对其他参与实体的可能策略进行战略推理,因此不仅支持对资源有限的博弈均衡的描述,还支持对可用资源受限的多智能体系统进行战略开发。研究了这种逻辑的有趣性质,并提出了一种模型检查算法。LRC构建在交替时间时序逻辑(ATL)的基础上,表现出比ATL更具表现力,而不会带来额外的复杂性。除了确定存在缺席在协作策略中,我们探讨了当应该遵循某个协议时团队计划的生成。

MSC公司:

91A26型 博弈论中的理性与学习
03B44号 时间逻辑

软件:

图规划
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Alechina,N.、Logan,B.、Nguyen,H.N.和;amp;amp;amp;amp;amp;amp;amp;amp;Raimondi,F.(2014)。可确定模型——检查资源生产的资源逻辑。ECAI’14(第9-14页)·Zbl 1366.68161号
[2] Alechina,N.、Logan,B.、Nguyen,H.N.和;amp;amp;amp;amp;amp;amp;amp;amp;Rakib,A.(2010年)。基于资源的交替时间时序逻辑。AAMAS 10年会议记录(第481-488页)。
[3] 阿鲁尔(Alur,R.)。;Henzinger,T.A。;Kupferman,O.,交替时间-时间逻辑,美国计算机学会期刊。,49, 5, 672-713 (2002) ·Zbl 1326.68181号
[4] Benthem,J.V.,《作为过程模型的广泛游戏》,《逻辑、语言和信息杂志》,11,3,289-313(2002)·Zbl 1003.03530号
[5] 布莱克本,P。;de Rijke,M。;Venema,Y.,模态逻辑(2001),剑桥大学出版社·Zbl 0988.03006号
[6] Blum,A.L。;Furst,M.L.,通过规划图分析快速规划,人工智能,90,1-2,281-300(1997)·Zbl 1017.68533号
[7] Borgo,S.(2007年)。行动逻辑中的联合。在人工智能国际联合会议上(第822-1827页)。
[8] 布林,N。;Farwer,B.,《表示资源约束系统的属性:逻辑RTL*和RTL》(2009),施普林格-柏林-海德堡出版社·Zbl 1309.68066号
[9] Carmel,D.(1996年)。多智能体系统中的对手建模。技术报告Cm94 Technion。
[10] 查特吉,K。;Henzinger,T.A。;Piterman,N.,《战略逻辑、信息和计算》,208、6、677-693(2010)·Zbl 1205.68197号
[11] Dégremont,C。;保罗·S。;Asher,N.,《视线的逻辑》,《逻辑与计算杂志》,27,4,1225-1305(2016)·Zbl 1444.03111号
[12] Della Monica,D。;那不勒斯,M。;Parent,M.,《关于与价格资源代理的联盟游戏的逻辑》,《理论计算机科学电子笔记》,278215-228(2011)·Zbl 1347.68337号
[13] Goodfellow,I.J.、Pouget-Abadie,J.、Mirza,M.、Xu,B.、Warde-Farley,D.、Ozair,S.等人(2014)。世代对抗网。在NIPS’14中(第2672-2680页)。
[14] 古铁雷斯,J。;纳吉布,M。;佩雷利,G。;Wooldridge,M.,《自动时间均衡分析:多层游戏的验证与合成》,《人工智能》,第287页,第103353条,pp.(2020)·Zbl 1493.68360号
[15] Harrenstein,P。;范德霍克,W。;梅耶,J.-J.C。;Witteveen,C.,《纳什均衡的模式表征》,《信息学基础》,57,2-4,281-321(2003)·Zbl 1041.03016号
[16] 刘,C。;朱,E。;张,Q。;Wei,X.,《通过建模和仿真探索大规模游戏中计算成本的影响》,《国际智能系统杂志》,36,8,4065-4087(2021)
[17] Lorini,E。;Moisan,F.,《广泛游戏的认知逻辑》,《理论计算机科学中的电子笔记》,278245-260(2011)·Zbl 1348.91025号
[18] Muros,F.J。;音乐大师,J.M。;Algaba,E。;阿拉莫,T。;Camacho,E.F.,《使用游戏理论方法进行联盟方案的网络控制设计》,Automatica,78,320-332(2017)·Zbl 1357.93007号
[19] 拉马努贾姆,R。;Simon,S.,《结构化策略游戏的动态逻辑》(《第十一届知识表示和推理原则国际会议论文集》,KR’08(2008),AAAI出版社),49-58
[20] 范德霍克,W。;Pauly,M.,《游戏和信息的模态逻辑》(Blackburn,P.;Van Benthem,J.;Wolter,F.,《模态逻辑手册》,《逻辑和实践推理研究》,第3卷(2007),爱思唯尔出版社),1077-1148·Zbl 1114.03001号
[21] Van Otterloo,S。;范德霍克,W。;Wooldridge,M.,《游戏逻辑中的偏好》,(第三届自主代理和多代理系统国际联席会议论文集。第三届关于自主代理和多重代理系统国际联合会议论文集,AAMAS’04,第1卷(2004),IEEE计算机学会:IEEE Computer Society Washington,DC,USA),152-159
[22] Walther,D.、van der Hoek,W.和;amp;amp;amp;amp;amp;amp;amp;amp;Wooldridge,M.(2007)。具有显式策略的交替时间逻辑。TARK’07(第269-278页)。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。