×

并发随机系统的自动验证。 (英语) Zbl 1505.68025号

摘要:随机博弈的自动验证技术允许对在不确定或概率环境中理性主体之间具有竞争或协作行为的系统进行正式推理。现有的工具和技术侧重于基于回合的游戏,其中游戏的每个状态都由单个玩家控制,以及零和属性,其中两个玩家或联盟有直接对立的目标。本文提出了并发随机博弈(CSG)的自动验证技术,该技术提供了一个更自然的并发决策和交互模型。我们还考虑(社会福利)纳什均衡,以正式确定两个参与者或具有不同目标的联盟可以合作优化其联合绩效的场景。我们提出了时序逻辑rPATL的一个扩展,用于在这种情况下指定数量属性,并提出了相应的算法,用于验证和合成一种停止游戏的变体。对于有限视界属性,计算是精确的,而对于无限视界,则使用值迭代进行近似计算。对于零和性质,需要通过线性规划求解矩阵对策;对于基于均衡的性质,我们通过SMT编码的标记多胞体方法找到双矩阵对策的社会福利或社会成本纳什均衡。我们在PRISM-games中实现了这种方法,这需要扩展该工具的CSG建模语言,并将其应用于机器人、计算机安全和计算机网络等领域的案例研究,明确证明了CSG和基于平衡的属性的优点。

MSC公司:

60年第68季度 规范和验证(程序逻辑、模型检查等)
68问题85 并发和分布式计算的模型和方法(进程代数、互模拟、转换网等)
第68季度87 计算机科学中的概率(算法分析、随机结构、相变等)
91A15型 随机对策,随机微分对策
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] 阿鲁尔(Alur,R.)。;Henzinger,T。;Kupferman,O.,《交替时间时序逻辑》,J ACM,49,5,672-713(2002)·Zbl 1326.68181号 ·doi:10.1145/585265.585270
[2] Arslan G,Yüksel S(2017)随机动态博弈中的分布一致价格均衡。摘自:CDC’17会议记录。IEEE,第4594-4599页
[3] Ashok P,Chatterjee K,KretínskíJ,Weininger M,Winkler T(2020)广义可达随机对策的近似值。收录:LICS’20会议记录。ACM,第102-115页·Zbl 1455.91035号
[4] 阿维斯,D。;罗森博格,G。;萨瓦尼,R。;von Stengel,B.,双层博弈的纳什均衡枚举,经济理论,42,1,9-37(2010)·Zbl 1182.91013号 ·doi:10.1007/s00199-009-0449-x
[5] Basset,N。;Kwiatkowska,M。;Wiltsche,C.,多目标随机博弈的合成策略综合,Inf Comput,261,3536-587(2018)·Zbl 1395.68265号 ·doi:10.1016/j.ic.2017.09.010
[6] Bianco A,de Alfaro L(1995)概率和非确定性系统的模型检验。收录于:Thiagarajan P(ed)FSTTCS’95会议记录,LNCS,第1026卷。施普林格,第499-513页·兹比尔1354.68167
[7] Bouyer P、Markey N、Stan D(2014)并发博弈中的混合纳什均衡。收录:Raman V,Suresh S(编辑)FSTTCS’14会议录,LIPICS,第29卷。Leibniz-Zentrum für Informatik,第351-363页·Zbl 1360.91041号
[8] Bouyer P,Markey N,Stan D(2016),终端奖励并发博弈中不精确偏差下的随机均衡。摘自:Cantone D,Delzanno G(编辑)《GandALF’16会议录》,EPTCS,第226卷。开放出版协会,第61-75页·Zbl 1478.91035号
[9] Brázdil T、Chatterjee K、ChmelíK M、Forejt V、KřetínskõJ、Kwiatkowska M、Parker D、Ujma M(2014)《使用学习算法验证马尔可夫决策过程》。收录:Cassez F,Raskin JF(编辑)《ATVA’14会议录》,LNCS,第8837卷。施普林格,第98-114页·Zbl 1448.68290号
[10] Brenguier R(2013)PRALINE:并发游戏中计算纳什均衡的工具。收录:Sharygina N,Veith H(编辑)《CAV’13会议录》,LNCS,第8044卷。施普林格,第890-895页。http://lsv.fr/Software/praline/
[11] Brihaye T,Bruyère V,Goeminne A,Raskin JF,van den Bogaard M(2019)定量可达性博弈中子博弈完美均衡的复杂性。收录:Fokkink W,van Glabbeek R(编辑)《CONCUR’19会议录》,LIPIcs,第140卷。莱布尼兹·泽特鲁姆·福尔·Informatik,第13:1-13:16页·Zbl 1519.91051号
[12] C ermák P、Lomuscio A、Mogavero F、Murano A(2014)MCMAS-SLK:验证策略逻辑规范的模型检查器。收录:Biere A,Bloem R(eds)《CAV’14会议录》,LNCS,第8559卷。施普林格,pp 525-532
[13] Chatterjee K(2007)随机-常规游戏。加州大学伯克利分校博士论文
[14] 查特吉,K。;de Alfaro,L。;Henzinger,T.,并发可达性和基于循环的随机安全博弈的策略改进,计算系统科学杂志,79,5,640-657(2013)·Zbl 1269.91022号 ·doi:10.1016/j.jcss.2012.12.001
[15] Chatterjee K,Henzinger T(2008),价值迭代。收录:Grumberg O,Veith H(eds)25年模型检查,LNCS,第5000卷。施普林格,第107-138页·Zbl 1143.68042号
[16] 查特吉,K。;Henzinger,T.,《随机(ω)-规则游戏的调查》,《计算系统科学杂志》,78,2,394-413(2012)·Zbl 1237.91036号 ·doi:10.1016/j.jcss.2011.05.002
[17] Chatterjee K,Henzinger T,Jobstmann B,Radhakrishna A(2010)Gist:概率博弈的求解器。在:Touili T,Cook B,Jackson P(编辑)CAV’10会议记录,LNCS,第6174卷。施普林格,第665-669页。http://pub.ist.ac.at/gist/
[18] Chatterjee K,Majumdar R,Jurdziñski M(2004)关于随机博弈中的Nash均衡。收录人:Marcinkowski J,Tarlecki A(eds)《CSL’04会议录》,LNCS,第3210卷。施普林格,第26-40页·兹比尔1095.91001
[19] Chen,T。;Forejt,V。;Kwiatkowska,M。;帕克,D。;Simaitis,A.,竞争随机系统的自动验证,形式方法系统设计,43,1,61-92(2013)·Zbl 1291.68252号 ·doi:10.1007/s10703-013-0183-7
[20] Chen T,Forejt V,Kwiatkowska M,Simaitis A,Wiltsche C(2013)关于多目标随机博弈。收录于:Chatterjee K,Sgall J(eds)《MFCS’13会议录》,LNCS,第8087卷。施普林格,第266-277页·Zbl 1400.91040号
[21] Cheng C,Knoll A,Luttenberger M,Buckl C(2011)GAVS+:算法游戏求解研究的开放平台。收录:Abdulla P、Leino K(编辑)《TACAS’11会议录》,LNCS,第6605卷。施普林格,第258-261页。http://sourceforge.net/projects/gavsplus/
[22] de Alfaro L(1999)计算概率系统中的最小和最大可达时间。收录:Baeten J,Mauw S(编辑)《CONCUR’99会议录》,LNCS,第1664卷。施普林格,第66-81页·Zbl 0949.93082号
[23] de Alfaro L,Henzinger T(2000)《并发欧米伽规则游戏》。单位:LICS’00。ACM,第141-154页
[24] de Alfaro,L。;Henzinger,T。;Kupferman,O.,并发可达性游戏,Theor Compute Sci,386,3,188-217(2007)·Zbl 1154.91306号 ·doi:10.1016/j.tcs.2007.07.008
[25] de Alfaro,L。;Majumdar,R.,欧米伽规则游戏的定量求解,计算机系统科学杂志,68,2,374-397(2004)·Zbl 1093.91001号 ·doi:10.1016/j.jcss.2003.07.009
[26] De Moura L,Björner N(2008)Z3:一种高效的SMT求解器。收录于:Ramakrishnan C,Rehof J(eds)《2008年TACAS会议录》,LNCS,第4963卷。施普林格,第337-340页。http://github.com/z3漫游/z3
[27] Dileepa F,Dong N,Jegouel C,Dong J(2018)概率BAR系统强Nash均衡的验证。收录于:Sun J、Sun M(编辑)《ICFEM’18会议录》,LNCS,第11232卷。施普林格,第106-123页
[28] Dutertre B(2014)Yices 2.2。收录:Biere A,Bloem R(eds)《CAV’14会议录》,LNCS,第8559卷。施普林格,第737-744页。http://yices.csl.sri.com
[29] Fearnley J,Savani R(2015)单纯形方法的复杂性。摘自:STOC’15会议记录。ACM,第201-208页·兹比尔1321.90079
[30] 福登堡,D。;Levine,D.,有限和无限大博弈的子博弈完全均衡,经济理论杂志,31,2,251-268(1983)·Zbl 0521.90106号 ·doi:10.1016/0022-0531(83)90076-5
[31] Gansner E,Koutsofios E,North S(2015)用点绘制图形。Dot用户手册
[32] 吉尔博亚,I。;Zemel,E.,Nash和相关均衡:一些复杂性考虑,Games Econ Behav,1,1,80-93(1989)·Zbl 0755.9003号 ·doi:10.1016/0899-8256(89)90006-7
[33] Gutierrez J、Najib M、Giuseppe P、Wooldridge M(2019)并发游戏的平衡设计。收录:Fokkink W,van Glabbeek R(编辑)《CONCUR’19会议录》,LIPIcs,第140卷。莱布尼兹·泽特鲁姆·福尔·Informatik,pp 22:1-22:16·Zbl 07649930号
[34] Gutierrez J、Najib M、Perelli G、Wooldridge M(2018)EVE:时间均衡分析工具。收录人:Lahiri S,Wang C(编辑)《ATVA’18会议录》,LNCS,第11138卷。斯普林格,第551-557页。http://github.com/eve-mas/eve-parity
[35] 古铁雷斯,J。;纳吉布,M。;佩雷利,G。;Wooldridge,M.,《自动时间均衡分析:多层游戏的验证和合成》,Artif Intell,287103353(2020)·Zbl 1493.68360号 ·doi:10.1016/j.artint.2020.103353
[36] 哈达德,S。;Monmege,B.,MDP和IMDP的区间迭代算法,Theor Compute Sci,735,111-131(2018)·Zbl 1393.68103号 ·doi:10.1016/j.tcs.2016.12.003
[37] Hansen,K。;易卜森·詹森,R。;Miltersen,P.,《使用价值和策略迭代求解可达性博弈的复杂性》,理论计算系统,55,380-403(2011)·Zbl 1319.68149号 ·doi:10.1007/s00224-013-9524-6
[38] Hansson,H。;Jonsson,B.,《关于时间和可靠性的推理逻辑》,《形式Asp计算》,6,5,512-535(1994)·兹伯利0820.68113 ·doi:10.1007/BF01211866
[39] 希尔贝,C。;Šimsa,Š。;查特吉,K。;Nowak,M.,《随机博弈中合作的进化》,《自然》,559246-249(2018)·数字对象标识代码:10.1038/s41586-018-0277-x
[40] ILOG密码。http://ibm.com/products/ilog-cplex-optimization-studio
[41] Karmarkar,N.,线性规划的新多项式时间算法,组合数学,4,4,373-395(1984)·Zbl 0557.90065号 ·doi:10.1007/BF02579150
[42] Kelmendi E,Krämer J,KretínskJ,Weininger M(2018)简单随机博弈的值迭代:停止准则和学习算法。收录:Chockler H、Weissenbacher G(编辑)《CAV’18会议录》,LNCS,第10981卷。施普林格,第623-642页·Zbl 1511.91010号
[43] Kemeny,J。;斯内尔,J。;Knapp,A.,《无数马尔可夫链》(1976),柏林:施普林格出版社,柏林·Zbl 0348.60090号 ·doi:10.1007/978-1-4684-9455-6
[44] Kwiatkowska M,Norman G,Parker D(2011)PRISM 4.0:概率实时系统验证。收录于:Gopalakrishnan G,Qadeer S(编辑)《CAV’11会议录》,LNCS,第6806卷。施普林格,第585-591页。http://prismmodelchecker.org
[45] Kwiatkowska M,Norman G,Parker D,Santos G(2018)并发随机游戏的自动验证。摘自:Horvath A,McIver A(编辑)《QEST’18会议录》,LNCS,第11024卷。施普林格,第223-239页·Zbl 1514.68138号
[46] Kwiatkowska M,Norman G,Parker D,Santos G(2019)并发随机博弈的基于均衡的概率模型检验。收录:ter Beek M,McIver A,Oliveira J(编辑)FM’19,LNCS,第11800卷。施普林格,第298-315页
[47] Kwiatkowska M,Norman G,Parker D,Santos G(2020)并发随机博弈的多人均衡验证。收录:Gribaudo M、Jansen D、Remke A(编辑)《20年QEST会议录》,LNCS。施普林格(即将亮相)
[48] Kwiatkowska M,Norman G,Parker D,Santos G(2020)PRISM游戏3.0:具有并发性、均衡性和时间的随机游戏验证。收录于:第32届计算机辅助验证国际会议论文集(CAV’20),LNCS,第12225卷。施普林格,pp 475-487
[49] Kwiatkowska M,Parker D(2013)概率系统的自动验证和策略合成。收录:Hung DV,Ogawa M(编辑)《ATVA’13会议录》,LNCS,第8172卷。施普林格,第5-22页·兹比尔1410.68233
[50] Kwiatkowska M、Parker D、Simaitis A(2013)《用户中心网络信任模型的战略分析》。收录:Mogavero F、Murano A、Vardi M(编辑)《SR'13会议录》,EPTCS,第112卷。开放出版协会,第53-60页
[51] Kwiatkowska,M。;帕克,D。;Wiltsche,C.,PRISM-games:多目标随机多层游戏的验证和策略合成,Softw Tools Technol Transf,20,2,195-210(2018)·doi:10.1007/s10009-017-0476-z
[52] Lemke,C。;霍森,JJ,双矩阵博弈的平衡点,J Soc Ind应用数学,12,2,413-423(1964)·Zbl 0128.14804号 ·数字对象标识代码:10.1137/0112033
[53] Lozovanu D,Pickl S(2017),确定带有折扣支付的随机位置游戏的纳什均衡。收录:Rothe J(ed)ADT’17,LNAI,第10576卷。施普林格,第339-343页
[54] LPSolve(5.5版)。http://lpsolve.sourceforge.net/5.5/
[55] Martin,D.,《布莱克威尔游戏的确定性》,J Symb Logic,63,4,1565-1581(1998)·Zbl 0926.03071号 ·doi:10.2307/2586667
[56] McIver,A。;Morgan,C.,定量微积分qMu的结果,ACM跨计算逻辑,8,1,1-43(2007)·Zbl 1367.68199号 ·数字对象标识代码:10.1145/1182613.1182616
[57] McKelvey R、McLennan A、Turocy T Gambit:博弈论的软件工具。http://gambit-project.org
[58] Nash,J.,《人与人博弈中的均衡点》,《国家科学院学报》,第36期,第48-49页(1950年)·Zbl 0036.01104号 ·doi:10.1073/pnas.36.1.48
[59] 尼桑,N。;拉夫加登,T。;塔尔多斯,E。;Vazirani,V.,算法博弈论(2007),剑桥:剑桥大学出版社,剑桥·Zbl 1130.91005号 ·doi:10.1017/CBO9780511800481
[60] Nudelman E、Wortman J、Shoham Y、Leyton-Brown K(2004)《运行GAMUT:评估游戏理论算法的综合方法》。收录于:AAMAS’04会议记录。IEEE,第880-887页。http://gamut.stanford.edu
[61] 奥斯本,M。;Rubinstein,A.,《博弈论导论》(2004),牛津:牛津大学出版社,牛津·Zbl 1140.91365号
[62] Pacheco J,Santos F,Souza M,Skyrms B(2011)集体行动的进化动力学。在:达尔文的数学遗产,数学和生物科学的互动。施普林格,第119-138页·Zbl 1379.92075号
[63] Papadimitriou,C.,《关于奇偶论证的复杂性和其他无效的存在证明》,《计算系统科学杂志》,48,3,498-532(1994)·兹伯利0806.68048 ·doi:10.1016/S0022-0000(05)80063-7
[64] Porter R,Nudelman E,Shoham Y(2004)《寻找纳什均衡的简单搜索方法》。摘自:AAAI'04会议记录。AAAI出版社,第664-669页
[65] Prasad H,Prashanth L,Bhatnagar S(2015)一般和随机博弈中学习Nash均衡的双时间尺度算法。摘自:AAMAS’15会议记录。IFAAMAS,第1371-1379页
[66] Puterman,M.,《马尔可夫决策过程:离散随机动态规划》(Markov decision processes:discrete random dynamic programming)(1994),霍博肯:威利·Zbl 0829.90134号 ·doi:10.1002/9780470316887
[67] 秦,H。;唐·W。;Tso,R.,《理性量子秘密共享》,科学代表,8,11115,1-7(2018)
[68] Raghavan,T。;Filar,J.,《随机游戏的算法——一项调查》,Z Oper Re,35,6,437-472(1991)·Zbl 0736.90082号
[69] Sandholm T,Gilpin A,Conitzer V(2005)《寻找纳什均衡的混合整数规划方法》,收录于:《AAAI'05会议录》。AAAI出版社,第495-501页
[70] 施瓦尔贝,美国。;Walker,P.,Zermelo和博弈论的早期历史,《博弈经济学》Behav,34,1,123-137(2001)·Zbl 0978.91002号 ·doi:10.1006/游戏.2000.0794
[71] Shapley,L.,《随机博弈》,PNAS,39,1095-1100(1953)·Zbl 0051.35805号 ·doi:10.1073/pnas.39.10.1095
[72] Shapley L(1974)关于Lemke-Howson算法的注释。收录:巴林斯基(Balinski)M(ed)旋转与扩展:为了纪念A.W.Tucker,数学规划研究,第1卷。施普林格,第175-189页·Zbl 0366.90133号
[73] Todd,M.,《线性规划的多方面》,《数学程序》,91,3,417-436(2002)·Zbl 1030.90051号 ·doi:10.1007/s101070100261
[74] Toumi A、Gutierrez J、Wooldridge M(2015)并发游戏中纳什均衡的自动验证工具。收录:Leucker M、Rueda C、Valencia F(编辑)《ICTAC’15会议录》,LNCS,第9399卷。施普林格,第583-594页·Zbl 1471.68157号
[75] Ummels M(2010)《随机多人游戏:理论和算法》。亚琛工业大学博士论文
[76] 冯·诺依曼,J.,《数学年鉴》,100295-320(1928)·doi:10.1007/BF01448847
[77] 冯·诺依曼,J。;摩根斯坦,O。;库恩,H。;Rubinstein,A.,《博弈论与经济行为》(1944),普林斯顿:普林斯顿大学出版社,普林斯顿·Zbl 0063.05930号
[78] Zhu Q,Başar T(2009)基于动态策略的IDS配置。收入:CDC’09。IEEE,第8600-8605页
[79] Zhu Q,Li H,Han Z,Bašar T(2010)多信道认知无线电系统中干扰的随机博弈模型。摘自:国际商会2010年会议记录。IEEE,第1-6页
[80] PRISM-games网站。http://prismmodelchecker.org/games/
[81] 支持材料。http://prismmodelchecker.org/files/fmsd-csgs/
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。