×

随机博弈的定量验证与策略综合。 (英语) Zbl 1347.93240号

概要:在不确定、竞争或对抗环境中运行的计算机系统的设计和控制可以通过正式建模和分析来促进。在本文中,我们重点分析了被建模为基于回合的玩家博弈(简称随机博弈)的复杂计算机系统,该博弈能够表达随机和非随机不确定性。我们对随机游戏的验证和策略合成的知识体系和算法技术进行了系统的概述,涉及时间逻辑中可表示的一大类定量属性。这些包括概率线性时间特性、预期总报酬、折扣报酬和平均报酬特性及其分支时间扩展和多目标组合。为了证明该框架的适用性及其在一个名为PRISM-games的工具中的实际实现,我们描述了几个依赖于随机游戏分析的案例研究,涉及机器人、网络和分布式系统等领域。

MSC公司:

93E03型 控制理论中的随机系统(一般)
91A15型 随机对策,随机微分对策
93亿B50 合成问题
90C29型 多目标规划
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[3] 灰分,R。;Doléans-Dade,C.,《概率与测度理论》(2000),哈考特,学术出版社:哈考特(Harcourt),学术出版社伯灵顿(Burlington),马萨诸塞州,美国·Zbl 0944.60004号
[5] 巴格纳拉,R。;希尔,P.M。;Zaffanella,E.,《帕尔马多面体图书馆:为硬件和软件系统的分析和验证实现一整套数字抽象》,科学。计算。程序。,72, 1-2, 3-21 (2008)
[14] Brázdil,T。;Forejt,V。;Král,J。;Křetínsk \345],J。;库切拉,A.,具有时限可达性的连续时间随机博弈,Inf.Compute。,224, 46-70 (2013) ·Zbl 1264.91016号
[18] 布朗,G。;卡莱尔,M。;Salmerón,J。;Wood,K.,《保护关键基础设施,接口》,36,6,530-544(2006)
[20] 查特吉,K。;Doyen,L.,《信念失败时,部分观察随机游戏秀获胜》,Trans。计算。逻辑,15,2,16(2014)·Zbl 1291.91021号
[21] 查特吉,K。;Doyen,L。;Henzinger,T.A.,部分观测随机奇偶博弈的调查,形式方法系统。设计。,43, 2, 268-284 (2013) ·兹比尔1291.91022
[22] 查特吉,K。;Henzinger,T.A.,《随机大规则游戏调查》,J.Compute。系统。科学。,78, 2, 394-413 (2012) ·Zbl 1237.91036号
[40] Condon,A.,随机游戏的复杂性,Inf.Compute。,96, 203-224 (1992) ·Zbl 0756.90103号
[41] Condon,A.,《关于简单随机游戏的算法》,高级计算。复杂。理论,13,51-73(1993)·Zbl 0808.90141号
[47] 菲拉尔,J。;Vrieze,K.,《竞争性马尔可夫决策过程》(1996),Springer-Verrag纽约公司:Springer-Verlag纽约公司,美国纽约州纽约市
[53] Kwiatkowska,M。;诺曼,G。;帕克,D。;Qu,H.,通过多目标模型检查进行组合概率验证,Inf.Comput。,232, 38-65 (2013) ·Zbl 1277.68138号
[57] 拉希贾尼安,M。;Andersson,S.B。;Belta,C.,离散时间随机系统的形式验证与综合,Trans。自动化。控制,60,82031-2045(2015)·Zbl 1360.93650号
[58] 利格特,T.M。;Lippman,S.A.,《具有完美信息和时间平均回报的随机博弈》,SIAM Rev.,11,4,604-607(1969)·Zbl 0193.19602号
[59] Ludwig,W.,简单随机博弈问题的次指数随机算法,Inf.Compute。,117,1511-155(1995年)·Zbl 0827.90141号
[60] Martin,D.A.,《布莱克威尔游戏的确定性》,J.Symbol。逻辑,63,4,1565-1581(1998)·Zbl 0926.03071号
[62] Nilim,A。;El Ghaoui,L.,具有不确定转移矩阵的马尔可夫决策过程的鲁棒控制,Oper。第53号、第5号、第780-798号决议(2005年)·Zbl 1165.90674号
[63] Papadimitriou,C。;Tsitsiklis,J.N.,马尔可夫决策过程的复杂性,数学。操作。第12、3、441-450号决议(1987年)·Zbl 0638.90099号
[68] 拉贝,M.N。;Schewe,S.,CTMDP和连续时间Markov对策的最佳时间抽象调度器,Theoret。计算。科学。,467, 53-67 (2013) ·Zbl 1261.90087号
[69] 拉宾,M.O.,概率自动机,Inf.Control,6,3,230-245(1963)·Zbl 0182.33602号
[74] Thompson,K.,《某些结局的回溯分析》,国际计算机。国际象棋协会,9,3,131-139(1986)
[77] Ummels,M。;Wojtczak,D.,随机多人游戏中纳什均衡的复杂性,Log。计算方法。科学。,7, 3 (2011) ·Zbl 1238.91025号
[82] 尹,Z。;Jiang,A.X。;Tambe,M。;Kiekintveld,C。;莱顿-布朗,K。;桑德霍姆,T。;Sullivan,J.P.,TRUSTS使用博弈论调度交通系统中的随机巡逻以进行票价检查,AI Mag.,33,4,59-72(2012)
此参考列表基于出版商或数字数学图书馆提供的信息。它的项目与zbMATH标识符启发式匹配,并且可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。