×

随机切换系统网络的基于合成抽象的综合。 (英语) Zbl 1441.93322号

摘要:在本文中,我们提供了一种组合方法来构造互连离散时间随机切换系统的有限抽象(即有限马尔可夫决策过程(MDP))。拟议框架基于以下概念随机模拟函数在控制器设计过程中,可以使用一个抽象系统来替代原始系统,并保证其输出轨迹的误差界。为此,我们首先通过随机模拟函数在随机切换子系统的互连和其有限抽象的互连之间提供概率紧密性保证。然后,我们利用足够的小增益类型条件来显示这项工作的合成结果。然后,我们证明了在确保切换系统增量输入-状态稳定性的标准假设下(即存在常见的增量Lyapunov函数,或倍数增量Lyapunov函数驻留时间)对于非线性随机切换系统的一般设置,可以构造有限MDP。对于一类特殊的非线性随机切换系统,我们还提出了一种构造有限MDP及其相应的随机模拟函数的方法。我们证明,对于这类系统,上述增量稳定性性质可以很容易地通过矩阵不等式进行检查。为了证明我们提出的结果的有效性,我们首先将我们的方法应用于由200个单元组成的环形级联环中的道路交通网络,并构造该网络的有限MDP。我们使用构造的有限抽象作为替代,以合成策略,使每个单元的交通密度低于20辆车。然后,我们将我们提出的技术应用于完全互联由500个非线性子系统(共1000维)组成的网络,并构造其有限的MDP和保证的误差界。我们将我们提出的结果与文献中的结果进行了比较。

MSC公司:

93E15型 控制理论中的随机稳定性
93立方 由微分方程以外的函数关系控制的控制/观测系统(例如混合系统和开关系统)
93D25号 控制理论中的输入输出方法
93亿B50 合成问题
93B70型 网络控制
93C55美元 离散时间控制/观测系统
90立方厘米 马尔可夫和半马尔可夫决策过程

软件:

FAUST2型
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] 阿巴特,A。;Prandini,M。;Lygeros,J。;Sastry,S.,受控离散时间随机混合系统的概率可达性和安全性,Automatica,44,11,2724-2734(2008)·Zbl 1152.93051号
[2] 拜尔,C。;Katoen,J.-P.,《模型检验原理》(2008),麻省理工学院出版社·Zbl 1179.68076号
[3] Basset,N.、Kwiatkowska,M.和Wiltsche,C.(2014)。随机博弈的组合控制器综合。《并发理论国际会议论文集》(第173-187页)·Zbl 1421.93053号
[4] 巴蒂洛蒂,S。;De Santis,A.,具有切换马尔可夫链的随机系统的驻留时间控制器,Automatica,41,6,923-934(2005)·Zbl 1091.93037号
[5] Bertsekas,D.P。;Shreve,S.E.,《随机最优控制:离散时间案例》(1996),雅典娜科学出版社
[6] Dashkovskiy,S。;吕弗,B.S。;Wirth,F.R.,一般网络的ISS小增益定理,控制、信号和系统数学(MCSS),19,2,93-122(2007)·Zbl 1125.93062号
[7] Dashkovskiy,S.N。;吕弗,B.S。;Wirth,F.R.,大系统的小增益定理和ISS Lyapunov函数的构造,SIAM控制与优化杂志,48,6,4089-4118(2010)·Zbl 1202.93008号
[8] Desharnais,J.、Laviolette,F.和Tracol,M.(2008年)。概率过程的近似分析:逻辑、模拟和游戏。第五届系统定量评估国际会议论文集(第264-273页)。
[9] D'Inocenzo,A.、Abate,A.和Katoen,J.(2012)。强大的PCTL模型检查。《第15届ACM混合系统国际会议论文集:计算与控制》(第275-286页)·Zbl 1361.68140号
[10] 哈恩,E.M。;哈特曼斯,A。;Hermanns,H。;Katoen,J.-P.,《随机混合系统的组合建模和分析框架》,《系统设计中的形式方法》,43,2,191-232(2013)·Zbl 1291.68293号
[11] 朱利叶斯,A.A。;Pappas,G.J.,随机混合系统的近似,IEEE自动控制汇刊,54,6,1193-1203(2009)·Zbl 1367.93618号
[12] Kallenberg,O.,《现代概率基础》(1997),Springer-Verlag:Springer-Verlag纽约·Zbl 0892.60001号
[13] Kamgarpour,M.、Summers,S.和Lygeros,J.(2013)。随机混合系统规范的控制设计。《第16届ACM混合系统:计算和控制国际会议论文集》(第303-312页)·Zbl 1364.93263号
[14] Kushner,H.J.(《随机稳定性与控制》,《随机稳定性和控制》,科学与工程数学(1967),爱思唯尔科学)·Zbl 0244.93065号
[15] Kwiatkowska,M。;诺曼,G。;帕克,D。;Qu,H.,通过多目标模型检查进行组合概率验证,信息与计算,232,38-65(2013)·Zbl 1277.68138号
[16] 拉森,K.G。;Skou,A.,通过概率测试的互模拟,信息和计算,94,1,1-28(1991)·Zbl 0756.68035号
[17] Lavaei,A.、Soudjani,S.、Majumdar,R.和Zamani,M.(2017年)。互联离散时间随机控制系统的组合抽象。第56届IEEE决策与控制会议记录(第3551-3556页)。
[18] Lavaei,A.、Soudjani,S.和Zamani,M.(2018a)。连续空间随机控制系统有限抽象的合成合成:一种小增益方法。第六届IFAC混合动力系统分析和设计会议记录,第51卷(16)(第265-270页)。
[19] Lavaei,A.、Soudjani,S.和Zamani,M.(2018b)。从耗散理论到有限马尔可夫决策过程的组合构造。《第21届ACM混合系统国际会议论文集:计算与控制》(第21-30页)·Zbl 1422.90067号
[20] 拉瓦伊,A。;Soudjani,S。;Zamani,M.,随机系统成分合成的近似概率关系,(数值软件验证程序。数值软件验证的程序,计算机科学讲义,第11652卷(2019)),101-109
[21] 拉瓦伊,A。;Soudjani,S。;Zamani,M.,随机切换系统网络的基于合成抽象的综合(2019),arXiv:1912.11481
[22] 拉瓦伊,A。;Soudjani,S。;Zamani,M.,通过近似概率关系对一般MDP进行基于成分抽象的合成(2019),arXiv:1906.02930
[23] 拉瓦伊,A。;Soudjani,S。;Zamani,M.,随机控制系统网络无限抽象的组合构造,Automatica,107,125-137(2019)·Zbl 1429.93139号
[24] 拉瓦伊,A。;Soudjani,S。;Zamani,M.,大型互联随机系统的组合(in)有限抽象,IEEE自动控制汇刊(2019),有条件接受为全文,arXiv:1808.00893
[25] 拉瓦伊,A。;Soudjani,S。;Zamani,M.,《大规模随机系统的合成:松弛耗散方法》,《非线性分析:混合系统》(2019),已被接受,arXiv:1902.01223v2
[26] Lavaei,A.、Soudjani,S.和Zamani,M.(2019g)。通过有限抽象对不一定稳定的随机系统进行合成合成。第18届欧洲控制会议记录(第2802-2807页)。
[27] Lavaei,A.和Zamani,M.(2019年)。大规模随机切换系统有限MDP的组合构造:耗散性方法。国际会计师联合会第15届大型复杂系统研讨会论文集:理论与应用,第52卷(3)(第31-36页)。
[28] Le Corronc,E.、Girard,A.和Goessler,G.(2013)。模式序列作为增量稳定切换系统抽象中的符号状态。第52届IEEE决策与控制会议记录(第3225-3230页)。
[29] Liberzon,D.,《系统与控制的切换》(2003),施普林格科学与商业媒体·Zbl 1036.93001号
[30] 马朱姆达尔,R。;马利克,K。;Soudjani,S.,随机系统上Büchi规范的符号控制器综合(2019),arXiv:1910.12137
[31] Morse,A.S.,线性设定点控制器系列的监督控制——第一部分精确匹配,IEEE自动控制汇刊,41,10,1413-1431(1996)·Zbl 0872.93009号
[32] Nejati,A.、Soudjani,S.和Zamani,M.(2019年)。连续时间随机控制系统的基于抽象的综合。第18届欧洲控制会议记录(第3212-3217页)。
[33] Pnueli,A.,程序的时序逻辑,(第18届计算机科学基础年度研讨会论文集(1977),IEEE),46-57
[34] Randrianantoanina,B.,关于从(mathbb{R}^n)到(mathbb{R}(2003))的一致和Lipschitz商映射的水平集的结构,ArXiv数学电子版·Zbl 1053.54036号
[35] Rüffer,B.S.,欧几里德n空间正值中的单调不等式、动力系统和路径,积极性,14,2,257-283(2010)·Zbl 1211.47091号
[36] 塞加拉,R。;Lynch,N.,概率过程的概率模拟,北欧计算杂志,2,2,250-273(1995)·Zbl 0839.68067号
[37] Soudjani,S。;Abate,A.,随机过程抽象和验证的自适应和顺序网格化程序,SIAM应用动力系统杂志,12,2,921-956(2013)·Zbl 1278.93243号
[38] Soudjani,S。;阿巴特,A。;Majumdar,R.,用于结构化随机过程形式验证的动态贝叶斯网络,信息学学报,54,21217-242(2017)·Zbl 1364.68262号
[39] Soudjani,S。;Gevaerts,C。;Abate,A.,(\textsf{FAUST}{}^{text{2}}):不可数状态随机过程的形式化抽象,(TACAS’15。TACAS’15,计算机科学讲稿,第9035卷(2015年),272-286
[40] Swikir,A.、Girard,A.和Zamani,M.(2018年)。从耗散理论到符号模型的合成。第四届印度控制会议记录(第30-35页)。
[41] Tabuada,P.,《混合系统的验证和控制:符号方法》(2009年),Springer Science&Business Media·Zbl 1195.93001号
[42] Tkachev,I.、Mereacre,A.、Katoen,J.和Abate,A.(2013)。非自治随机混合系统基于定量自动机的控制器综合。第16届ACM混合系统国际会议论文集:计算与控制(第293-302页)·Zbl 1362.68189号
[43] Tran,D.N。;吕弗,B.S。;Kellett,C.M.,离散时间非线性系统的收敛性(2017),arXiv:1612.05327v2
[44] 熊,J。;Lam,J。;舒,Z。;Mao,X.,具有随机开关信号的连续时间切换系统的稳定性分析,IEEE自动控制汇刊,59,1,180-186(2013)·Zbl 1360.93756号
[45] Young,W.H.,《关于可和函数类及其傅里叶级数》,伦敦皇家学会学报A:数学、物理和工程科学,87,594,225-229(1912)
[46] Zamani,M。;Abate,A.,随机切换随机系统的近似双相似符号模型,《系统与控制快报》,69,38-46(2014)·Zbl 1288.93098号
[47] Zamani,M。;阿巴特,A。;Girard,A.,《随机切换系统的符号模型:离散化和无离散化方法》,Automatica,55,183-196(2015)·Zbl 1377.93156号
[48] Zamani,M。;Mohajerin Esfahani,P。;马朱姆达尔,R。;阿巴特,A。;Lygeros,J.,通过近似双相似有限抽象实现随机系统的符号控制,IEEE自动控制汇刊,59,12,3135-3150(2014)·Zbl 1360.93445号
[49] Zamani,M。;伦格,M。;Mohajerin Esfahani,P.,《随机混合系统的近似:组合方法》,IEEE自动控制汇刊,62,62838-2853(2017)·Zbl 1369.60045号
[50] 张,M。;沈,C。;Wu,Z.-G。;Zhang,D.,带缺失测量的切换模糊系统的耗散滤波,IEEE控制论汇刊(2019)
[51] 张,M。;Shi,P。;马,L。;蔡,J。;Su,H.,模糊马尔可夫跳跃系统的量化反馈控制,IEEE控制论汇刊,99,1-10(2018)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。