文件Zbl 1505.93257-zbMATH Open

随机系统基于自动机的控制器综合：基于近似概率关系的博弈框架。（英语） Zbl 1505.93257号

Automatica公司 147，文章ID 110696，16 p.（2023）.

摘要：在这项工作中，我们提出了一种用于离散时间随机系统控制器综合的抽象和精化方法，以增强确定性有限自动机（DFA）表示的复杂逻辑特性。我们提出的方案基于所谓的（epsilon，delta）近似概率关系的概念，允许量化由离散时间随机博弈建模的随机系统与其相应的有限抽象之间的相似性。利用这种关系，通过将抽象系统上合成的控制器细化为原始游戏，可以很好地确保满足所需规范的概率的下限。此外，我们还提出了一种算法程序，用于构造一类对非线性具有斜率限制的非线性随机系统的这种关系。以四旋翼飞机为例验证了所提方法，结果表明满足概率的期望下限得到了保证。

引用于1文件

MSC公司：

93E03型	控制理论中的随机系统（一般）
93C55美元	离散时间控制/观测系统
93亿B50	合成问题
65年第68季度	形式语言和自动机
91A15型	随机对策，随机微分对策

关键词：

随机博弈;基于自动机的控制器综合;近似概率关系;政策完善;有限抽象

软件：

SDPT3系统;现场;AMYTISS公司;MPT公司

PDF格式 BibTeX公司 XML格式引用

全文： DOI程序 arXiv公司

参考文献：

[1]	阿巴特，A。；Katoen，J.-P。；Lygeros，J。；Prandini，M.，随机混合系统的近似模型检验，《欧洲控制杂志》，16，6，624-641（2010）·Zbl 1216.93091号
[2]	阿巴特，A。；Prandini，M。；Lygeros，J。；Sastry，S.，受控离散时间随机混合系统的概率可达性和安全性，Automatica，44，11，2724-2734（2008）·Zbl 1152.93051号
[3]	阿伯卡内，S。；Dragan，V.，关于时变零和LQ随机差分对策问题的解决方案：Riccati方程方法，（第18届欧洲控制会议论文集（2019）），388-393
[4]	Arcak，M。；Kokotovic，P.，基于观测器的斜率受限非线性系统控制，IEEE自动控制汇刊，46，7，1146-1150（2001）·Zbl 1014.93033号
[5]	Asselborn，L。；Stursberg，O.，《使用随机可达性的不确定线性系统的概率控制》，IFAC-PapersOnLine，48，14，167-173（2015）
[6]	拜尔，C。；Katoen，J.-P.，《模型检验原理》（2008），麻省理工学院出版社·Zbl 1179.68076号
[7]	Basset，N。；Kwiatkowska，M。；Wiltsche，C.，多目标随机博弈的合成策略综合，信息与计算，261536-587（2018）·Zbl 1395.68265号
[8]	伯纳多，J.M。；Smith，A.F.M.，《贝叶斯理论》，第405卷（2009年），John Wiley&Sons
[9]	Borkar，V.S.，《概率论：高级课程》（2012），施普林格科学与商业媒体
[10]	博伊德，S。；博伊德，S.P。；Vandenberghe，L.，《凸优化》（2004），剑桥大学出版社·Zbl 1058.90049号
[11]	布雷顿，M。；Alj，A。；Haurie，A.，二人博弈中的序列Stackelberg均衡，优化理论与应用杂志，59，1，71-97（1988）·兹比尔0631.90100
[12]	Buzhinsky，I.，《将自然语言需求形式化为时序逻辑：一项调查》（2019年IEEE第17届工业信息学国际会议，第1卷）。2019年IEEE第17届工业信息学国际会议，第1卷，印度（2019），IEEE），400-406
[13]	坎农，M。；Cheng，Q。；Kouvaritakis，B。；Raković，S.V.，带状态估计的随机管MPC，Automatica，48，3，536-541（2012）·Zbl 1244.93181号
[14]	查特吉，K。；Doyen，L.，具有广义平均值目标的完美信息随机博弈，（第31届ACM/IEEE计算机科学逻辑研讨会论文集（2016）），247-256·Zbl 1401.68238号
[15]	查特吉，K。；Ibsen-Jensen，R.，《并发平均值博弈的定性分析，信息与计算》，242，2-24（2015）·Zbl 1318.91039号
[16]	查特吉，K。；Katoen，J.-P。；Weininger，M。；Winkler，T.，《具有词典可达性-安全目标的随机游戏》（计算机辅助验证国际会议（2020），Springer），398-420·兹比尔1478.68151
[17]	丁，J。；坎加普尔，M。；萨默斯，S。；阿巴特，A。；Lygeros，J。；Tomlin，C.，离散时间随机混合系统验证和控制的随机游戏框架，Automatica，49，9，2665-2674（2013）·Zbl 1364.93857号
[18]	Duret-Lutz，A。；Lewkowicz，A。；Faucille，A。；Michaud，T。；雷诺，E。；Xu，L.，Spot 2.0：LTL和（omega）-自动机操作框架，（自动化技术验证和分析国际研讨会（2016），Springer），122-129
[19]	范，X。；Arcak，M.，多变量单调非线性系统的观测器设计，《系统与控制快报》，50，4，319-330（2003）·Zbl 1157.93330号
[20]	Faruq，F。；帕克，D。；拉克尔达，B。；Hawes，N.，《不确定性下的同步任务分配和规划》（IEEE/RSJ智能机器人和系统国际会议论文集（2018）），3559-3564
[21]	弗雷德里克森，S.K.S。；Miltersen，P.B.，并发可达性博弈和其他随机博弈的单项式策略，（可达性问题国际研讨会（2013），Springer），122-134·兹比尔1407.68289
[22]	Girard，A。；Pappas，G.J.，使用近似模拟的分层控制系统设计，Automatica，45，2，566-571（2009）·Zbl 1158.93301号
[23]	González Trejo，J.I.（西班牙语：González Trejo，J.I.）。；埃尔南德斯·勒尔马，O。；Hoyos-Reyes，L.F.，离散随机系统的Minimax控制，SIAM控制与优化杂志，41，5，1626-1659（2002）·邮编：1045.90083
[24]	Haesaert，S。；Soudjani，S.，随机系统时序逻辑控制的鲁棒动态规划，IEEE自动控制汇刊，662496-2511（2020）·Zbl 1467.93292号
[25]	Haesaert，S。；Soudjani，S。；Abate，A.，通过近似相似关系和策略细化验证一般马尔可夫决策过程，SIAM控制与优化杂志，55，4，2333-2367（2017）·Zbl 1367.93615号
[26]	Haesaert，S。；Soudjani，S。；Abate，A.，《通过近似策略细化对一般马尔可夫决策过程进行时序逻辑控制》，IFAC-PapersOnLine，51，16，73-78（2018）
[27]	Henzinger，T.A。；de Alfaro，L.公司。；Chatterjee，K.，并发可达性游戏的策略改进，（第三届系统定量评估国际会议（2006），IEEE），291-300
[28]	Herceg，M。；Kvasnica，M。；Jones，C.N。；Morari，M.，多参数工具箱3.0，（欧洲控制会议论文集（2013）），502-510
[29]	Hou，T。；张伟。；Ma，H.，带乘性噪声离散时间马尔可夫跳跃系统的基于游戏的控制设计，IET控制理论与应用，7，5，773-783（2013）
[30]	坎加普尔，M。；丁，J。；萨默斯，S。；阿巴特，A。；Lygeros，J。；Tomlin，C.，离散时间随机混合动力博弈：验证与控制器综合，（第50届IEEE决策与控制会议和欧洲控制会议论文集（2011）），6122-6127
[31]	坎加普尔，M。；萨默斯，S。；Lygeros，J.，随机混合系统规范的控制设计，（第16届混合系统国际会议论文集：计算与控制（2013）），303-312·Zbl 1364.93263号
[32]	坎加普尔，M。；伍德，T.A。；萨默斯，S。；Lygeros，J.，《给定随机集定义的自动机规范的随机系统的控制综合》，Automatica，76，177-182（2017）·兹比尔1352.93045
[33]	Kattenbelt，M。；Kwiatkowska，M。；诺曼，G。；Parker，D.，马尔可夫决策过程的基于游戏的抽象再定义框架，系统设计中的形式化方法，36，3，246-280（2010）·Zbl 1233.90276号
[34]	库普夫曼，O。；Vardi，M.Y.，安全特性的模型检查，系统设计中的形式化方法，19，3，291-314（2001）·Zbl 0995.68061号
[35]	Kwiatkowska，M.Z.，《随机博弈的模型检验和策略综合：从理论到实践》，（第43届国际自动机、语言和编程学术研讨会论文集（2016））·Zbl 1388.68186号
[36]	Kwiatkowska，M。；诺曼，G。；Parker，D.，turn-based概率实时游戏的验证和控制，（计算系统建模的艺术：从逻辑和并发到安全和隐私的旅程（2019）），379-396
[37]	Lavaei，A.，《大规模随机计算机物理系统的自动验证和控制：合成技术》，1-268（2019），慕尼黑理工大学电气工程系：德国慕尼黑工业大学电气工程部，（博士论文）
[38]	拉瓦伊，A。；哈立德，M。；苏贾尼，S。；Zamani，M.，AMYTISS：大型随机系统的并行自动控制器综合，（计算机辅助验证国际会议（2020），Springer），461-474·Zbl 1481.93037号
[39]	拉瓦伊，A。；Soudjani，S。；阿巴特，A。；Zamani，M.，《随机混合系统的自动验证和合成：一项调查》（2022年），Automatica·Zbl 1504.93389号
[40]	拉瓦伊，A。；Soudjani，S。；Zamani，M.，随机控制系统网络无限抽象的组合构造，Automatica，107，125-137（2019）·Zbl 1429.93139号
[41]	拉瓦伊，A。；Soudjani，S。；Zamani，M.，随机切换系统网络的基于合成抽象的综合，Automatica，114（2020）·Zbl 1441.93322号
[42]	拉瓦伊，A。；Soudjani，S。；Zamani，M.，《大规模随机系统的成分抽象：松弛耗散方法》，非线性分析。混合动力系统，36（2020）·Zbl 1441.93293号
[43]	拉韦，A。；Soudjani，S。；Zamani，M.，大型互联随机系统的组合（in）有限抽象，IEEE自动控制汇刊，65，12，5280-5295（2020）·兹伯利07320099
[44]	拉瓦伊，A。；Soudjani，S。；Zamani，M.，《通过近似概率关系基于合成抽象的一般MDP合成》，非线性分析。混合动力系统，39（2021）·Zbl 1478.93665号
[45]	Moon，J。；Bašar，T.，具有大量追随者的离散时间随机Stackelberg动态博弈，（IEEE第55届决策与控制会议论文集（2016）），3578-3583
[46]	Mukaidani，H。；Xu，H.，离散随机系统的无限时域线性二次Stackelberg对策，Automatica，76301-308（2017）·兹比尔1352.93106
[47]	内贾蒂，A。；Soudjani，S。；Zamani，M.，连续随机混杂系统基于成分抽象的合成，欧洲控制杂志，57，82-94（2021）·Zbl 1455.93190号
[48]	Nejati，A。；Zamani，M.，连续随机系统有限MDP的组合构造：耗散方法，IFAC-PapersOnLine，53，2，1962-1967（2020）
[49]	美国里德，《具有一般效用函数的非合作动态博弈》，（随机博弈及相关主题：纪念L.S.Shapley教授（1991），施普林格荷兰：施普林格荷属多德雷赫特），161-174·Zbl 0742.90098号
[50]	萨哈，I。；Ramathitima，R。；库马尔，V。；帕帕斯，G.J。；Seshia，S.A.，《基于安全LTL规范的多机器人系统运动原语的自动合成》（IEEE/RSJ智能机器人和系统国际会议论文集（2014）），1525-1532
[51]	Schilders，W.，《模型降阶导论》（Schilder，W.H.A.；van der Vorst，H.A.；Rommes，J.，《模型降阶：理论、研究方面和应用》（2008），Springer），第3-32页·Zbl 1154.93322号
[52]	Shreve，S.E.，《随机最优控制：离散时间案例》（1978），学术出版社·Zbl 0471.93002号
[53]	Soudjani，S.，《随机系统自动验证和综合的形式化抽象》（2014），代尔夫特系统与控制中心，代尔夫大学，（博士论文）
[54]	Soudjani，S。；阿巴特，A。；Majumdar，R.，动态贝叶斯网络作为结构化随机过程的形式抽象，（第26届并发理论国际会议论文集，第42卷（2015）），169-183·Zbl 1374.68301号
[55]	Svoreňová，M。；Křetínskỳ，J。；Chmelík，M。；查特吉，K。；乔纳，I。；Belta，C.，随机线性系统的时间逻辑控制，使用概率博弈的抽象精化，非线性分析。混合动力系统，23，230-253（2017）·Zbl 1351.93138号
[56]	特卡切夫，I。；Mereacre，A。；Katoen，J.-P。；Abate，A.，非自治随机混合系统基于定量自动机的控制器综合，（第16届混合系统国际会议论文集：计算与控制（2013）），293-302·Zbl 1362.68189号
[57]	Toh，K.-C。；托德，M.J。；TüTüncü，R.H.，SDPT3-半定规划的MATLAB软件包，1.3版，优化方法与软件，11，1-4，545-581（1999）·Zbl 0997.90060号
[58]	van Huijgevoort，公元前。；Haesaert，S.，线性随机系统作为集理论控制问题的相似性量化（2020），arXiv:2007.09052
[59]	Wiltsche，C.，随机博弈的假设保证策略综合（2015），牛津大学（博士论文）
[60]	Zamani，M。；Arcak，M.，《控制系统网络的组成抽象：耗散性方法》，IEEE网络系统控制汇刊，5，3，1003-1015（2018）·Zbl 1515.93137号
[61]	钟，B。；拉瓦伊，A。；Zamani，M。；Caccamo，M.，《随机系统基于自动机的控制器综合：基于近似概率关系的游戏框架》（2022），arXiv:2104.11803v3
[62]	朱，Q。；Basar，T.，《网络物理控制系统鲁棒性、安全性和弹性的博弈论方法：最佳跨层弹性控制系统的博弈原理》，IEEE control systems Magazine，35，1，46-65（2015）·Zbl 1476.93098号

此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配，可能包含数据转换错误。在某些情况下，zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献，而不要求完整或完全匹配。

任何	在任何地方
一个	内部文档标识符
澳大利亚	作者、编辑
人工智能	内部作者标识符
钛	标题
洛杉矶	语言
所以	来源
ab公司	回顾，摘要
第页	出版年份
车辆	评审员
复写的副本	MSC代码
美国犹他州	关键字
日期	文档类型(j个：期刊文章；b条：book；一：书籍文章）

一&b条	逻辑和
一\|b条	逻辑或
！ab公司	逻辑不
美国广播公司*	右通配符
"ab c公司"	短语
(ab c公司)	圆括号

示例

字段

操作员

随机系统基于自动机的控制器综合：基于近似概率关系的博弈框架。（英语） Zbl 1505.93257号

MSC公司：

关键词：

软件：

参考文献：

示例

字段

操作员

随机系统基于自动机的控制器综合：基于近似概率关系的博弈框架。 （英语） Zbl 1505.93257号

MSC公司：

关键词：

软件：

参考文献：

随机系统基于自动机的控制器综合：基于近似概率关系的博弈框架。（英语） Zbl 1505.93257号