×

基于乐观值的不确定非因果系统零和博弈的鞍点解。 (英语) Zbl 07799977号

摘要:不确定非因果系统(UNSS)是不确定奇异系统,被认为是有规律的。本研究使用乐观值准则研究了UNCS的两层零和博弈(TPZSG)。第一步是介绍一种将考虑线性控制项的线性不确定非因果系统(UNCS)转换为包含两类不确定差分方程的子系统的方法。推导了求解线性UNSS下TPZSG的递推方程。利用递推方程,我们给出了求解线性UNCS下TPZSG的算法,并通过一个数值例子说明了如何应用该算法求解此类博弈的鞍点解和均衡值。为了扩展这些结果,我们提供了求解非线性UNCS下TPZSG的相应方程。此外,通过求解方程组,给出了考虑二次控制项的非线性UNCS的鞍点解和TPZSG的平衡值。

MSC公司:

49升20 最优控制与微分对策中的动态规划
91A05型 2人游戏
PDF格式BibTeX公司 XML格式引用
全文: DOI程序

参考文献:

[1] V.P.Ayala Jouan,李群上的奇异线性系统;等效,系统和控制信函,120,1-8(2018)·Zbl 1408.93047号 ·doi:10.1016/j.sysconle.2018.07.010
[2] P.H.S.P.Bajari Hong Ryan,完全信息离散博弈的识别和估计,《计量经济学》,781529-1568(2010)·兹比尔1202.91263 ·doi:10.3982/ECTA5434
[3] P.C.M.Cardaliaguet Jimenez Quincampoix,不完全信息微分博弈中的纯策略和随机策略,动力学与博弈杂志,1363-375(2014)·Zbl 1304.49075号 ·doi:10.3934/jdg.2014.1.363
[4] X.Y.Chen Zhu,多时滞不确定随机广义系统的最优控制,混沌、孤子和分形,152111371(2021)·Zbl 1496.49015号 ·doi:10.1016/j.chaos.2021.111371
[5] X.Y.B.Chen Zhu Li,不确定随机连续系统的最优控制,最优化,721385-1428(2023)·Zbl 1521.49021号 ·doi:10.1080/02331934.2021.2017429
[6] X.Y.J.H.Chen Zhu Park,不确定随机奇异动力系统的两人博弈,IET控制理论与应用,17,542-558(2023)·doi:10.1049/cth2.12400
[7] X.Y.J.Chen Zhu Shen,最优环境污染控制的投入产出动态模型,应用数学模型,83,301-321(2020)·Zbl 1481.91137号 ·doi:10.1016/j.apm.2020.029
[8] W.F.S.Y.Y.陈高旭李初,基于动态输出反馈控制的不确定奇异马尔可夫跳跃系统的鲁棒镇定,系统与控制快报,171,105433(2023)·Zbl 1504.93314号 ·doi:10.1016/j.sysconle.2022.105433
[9] Z.W.N.B.F.L.陈雪丽-刘易斯,基于Z函数的非线性系统有限时域零和博弈的新型完全无模型强化学习方法,非线性动力学,107,2563-2582(2022)
[10] D.Cobb,奇异系统的可控性、可观测性和对偶性,IEEE自动控制汇刊,291076-1082(1984)·doi:10.1109/TAC.1984.1103451
[11] D.M.S.Dahmani Cheref Larabi,分割皮肤区域的零和博弈模型,图像和视觉计算,99,103925(2020)
[12] 戴立群,奇异控制系统1989年,柏林,施普林格-弗拉格出版社·Zbl 0669.93034号
[13] L.Z.Y.Deng You Chen,带跳跃的多维不确定最优控制的乐观值模型,欧洲控制杂志,39,1-7(2018)·Zbl 1380.93286号 ·doi:10.1016/j.ejcon.2017.09.002
[14] Y.F.F.Ding Weng耿,不确定半状态系统的状态能量约束控制器设计及其在机械系统控制中的应用,机械工程师学会会刊,C部分:机械工程科学杂志,2334850-4862(2019)
[15] N.S.El-Karoui Hamadène,BSDEs与风险敏感控制,随机泛函微分方程的零和非零和博弈问题,随机过程及其应用,107,145-169(2003)·Zbl 1075.60534号 ·doi:10.1016/S0304-4149(03)00059-0
[16] A.Emadi,使用广义状态空间平均法对多逆变器直流电力电子系统进行建模和分析,IEEE工业电子学报,51,661-668(2004)
[17] 马振生,一类多时滞离散广义系统的奇异线性二次型最优控制问题,国际系统科学杂志,34293-301(2003)·Zbl 1058.93037号 ·doi:10.1080/0020772031000158528
[18] D.H.A.El.M.Kharrat Gassara Hajjaji Chaabane,具有传感器和执行器故障的Takagi Sugeno广义非线性系统的自适应观测器和容错控制,国际控制、自动化和系统杂志,16772-982(2018)
[19] M.A.H.D.Khosravi Taghirad,弹性索并联机器人的动力学建模和控制:奇异摄动法,IEEE机器人学报,30694-704(2014)
[20] D.A.A.M.C.J.Lee Keimer Bayen Tomlin,状态约束最优控制和零和博弈问题的Hamilton-Jacobi公式,第59届IEEE决策与控制会议,78,1078-1085(2020)
[21] D.Lee和C.J.Tomlin,两类状态约束零和对策的Hamilton-Jacobi方程,预印本,2021,arXiv:2106.15006。
[22] F.L.Lewis,《二维隐式系统综述》,软计算,28345-354(1992)·Zbl 0766.93035号 ·doi:10.1016/0005-1098(92)90120-5
[23] B.Y.K.L.Li Shu Sun Teo,不同风险偏好下不确定投资组合优化问题的乐观值变分模型,软计算,253993-4001(2021)·Zbl 1498.91394号
[24] B.R.T.Y.李章进书,不确定微分对策的参数近似最优控制及其在反恐中的应用,混沌、孤子和分形,146,110940(2021)·Zbl 1498.49066号 ·doi:10.1016/j.chaos.2021.110940
[25] X.Q.Y.F.E.Li Song Liu Alsaadi,考虑跳跃不确定动力系统零和微分对策的Hurwicz模型的鞍点平衡,国际系统科学杂志,54,357-370(2023)·Zbl 1520.91018号 ·doi:10.1080/00207721.2022.2122903
[26] X.Q.Z.Y.F.E.Li Song Zhao Liu Alsaadi,考虑多因素和不确定性奇异系统的Hurwicz模型的最优控制和零和微分对策,国际系统科学杂志,531416-1435(2022)·Zbl 1492.93104号 ·doi:10.1080/00207721.2021.2005175
[27] B.刘,不确定性理论第二版,施普林格-弗拉格出版社,柏林,2004年·Zbl 1072.28012号
[28] E.M.Martirosyan Cao,识别线性二次零和微分对策的反向强化学习,《系统控制快报》,172105438(2023)·Zbl 1519.91040号 ·doi:10.1016/j.sysconle.2022.105438
[29] J.V.Neumann,Zur theorie der gesellschaftsspiele,《数学年鉴》,100295-320(1928)·doi:10.1007/BF01448847
[30] J.V.O.Neumann-Morgenstern,《博弈论与经济行为》(1994)
[31] S.Pradhan,跳跃扩散的风险敏感零和随机微分对策,系统控制快报。,157, 105033 (2021) ·Zbl 1480.91029号 ·doi:10.1016/j.sysconle.201.105033
[32] W.G.H.R.Qi Zong Karim,非线性不确定奇异半马尔可夫跳跃系统的基于观测器的自适应SMC及其在直流电机中的应用,IEEE电路与系统汇刊I:常规论文,652951-2960(2018)·Zbl 1468.93159号 ·doi:10.1109/TCSI.2018.2797257
[33] H.H.Rosenbrock,线性动力系统的结构特性,国际控制杂志,20191-202(1974)·Zbl 0285.93019号 ·doi:10.1080/00207177408932729
[34] Y.Shu,离散广义非因果系统的最优控制,亚洲控制杂志,231885-1899(2021)·doi:10.1002/asjc.2343
[35] 朱永川.孙定珠,不确定环境下的鞍点平衡,应用科学中的数学方法,412063-2073(2018)·Zbl 1394.49036号 ·数字对象标识码:10.1002/mma.4733
[36] 李彦斌,不确定切换系统在乐观值准则下的稳定性和吸引性分析,SIAM控制与优化杂志,60,2420-2439(2022)·Zbl 1503.93040号 ·数字对象标识代码:10.1137/21M1450343
[37] 李彦斌,离散随机广义系统的线性二次最优控制,工业与管理优化杂志,18,1583-1602(2022)·Zbl 1499.49092号 ·doi:10.3934/jimo.2021034
[38] 李彦斌,离散随机非因果系统基于期望值的最优控制,《优化通讯》,第16期,1847-1879(2022)·Zbl 1493.49029号 ·doi:10.1007/s11590-021-01807-z
[39] 孙燕珠,不确定离散系统的鞍点平衡模型,软计算,251099-1112(2021)·Zbl 1491.93073号
[40] Y.Y.Shu Zhu,不确定线性奇异系统基于乐观值的最优控制及其在动态投入产出模型中的应用,ISA Transactions,71,235-251(2017)
[41] Y.Y.Sun Zhu,不确定鞍点问题的Bang-Bang性质,Mathematische Annalen,28,605-613(2017)
[42] Y.Y.Shu Zhu,不确定连续广义系统的稳定性和最优控制,欧洲控制杂志,34,16-23(2017)·Zbl 1358.93154号 ·doi:10.1016/j.ejcon.2016.12.003
[43] S.Xu和J.Lam,奇异系统的鲁棒控制与滤波施普林格-弗拉格出版社,柏林,2006年·Zbl 1114.93005号
[44] S.P.R.J.Xu Van Dooren Stefan Lam,具有状态时滞和参数不确定性的广义系统的鲁棒稳定性和镇定,IEEE自动控制汇刊,471122-1128(2002)·Zbl 1364.93723号 ·doi:10.1109/TAC.2002.800651
[45] X.J.Yang Gao,线性二次不确定微分对策及其在资源提取问题中的应用,IEEE模糊系统汇刊,24819-826(2016)
[46] Q.Zhang和S.Xing,随机奇异系统的稳定性分析和最优控制,优化信函, 8 (2014), 1905-1920. ·兹比尔1301.93169
[47] Y.X.Zhang Mu,离散马尔可夫广义系统的事件触发输出量化控制,Automatica,135109992(2022)·Zbl 1480.93275号 ·doi:10.1016/j.automatica.2021.109992
[48] J.Y.Z.Zhao Lv Zhao,CT双层零和博弈的基于自适应学习的输出反馈最优控制,IEEE电路与系统汇刊II:快讯,69,1437-1441(2021)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。