×

LQ随机差分博弈的开放和闭环纳什均衡。 (英语) Zbl 07834865号

摘要:本文研究了线性二次型两层随机差分对策的开环和闭环纳什均衡存在的条件。结果表明,前者以前向随机差分方程(FBS)的可解性为特征,后者以一类耦合对称差分Riccati方程(REs)的可求解性为特征。与现有工作不同,本文研究了开环纳什均衡的闭环表示与闭环纳什均衡之间的关系。研究发现,对于一般情况,开环纳什均衡的闭环表示不同于闭环纳什均衡结果。然而,对于LQ零和随机差分对策,它们是一致的。

MSC公司:

91A15型 随机对策,随机微分对策
91A05型 2人游戏
39A50型 随机差分方程
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Nash,J.,《非合作游戏》。数学安。,286-295 (1951) ·Zbl 0045.08202号
[2] Jank,G。;Abou-Kandil,H.,线性二次离散时间博弈中开环Nash均衡的存在唯一性。IEEE传输。自动化。控制,2267-271(2003)·Zbl 1364.91035号
[3] Engwerda,J.C。;Salmah,指数一广义系统的开环线性二次微分对策。Automatica,585-592(2009)·Zbl 1158.49307号
[4] 雷迪,P.V。;Zaccur,G.,带约束的线性二次差分对策中的反馈纳什均衡。IEEE传输。自动化。控制,2590-604(2017)·Zbl 1364.49050号
[5] Engwerda,J.,标量LQ微分对策中反馈纳什均衡的性质。自动化,364-374(2016)·Zbl 1339.49032号
[6] Moon,J.,具有随机系数的仿射二次零和随机微分对策的反馈纳什均衡。IEEE控制系统。莱特。,4, 868-873 (2020)
[7] 吕秀英。;Xiong,J.,具有政权转换的非零和脉冲博弈。Automatica(2022年)·Zbl 1498.91037号
[8] 王国忠。;Xiao,H。;Xiong,J.,一类具有非对称信息的倒向随机微分方程的LQ非零和微分对策。自动化,346-352(2018)·Zbl 1420.91022号
[9] 黄,P.Y。;王国忠。;Wang,W.C。;Wang,Y.,具有部分信息和公共噪声的倒向随机微分方程的线性二次平均场博弈。申请。数学。计算。(2023) ·Zbl 1511.91015号
[10] 萨达纳,美国。;雷迪,P.V。;Zaccour,G.,脉冲控制微分对策中的反馈Nash均衡。IEEE传输。自动化。控制,84523-4538(2023)·兹伯利07746612
[11] Sun,J.R。;Yong,J.M.,线性二次随机微分对策:开环和闭环鞍点。SIAM J.控制优化。,2, 4082-4121 (2014) ·Zbl 1307.93466号
[12] 张瑞瑞。;郭,L.,基于博弈的控制系统中纳什均衡的可控性。IEEE传输。自动化。控制,104180-4187(2019)·Zbl 1482.49042号
[13] Sheng,L。;Zhang,W.H。;Gao,M.,乘性噪声随机Markov跳跃系统的Nash均衡策略与(H_2/H_infty)控制之间的关系。IEEE传输。自动化。控制,9391-396(2014)
[14] 黄,J.H。;Si,K.H。;Wu,Z.,线性二次混合Stackelberg-Nash随机微分对策与主要-次要代理人。申请。数学。最佳。,2445-2494(2021)·Zbl 1471.91022号
[15] Ni,Y.H。;李,X。;Zhang,J.F.,不确定平均域随机线性二次最优控制:从有限域到无限域。IEEE传输。自动化。控制,11,3269-3284(2016)·Zbl 1359.93540号
[16] Ni,Y.H。;Zhang,J.F。;Krstic,M.,时间不一致平均场随机LQ问题:开环时间一致控制。IEEE传输。自动化。控制,92771-2786(2018)·Zbl 1423.93420号
[17] Ivanov,I.G.,求解随机控制中产生的有理Riccati方程的迭代。计算。数学。申请。,977-988 (2007) ·Zbl 1127.65025号
[18] Ivanov,I.G.,求解一般Riccati方程的Stein(Lyapunov)迭代的性质。非线性分析。,1155-1166 (2007) ·Zbl 1122.65041号
[19] Zhang,W.H。;Lin,X.Y。;Chen,B.S.,Lasalle型定理及其在离散非线性随机系统无限时域最优控制中的应用。IEEE传输。自动化。控制,1250-261(2017)·Zbl 1359.93544号
[20] Dong,B.Z。;Nie,T.Y。;Wu,Z.,平均场型离散时间随机控制问题的最大值原理。Automatica(2022年)·兹比尔1498.93774
[21] Zhang,T.L。;邓福清。;Zhang,W.H.,非线性离散随机系统的鲁棒(H_)滤波。Automatica(2021年)·Zbl 1461.93514号
[22] Zhang,W.H。;黄Y.L。;Xie,W.H.,具有状态和扰动相关噪声的离散时间系统的无限时域随机(H_2/H_infty)控制。自动化,2306-2316(2008)·Zbl 1153.93030号
[23] 高,M.M。;Z.S.Zhao。;Sun,W.,具有Poisson跳跃的离散时间平均场系统的随机(H_2/H_infty)控制。J.Franklin Inst.,2933-2947(2021)·Zbl 1464.93084号
[24] 彭,C.C。;Zhang,W.H.,有限时域随机合作线性二次差分对策的多准则优化问题。科学。中国信息科学。(2022)
[25] Zhang,W.H。;Peng,C.C.,不确定平均场随机合作线性二次动态差分对策及其在网络安全模型中的应用。IEEE传输。赛博。,11, 11805-11818 (2022)
[26] Lin,Y.N.,无限时域离散时间平均场随机系统的反馈Stackelberg策略。J.Franklin Inst.,10,5222-5239(2019)·Zbl 1415.93293号
[27] Gao,W.H。;Lin,Y.N。;Zhang,W.H.,离散随机系统的激励反馈stackelberg策略。J.Franklin Inst.,3,2404-2420(2023)·Zbl 1507.93005号
[28] Sun,J.R。;Yong,J.M.,线性二次随机两人非零和微分对策:开环和闭环纳什均衡。随机过程。申请。,381-418 (2019) ·Zbl 1405.91025号
[29] 徐建杰。;张,H.S。;Xie,L.H.,一般线性正倒向随机差分方程及其应用。Automatica,40-50(2018)·Zbl 1406.93387号
[30] 艾特·拉米,M。;陈,X。;Zhou,X.Y.,含状态和控制相关噪声的离散时间不定LQ控制。J.全球优化。,245-265(2002年)·Zbl 1035.49024号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。