×

基于状态依赖Riccati方程的多项式微分对策的开放纳什均衡。 (英语) 兹比尔1372.49048

摘要:本文研究了有限时间和无限时间时域非零和多项式微分对策。在这两种情况下,我们研究了所谓的状态相关Riccati方程,以找到一组策略,保证这类特殊非线性博弈的开环Nash均衡。这种方法在平衡策略设计的简单性方面具有优势,并产生计算有效的求解算法。我们证明了这个解决方案将游戏引入一个(varepsilon)或准平衡,并为这个(varepsilon)量提供了一个上限。所提出的解决方案是作为一组(N)耦合多项式Riccati-like状态相关微分方程给出的,其中每个方程包含其多项式部分的(p)-线性形式张量表示。基于哈密顿方法,给出了无穷时间情形下状态相关代数方程解的一种算法,并给出了三阶多项式稳定解存在的条件。最后给出了一个数值例子来说明该方法的有效性。

MSC公司:

49号70 差异化游戏和控制
91A23型 微分对策(博弈论方面)
93A10号 一般系统
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Abou-Kandil,H。;Bertrand,P.,一类线性二次Nash对策的解析解,国际控制杂志,43997-1002(1986)·Zbl 0593.90092号
[2] Abou-Kandil,H。;Freiling,G。;伊奥内斯库,V。;Jank,G.,《控制与系统理论中的矩阵Riccati方程》(2003),Birkhäuser:Birkháuser Boston·兹比尔1027.93001
[3] Barabanov,A.,标准矩阵分解和多项式Riccati方程,欧洲控制杂志,3,47-67(1997)·Zbl 0880.93010号
[4] 巴拉巴诺夫,A。;奥尔特加,R。;Escobar,G.,关于线性时不变系统不可赋值平衡点周围的最终有界性,Automatica,44286-288(2008)·Zbl 1138.93397号
[5] 巴萨,T。;Olsder,G.,《动态非合作博弈论》(1999),SIAM:SIAM Philadelphia·Zbl 0946.91001号
[6] 盆地,M。;Calderon-Alvarez,D.,具有确定性扰动的不确定随机多项式系统的最优控制器,国际控制杂志,821435-1447(2009)·Zbl 1194.93214号
[7] 盆地,M.V。;佩雷斯,J。;Skliar,M.,多项式乘性噪声多项式系统状态的最优滤波,鲁棒与非线性控制国际期刊,16,287-298(2006)
[8] 布赖森,G.W。;Ho,Y.,应用最优控制(1975),《半球:半球华盛顿特区》
[10] 克鲁兹,J.B。;Xiaohuan,T.,解除管制电力市场的动态非合作博弈模型(2009),Nova Science Publishers,Inc。
[11] Dockner,E。;Jorgensen,S。;van Long,N。;Sorger,G.,《经济学和管理科学中的差异博弈》(2000),剑桥大学出版社:剑桥大学出版社·Zbl 0996.91001号
[12] Dong,H。;王,Z。;Gao,H.,具有重复标量非线性和多包丢失系统的基于观测器的控制,鲁棒和非线性控制国际期刊,20,1363-1378(2010)·Zbl 1206.93035号
[13] Engwerda,J.,《关于LQ博弈中的开环纳什均衡》,《经济动力学与控制杂志》,22,729-762(1998)·Zbl 0905.90191号
[14] Engwerda,J.,标量无限视界LQ博弈中的反馈Nash均衡,Automatica,36135-139(2000)·Zbl 0951.91014号
[15] Engwerda,J.C.,LQ动态优化和微分对策(2005),威利
[16] Engwerda,J.C。;van Aarle,B。;Plasmans,J.,《有限时域开环Nash LQ博弈:在EMU中的应用》,《运筹学年鉴》,88,251-273(1999)·Zbl 0932.91005号
[18] 高,H。;Shi,P。;Wang,J.,不确定时滞系统的参数相关鲁棒稳定性,计算与应用数学杂志,261363-1378(2007)
[19] Gu,D.,编队控制的差分博弈方法,IEEE控制系统技术汇刊,16,85-93(2008)
[20] Ho,Y.C.,《综述论文:微分对策、动态优化和广义控制理论》,《优化理论与应用杂志》,6,3,179-207(1970)·Zbl 0188.47702号
[21] 黄,M。;凯恩斯,体育。;Malhamé,R.P.,具有非均匀代理的大种群成本耦合LQG问题:个体-质量行为和分散-纳什均衡,IEEE自动控制汇刊,521560-1571(2007)·Zbl 1366.91016号
[22] Isaacs,R.,《微分游戏》(1965),John Wiley and Sons,Inc·Zbl 0152.38407号
[23] 希梅内兹,M。;Poznyak,A.,(varepsilon)-具有有界不确定扰动的LQ微分对策的均衡:标准策略和新策略的适应鲁棒性,国际控制杂志,79,7,786-797(2006)·Zbl 1330.91034号
[25] 约根森,S。;马丁·赫勒尔(Martin-Herh,G.)。;Zaccour,G.,《污染经济学和管理中的动态博弈》,环境建模与评估,第15433-467页(2010年)
[26] Jungers,M。;卡斯特兰,E.B。;De Pieri,E.R。;Abou-Kandil,H.,不确定线性系统的有界nash型控制,Automatica,441874-1879(2008)·Zbl 1149.93323号
[27] Kossiorisa,G。;Plexousakis,M。;木瓜目,A。;de Zeeuwe,A。;Maler,K.G.,污染控制中非线性微分博弈的反馈纳什均衡,经济动力学与控制杂志,32,1312-1331(2008)·Zbl 1181.91252号
[28] Ma,W.H。;Peng,H.,连续时间预览两层微分对策的求解,ASME动态系统、测量和控制杂志,121,2,326-330(1999)
[29] 马,L。;王,Z。;Bo,Y。;Guo,Z.,一类随机非线性随机时变系统混合H-2/H-无穷大控制的博弈论方法,《系统与控制快报》,60,1009-1015(2011)·Zbl 1231.93117号
[30] 马勒,K.G。;de Zeeuw,A.J.,《酸雨差异博弈》,《环境与资源经济学》,第12期,第167-184页(1998年)
[31] 马勒,K。;木瓜目,A。;de Zeeuw,A.,浅水湖泊经济学,环境与资源经济学,26,603-624(2003)
[32] Mracek,首席执行官。;Cloutier,J.R.,通过状态相关Riccati方程方法的非线性基准点问题的控制设计,国际鲁棒和非线性控制杂志,8401-433(1998)·Zbl 0908.93032号
[34] Nash,J.F.,N人游戏中的平衡点,美国国家科学院学报,36,48-49(1950)·Zbl 0036.01104号
[35] 努里安,M。;Caines,P.E.,(epsilon)-具有主要和次要代理的非线性随机动力系统的纳什平均场博弈理论,SIAM控制与优化杂志,51,3302-3331(2013)·Zbl 1275.93067号
[36] 罗德里格斯,L.,使用受控不变集的分段仿射系统的稳定性分析,《系统与控制快报》,53,157-169(2004)·Zbl 1157.93443号
[37] Rodrigues,L.,状态反馈下样本数据分段仿射系统的稳定性,Automatica,43,1249-1256(2007)·Zbl 1123.93066号
[38] Semsar-Kazerooni,E。;Khorasani,K.,多智能体团队合作:博弈论方法,Automatica,452205-2213(2009)·Zbl 1179.93025号
[39] Sorger,G.,双寡头广告竞争的离散时间动态博弈模型,最优控制应用和方法,16175-188(1995)·Zbl 0831.90081号
[40] 斯塔尔,A。;Ho,Y.,非零和微分对策的进一步性质,优化理论与应用杂志,3,4,207-219(1969)·Zbl 0169.12303号
[41] 斯塔尔,A。;Ho,Y.,非零和微分对策,优化理论与应用杂志,3,3,184-206(1969)·Zbl 0169.12301号
[42] 田中,K。;Yokoyama,K.,非合作N人博弈中的On(varepsilon)-平衡点,数学分析与应用杂志,160413-423(1991)·Zbl 0749.9003号
[43] 王,Z。;黄,B。;Unbehauen,H.,一类不确定非线性状态时滞系统的鲁棒可靠控制,Automatica,35955-963(1999)·Zbl 0945.93605号
[44] 张,H。;崔,L。;Luo,Y.,使用单网络ADP实现连续非线性系统非零和微分对策的近最优控制,IEEE控制论汇刊,43,206-216(2013)
[45] 张伟。;Feng,G.,含(x,u,v)相关噪声的非线性随机(H2/H)控制:无限水平情况,IEEE自动控制学报,531323-1328(2008)·Zbl 1367.93192号
[46] 张,H。;魏强。;Liu,D.,求解一类非线性零和微分对策的迭代自适应动态规划方法,Automatica,47207-214(2011)·Zbl 1231.91028号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。