×

离散时间线性二次两层广义对策的反馈策略。 (英语) Zbl 1285.49027号

摘要:本文研究离散时间线性二次广义双层对策。考虑了具有反馈信息结构的Nash和Stackelberg策略的两种框架。其目的是为任何初始状态提供充分的条件,确保三轨迹的存在和唯一性,将两个参与者的状态和控制聚集在一起,从而达到平衡。提供的结果主要基于离散时间矩阵块公式。所提供的算法包含一个由动态规划发布的迭代向后时间过程。数值例子说明了这种方法,并且对于这两种策略都恢复了显式系统的特殊情况。

MSC公司:

49号70 差异化游戏和控制
49甲10 线性二次型最优控制问题
91A05型 2人游戏
91A23型 微分对策(博弈论方面)
91A50型 离散时间游戏
49升20 最优控制与微分对策中的动态规划
2010年第65季度 差分方程的数值方法
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Neumann,J.V。;Morgenstern,O.,《博弈论与经济行为》(1944),普林斯顿大学出版社·Zbl 0063.05930号
[2] 巴沙尔,T。;Olsder,G.J.,动态非合作博弈论(1995),SIAM·Zbl 0828.90142号
[3] 斯塔尔,A.W。;Ho,Y.C.,非零和微分对策,J.Optim。理论应用。,3, 3, 184-206 (1969) ·Zbl 0169.12301号
[4] 斯塔尔,A.W。;Ho,Y.C.,非零和微分对策的进一步性质,J.Optim。理论应用。,3, 4, 207-219 (1969) ·Zbl 0169.12303号
[5] Nash,J.,(N)人博弈中的平衡点,Proc。国家。阿卡德。科学。美国,36,48-49(1950)·兹伯利0036.01104
[6] Nash,J.,《非合作游戏》,《数学年鉴》。,54, 286-296 (1951) ·Zbl 0045.08202号
[7] Ho,Y.C.,《综述论文:微分对策、动态优化和广义控制理论》,J.Optim。理论应用。,6, 3, 179-209 (1970) ·Zbl 0188.47702号
[8] von Stackelberg,H.,Marktform und Gleichgewicht(1934),施普林格·Zbl 1405.91003号
[9] Bagchi,A.,《经济模型中的Stackelberg微分博弈》,《控制与信息讲义》。科学。(1984),斯普林格·弗拉格·Zbl 0543.90095号
[10] Chen,C.I。;Cruz,J.B.,《带有偏差信息模式的两人游戏的Stackelberg解》,IEEE Trans。自动化。控制,AC-17,6,791-797(1972)·兹比尔0262.90095
[11] 西蒙,M。;Cruz,J.B.,《关于非零和博弈中的Stackelberg策略》,J.Optim。理论应用。,11, 5, 533-555 (1973) ·Zbl 0243.90056号
[12] 西蒙,M。;Cruz,J.B.,非零和博弈中Stackelberg策略的其他方面,J.Optim。理论应用。,11, 6, 613-626 (1973) ·Zbl 0245.90039号
[13] Pindyck,R.,分散控制和冲突目标下的最优经济稳定政策,IEEE Trans。自动化。控制,22517-530(1977)·兹伯利0381.90027
[14] Abou-Kandil,H。;Bertrand,P.,一类线性二次Nash对策的解析解,国际。J.Control,43,997-1002(1986)·Zbl 0593.90092号
[15] Engwerda,J.C.,LQ动态优化和差分博弈(2005),Wiley
[16] Tolwinski,B.,动态游戏的Stackelberg解决方案,IEEE Trans。自动化。控制,AC-28,1,85-93(1983)·Zbl 0506.90096号
[17] Abou-Kandil,H。;Bertrand,P.,开环Stackelberg游戏的分析解决方案,IEEE Trans。自动化。控制,AC-30,12,1222-1224(1985)·Zbl 0589.90097号
[18] Jungers,M.,《关于时间偏好率的Stackelberg线性二次博弈》,IEEE Trans。自动化。控制,53,2,621-625(2008)·Zbl 1367.91031号
[19] Freiling,G.,非对称Riccati方程综述,线性代数应用。,351-352, 243-270 (2002) ·Zbl 1008.34004号
[20] Abou-Kandil,H。;Freiling,G。;伊奥内斯库,V。;Jank,G.,《控制与系统理论中的矩阵Riccati方程》(2003),Birkhäuser·Zbl 1027.93001号
[21] Jungers,M。;奥拉,C。;Abou-Kandil,H。;ötefan,R.,解非对称代数Riccati方程的通用矩阵束技术,SIAM J.matrix Ana。申请。,31, 3, 1257-1278 (2009) ·Zbl 1213.15011号
[22] Freiling,G。;Jank,G。;Abou-Kandil,H.,广义Riccati差分和微分方程,线性代数应用。,241-243, 291-303 (1996) ·Zbl 0856.34003号
[23] Papavassilopulos,G.P。;Cruz,J.B.,非经典控制问题和Stackelberg游戏,IEEE Trans。自动化。控制,24,2,155-166(1979)·Zbl 0406.49008号
[24] Medanic,J.,线性二次问题中的闭环Stackelberg策略,IEEE Trans。自动化。控制,23,4,632-637(1978)·Zbl 0381.49006号
[25] 巴沙尔,T。;Selbuz,H.,闭环Stackelberg策略及其在多级系统最优控制中的应用,IEEE Trans。自动化。控制,AC-24166-179(1979)·Zbl 0405.49020号
[26] Jungers,M。;Trélat,E。;Abou-Kandil,H.,Min-max和Min-Min Stackelberg闭环信息结构策略,J.Dyn。控制系统。,17, 3, 387-425 (2011) ·Zbl 1228.91019号
[27] Dockner,E。;约根森,S。;Long,N.V。;Sorger,G.,《经济与管理科学中的差异博弈》(2000),剑桥大学出版社·Zbl 0996.91001号
[28] Bernhard,P.,关于奇异隐式线性动力系统,SIAM J.控制优化。,20, 5, 612-633 (1982) ·兹伯利0491.93004
[29] Dai,L.,奇异控制系统,控制与信息讲义。科学。(1989),斯普林格·弗拉格·Zbl 0669.93034号
[30] Lewis,F.L.,线性奇异系统综述,电路系统信号处理。,5, 1, 3-36 (1986) ·兹比尔0613.93029
[31] Yip,E.L.公司。;Sincovec,R.F.,连续广义系统的可解性、可控性和可观测性,IEEE Trans。自动化。控制,26,3,702-707(1981)·Zbl 0482.93013号
[32] Bunse-Gerstner,A。;梅赫曼,V。;Nichols,N.K.,通过输出反馈正则化广义系统,IEEE Trans。自动化。控制,39,8,1742-1748(1994)·Zbl 0800.93544号
[33] 拜尔斯,R。;Geerts,T。;Mehrmann,V.,无穷远无可控性的广义系统,SIAM J.Control Optim。,35, 2, 462-479 (1997) ·Zbl 0871.93021号
[34] Bunse-Gerstner,A。;拜尔斯,R。;梅赫曼,V。;Nichols,N.K.,正则化广义系统的反馈设计,线性代数应用。,299, 1-3, 119-151 (1999) ·Zbl 0944.65082号
[35] Kunkel,P。;梅赫曼,V。;Rath,W.,广义形式控制问题的分析和数值解,数学。控制信号系统,14,1,29-61(2001)·Zbl 1066.93019号
[36] Jonckheere,E.,广义问题的变分法,IEEE Trans。自动化。控制,33,5,491-495(1988)·Zbl 0644.49019号
[37] Cobb,D.,广义变量系统和最优状态调节,IEEE Trans。自动化。控制,28,5,601-611(1983)·Zbl 0522.93036号
[38] 本德·D·J。;Laub,A.J.,广义系统的线性二次型最优调节器,IEEE Trans。自动化。控制,32,8,672-688(1987)·Zbl 0624.93030号
[39] 本德·D·J。;Laub,A.J.,广义系统的线性二次型最优调节器:离散时间情形,Automatica,23,1,71-85(1987)·Zbl 0612.93045号
[40] 曼塔斯,G.P。;Krikelis,N.J.,离散广义系统的线性二次最优控制,J.Optim。理论应用。,61, 2, 221-245 (1989) ·Zbl 0644.93034号
[41] Kunkel,P。;Mehrmann,V.,变系数线性广义系统的线性二次型最优控制问题,数学。控制信号系统,10247-264(1997)·Zbl 0894.49020号
[42] (Biegler,L.T.;Campbell,S.;Mehrmann,V.,《微分代数约束下的控制与优化》,《高级设计控制》,第23卷(2012),SIAM:SIAM Philadelphia)·Zbl 1317.65143号
[43] 甘特马赫,F.,矩阵理论,卷。《I and II》(1959),切尔西:切尔西纽约·Zbl 0085.01001号
[44] 奥拉,C。;Andrei,R.,广义离散时间代数Riccati方程的数值解,系统控制快报。,62, 2, 201-208 (2013) ·Zbl 1259.93055号
[45] 伯恩哈德,P。;格林,J。;Wang,X.M.,《系统隐含离散最优二次方司令部》,APII,24,1,17-36(1990)·Zbl 0687.49012号
[46] Darouach,M。;Zasadzinski,M。;Bassong-Onana,A.,三块广义Riccati方程与标准Riccati方程式之间的联系,IEEE Trans。自动化。控制,39,1755-1758(1994)·Zbl 0925.93905号
[47] Xu,H。;Mizukami,K.,广义状态空间系统的线性二次零和微分对策,IEEE Trans。自动化。控制,39,1,143-147(1994)·Zbl 0816.90148号
[48] Xu,H。;Mukaidani,H.,离散广义系统的线性二次动态博弈,(第39届IEEE决策与控制会议论文集(2000)),3696-3701
[49] Xu,H。;Mizukami,K.,描述博弈的两人双准则决策问题,J.Optim。理论应用。,78, 1, 163-173 (1993) ·Zbl 0796.90081号
[50] Engwerda,J.C。;Salmah,线性二次广义微分对策的反馈Nash均衡,Automatica,48,625-631(2012)·Zbl 1238.49056号
[51] Xu,H。;Mizukami,K.,广义系统线性反馈闭环Stackelberg策略的新充分条件,IEEE Trans。自动化。对照,391097-1102(1994)·兹伯利0813.93039
[52] Xu,H。;Mizukami,K.,《多层次广义系统的线性反馈闭环Stackelberg策略》,J.Optim。理论应用。,88, 1, 209-231 (1996) ·Zbl 0842.90147号
[53] 拉索,S。;Tembine,H.,《无线网络的博弈论和学习》(2011),学术出版社
[54] 冯·斯塔克伯格,H.,《市场经济理论》(1952),牛津大学出版社
[55] Leitmann,G.,《关于广义Stackelberg策略》,J.Optim。理论应用。,26, 4, 1978 (1978) ·Zbl 0372.90137号
[56] 巴沙尔,T。;Olsder,G.J.,分层控制问题中的团队最优闭环Stackelberg策略,Automatica,16409-414(1980)·Zbl 0444.93004号
[57] 卡尔森·D·H·舒尔补语是什么?,线性代数应用。,74, 257-275 (1986) ·Zbl 0595.15006号
[58] 卢,T.-T。;Shiou,S.-H.,(2乘2)块矩阵的逆,计算。数学。申请。,43, 119-129 (2002) ·Zbl 1001.15002号
[59] Engwerda,J.C.,《关于LQ博弈中的开环纳什均衡》,J.Econom。动态。控制,22729-762(1998)·Zbl 0905.90191号
[60] Jungers,M。;Abou-Kandil,H.,离散时间游戏闭环无记忆纳什策略的矩阵块公式,(IFAC优化控制应用研讨会(CAO)。IFAC优化控制应用研讨会(CAO),芬兰阿戈拉(2009年)
[61] Jungers,M.,离散时间游戏闭环无记忆Stackelberg策略的矩阵块公式,(第47届IEEE决策与控制会议(CDC))。第47届IEEE决策与控制会议(CDC),墨西哥坎昆(2008),4454-4459
[62] Lee,E。;Markus,L.,《最优控制理论基础》(1967),威利出版社:威利纽约·Zbl 0159.13201号
[63] Laub,A.J。;Meyer,K.R.,哈密顿矩阵和辛矩阵的标准形,天体力学。,9, 213-238 (1974) ·Zbl 0316.15005号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。