文件Zbl 1285.49027-zbMATH Open

离散时间线性二次两层广义对策的反馈策略。（英语） Zbl 1285.49027号

线性代数应用。 440, 1-23 (2014).

摘要：本文研究离散时间线性二次广义双层对策。考虑了具有反馈信息结构的Nash和Stackelberg策略的两种框架。其目的是为任何初始状态提供充分的条件，确保三轨迹的存在和唯一性，将两个参与者的状态和控制聚集在一起，从而达到平衡。提供的结果主要基于离散时间矩阵块公式。所提供的算法包含一个由动态规划发布的迭代向后时间过程。数值例子说明了这种方法，并且对于这两种策略都恢复了显式系统的特殊情况。

引用于4文件

MSC公司：

49号70	差异化游戏和控制
49甲10	线性二次型最优控制问题
91A05型	2人游戏
91A23型	微分对策（博弈论方面）
91A50型	离散时间游戏
49升20	最优控制与微分对策中的动态规划
2010年第65季度	差分方程的数值方法

关键词：

描述符游戏;博弈论;反馈信息结构;纳什策略;斯塔克伯格战略;矩阵块公式

PDF格式 BibTeX公司 XML格式引用

全文：内政部

参考文献：

[1]	Neumann，J.V。；Morgenstern，O.，《博弈论与经济行为》（1944），普林斯顿大学出版社·Zbl 0063.05930号
[2]	巴沙尔，T。；Olsder，G.J.，动态非合作博弈论（1995），SIAM·Zbl 0828.90142号
[3]	斯塔尔，A.W。；Ho，Y.C.，非零和微分对策，J.Optim。理论应用。，3, 3, 184-206 (1969) ·Zbl 0169.12301号
[4]	斯塔尔，A.W。；Ho，Y.C.，非零和微分对策的进一步性质，J.Optim。理论应用。，3, 4, 207-219 (1969) ·Zbl 0169.12303号
[5]	Nash，J.，（N）人博弈中的平衡点，Proc。国家。阿卡德。科学。美国，36，48-49（1950）·兹伯利0036.01104
[6]	Nash，J.，《非合作游戏》，《数学年鉴》。，54, 286-296 (1951) ·Zbl 0045.08202号
[7]	Ho，Y.C.，《综述论文：微分对策、动态优化和广义控制理论》，J.Optim。理论应用。，6, 3, 179-209 (1970) ·Zbl 0188.47702号
[8]	von Stackelberg，H.，Marktform und Gleichgewicht（1934），施普林格·Zbl 1405.91003号
[9]	Bagchi，A.，《经济模型中的Stackelberg微分博弈》，《控制与信息讲义》。科学。（1984），斯普林格·弗拉格·Zbl 0543.90095号
[10]	Chen，C.I。；Cruz，J.B.，《带有偏差信息模式的两人游戏的Stackelberg解》，IEEE Trans。自动化。控制，AC-17，6，791-797（1972）·兹比尔0262.90095
[11]	西蒙，M。；Cruz，J.B.，《关于非零和博弈中的Stackelberg策略》，J.Optim。理论应用。，11, 5, 533-555 (1973) ·Zbl 0243.90056号
[12]	西蒙，M。；Cruz，J.B.，非零和博弈中Stackelberg策略的其他方面，J.Optim。理论应用。，11, 6, 613-626 (1973) ·Zbl 0245.90039号
[13]	Pindyck，R.，分散控制和冲突目标下的最优经济稳定政策，IEEE Trans。自动化。控制，22517-530（1977）·兹伯利0381.90027
[14]	Abou-Kandil，H。；Bertrand，P.，一类线性二次Nash对策的解析解，国际。J.Control，43，997-1002（1986）·Zbl 0593.90092号
[15]	Engwerda，J.C.，LQ动态优化和差分博弈（2005），Wiley
[16]	Tolwinski，B.，动态游戏的Stackelberg解决方案，IEEE Trans。自动化。控制，AC-28，1，85-93（1983）·Zbl 0506.90096号
[17]	Abou-Kandil，H。；Bertrand，P.，开环Stackelberg游戏的分析解决方案，IEEE Trans。自动化。控制，AC-30，12，1222-1224（1985）·Zbl 0589.90097号
[18]	Jungers，M.，《关于时间偏好率的Stackelberg线性二次博弈》，IEEE Trans。自动化。控制，53，2，621-625（2008）·Zbl 1367.91031号
[19]	Freiling，G.，非对称Riccati方程综述，线性代数应用。，351-352, 243-270 (2002) ·Zbl 1008.34004号
[20]	Abou-Kandil，H。；Freiling，G。；伊奥内斯库，V。；Jank，G.，《控制与系统理论中的矩阵Riccati方程》（2003），Birkhäuser·Zbl 1027.93001号
[21]	Jungers，M。；奥拉，C。；Abou-Kandil，H。；ötefan，R.，解非对称代数Riccati方程的通用矩阵束技术，SIAM J.matrix Ana。申请。，31, 3, 1257-1278 (2009) ·Zbl 1213.15011号
[22]	Freiling，G。；Jank，G。；Abou-Kandil，H.，广义Riccati差分和微分方程，线性代数应用。，241-243, 291-303 (1996) ·Zbl 0856.34003号
[23]	Papavassilopulos，G.P。；Cruz，J.B.，非经典控制问题和Stackelberg游戏，IEEE Trans。自动化。控制，24，2，155-166（1979）·Zbl 0406.49008号
[24]	Medanic，J.，线性二次问题中的闭环Stackelberg策略，IEEE Trans。自动化。控制，23，4，632-637（1978）·Zbl 0381.49006号
[25]	巴沙尔，T。；Selbuz，H.，闭环Stackelberg策略及其在多级系统最优控制中的应用，IEEE Trans。自动化。控制，AC-24166-179（1979）·Zbl 0405.49020号
[26]	Jungers，M。；Trélat，E。；Abou-Kandil，H.，Min-max和Min-Min Stackelberg闭环信息结构策略，J.Dyn。控制系统。，17, 3, 387-425 (2011) ·Zbl 1228.91019号
[27]	Dockner，E。；约根森，S。；Long，N.V。；Sorger，G.，《经济与管理科学中的差异博弈》（2000），剑桥大学出版社·Zbl 0996.91001号
[28]	Bernhard，P.，关于奇异隐式线性动力系统，SIAM J.控制优化。，20, 5, 612-633 (1982) ·兹伯利0491.93004
[29]	Dai，L.，奇异控制系统，控制与信息讲义。科学。（1989），斯普林格·弗拉格·Zbl 0669.93034号
[30]	Lewis，F.L.，线性奇异系统综述，电路系统信号处理。，5, 1, 3-36 (1986) ·兹比尔0613.93029
[31]	Yip，E.L.公司。；Sincovec，R.F.，连续广义系统的可解性、可控性和可观测性，IEEE Trans。自动化。控制，26，3，702-707（1981）·Zbl 0482.93013号
[32]	Bunse-Gerstner，A。；梅赫曼，V。；Nichols，N.K.，通过输出反馈正则化广义系统，IEEE Trans。自动化。控制，39，8，1742-1748（1994）·Zbl 0800.93544号
[33]	拜尔斯，R。；Geerts，T。；Mehrmann，V.，无穷远无可控性的广义系统，SIAM J.Control Optim。，35, 2, 462-479 (1997) ·Zbl 0871.93021号
[34]	Bunse-Gerstner，A。；拜尔斯，R。；梅赫曼，V。；Nichols，N.K.，正则化广义系统的反馈设计，线性代数应用。，299, 1-3, 119-151 (1999) ·Zbl 0944.65082号
[35]	Kunkel，P。；梅赫曼，V。；Rath，W.，广义形式控制问题的分析和数值解，数学。控制信号系统，14，1，29-61（2001）·Zbl 1066.93019号
[36]	Jonckheere，E.，广义问题的变分法，IEEE Trans。自动化。控制，33，5，491-495（1988）·Zbl 0644.49019号
[37]	Cobb，D.，广义变量系统和最优状态调节，IEEE Trans。自动化。控制，28，5，601-611（1983）·Zbl 0522.93036号
[38]	本德·D·J。；Laub，A.J.，广义系统的线性二次型最优调节器，IEEE Trans。自动化。控制，32，8，672-688（1987）·Zbl 0624.93030号
[39]	本德·D·J。；Laub，A.J.，广义系统的线性二次型最优调节器：离散时间情形，Automatica，23，1，71-85（1987）·Zbl 0612.93045号
[40]	曼塔斯，G.P。；Krikelis，N.J.，离散广义系统的线性二次最优控制，J.Optim。理论应用。，61, 2, 221-245 (1989) ·Zbl 0644.93034号
[41]	Kunkel，P。；Mehrmann，V.，变系数线性广义系统的线性二次型最优控制问题，数学。控制信号系统，10247-264（1997）·Zbl 0894.49020号
[42]	（Biegler，L.T.；Campbell，S.；Mehrmann，V.，《微分代数约束下的控制与优化》，《高级设计控制》，第23卷（2012），SIAM:SIAM Philadelphia）·Zbl 1317.65143号
[43]	甘特马赫，F.，矩阵理论，卷。《I and II》（1959），切尔西：切尔西纽约·Zbl 0085.01001号
[44]	奥拉，C。；Andrei，R.，广义离散时间代数Riccati方程的数值解，系统控制快报。，62, 2, 201-208 (2013) ·Zbl 1259.93055号
[45]	伯恩哈德，P。；格林，J。；Wang，X.M.，《系统隐含离散最优二次方司令部》，APII，24，1，17-36（1990）·Zbl 0687.49012号
[46]	Darouach，M。；Zasadzinski，M。；Bassong-Onana，A.，三块广义Riccati方程与标准Riccati方程式之间的联系，IEEE Trans。自动化。控制，39,1755-1758（1994）·Zbl 0925.93905号
[47]	Xu，H。；Mizukami，K.，广义状态空间系统的线性二次零和微分对策，IEEE Trans。自动化。控制，39，1，143-147（1994）·Zbl 0816.90148号
[48]	Xu，H。；Mukaidani，H.，离散广义系统的线性二次动态博弈，（第39届IEEE决策与控制会议论文集（2000）），3696-3701
[49]	Xu，H。；Mizukami，K.，描述博弈的两人双准则决策问题，J.Optim。理论应用。，78, 1, 163-173 (1993) ·Zbl 0796.90081号
[50]	Engwerda，J.C。；Salmah，线性二次广义微分对策的反馈Nash均衡，Automatica，48，625-631（2012）·Zbl 1238.49056号
[51]	Xu，H。；Mizukami，K.，广义系统线性反馈闭环Stackelberg策略的新充分条件，IEEE Trans。自动化。对照，391097-1102（1994）·兹伯利0813.93039
[52]	Xu，H。；Mizukami，K.，《多层次广义系统的线性反馈闭环Stackelberg策略》，J.Optim。理论应用。，88, 1, 209-231 (1996) ·Zbl 0842.90147号
[53]	拉索，S。；Tembine，H.，《无线网络的博弈论和学习》（2011），学术出版社
[54]	冯·斯塔克伯格，H.，《市场经济理论》（1952），牛津大学出版社
[55]	Leitmann，G.，《关于广义Stackelberg策略》，J.Optim。理论应用。，26, 4, 1978 (1978) ·Zbl 0372.90137号
[56]	巴沙尔，T。；Olsder，G.J.，分层控制问题中的团队最优闭环Stackelberg策略，Automatica，16409-414（1980）·Zbl 0444.93004号
[57]	卡尔森·D·H·舒尔补语是什么？，线性代数应用。，74, 257-275 (1986) ·Zbl 0595.15006号
[58]	卢，T.-T。；Shiou，S.-H.，（2乘2）块矩阵的逆，计算。数学。申请。，43, 119-129 (2002) ·Zbl 1001.15002号
[59]	Engwerda，J.C.，《关于LQ博弈中的开环纳什均衡》，J.Econom。动态。控制，22729-762（1998）·Zbl 0905.90191号
[60]	Jungers，M。；Abou-Kandil，H.，离散时间游戏闭环无记忆纳什策略的矩阵块公式，（IFAC优化控制应用研讨会（CAO）。IFAC优化控制应用研讨会（CAO），芬兰阿戈拉（2009年）
[61]	Jungers，M.，离散时间游戏闭环无记忆Stackelberg策略的矩阵块公式，（第47届IEEE决策与控制会议（CDC））。第47届IEEE决策与控制会议（CDC），墨西哥坎昆（2008），4454-4459
[62]	Lee，E。；Markus，L.，《最优控制理论基础》（1967），威利出版社：威利纽约·Zbl 0159.13201号
[63]	Laub，A.J。；Meyer，K.R.，哈密顿矩阵和辛矩阵的标准形，天体力学。，9, 213-238 (1974) ·Zbl 0316.15005号

此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配，可能包含数据转换错误。在某些情况下，zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献，而不要求完整或完全匹配。

任何	在任何地方
一个	内部文档标识符
澳大利亚	作者、编辑
人工智能	内部作者标识符
钛	标题
洛杉矶	语言
所以	来源
ab公司	回顾，摘要
第页	出版年份
车辆	评审员
复写的副本	MSC代码
美国犹他州	关键字
数据传输时间	文档类型(j个：期刊文章；b条：book；一：图书文章）

一&b条	逻辑和
一\|b条	逻辑或
!ab公司	逻辑不
美国广播公司*	右通配符
"ab c公司"	短语
(ab c公司)	圆括号

示例

领域

操作员

离散时间线性二次两层广义对策的反馈策略。（英语） Zbl 1285.49027号

MSC公司：

关键词：

参考文献：

示例

领域

操作员

离散时间线性二次两层广义对策的反馈策略。 （英语） Zbl 1285.49027号

MSC公司：

关键词：

参考文献：

离散时间线性二次两层广义对策的反馈策略。（英语） Zbl 1285.49027号