×

具有闭环信息结构的Min-max和Min-Min Stackelberg策略。 (英语) Zbl 1228.91019号

摘要:本文研究闭环信息结构下的min-max和min-min-Stackelberg策略。考虑一个领导者和一个追随者的两人差分单阶段游戏。我们首先推导了跟随器存在的必要条件,以刻画跟随器的最佳响应集,并在较弱的假设下,将其重构为一个等价且更方便的形式,以表示领导者优化问题的约束。然后,在标准严格勒让德条件下,在有限时域对策的非线性准则的一般情况下,我们导出了min-max和min-min-Stackelberg策略的领先者的最优性必要条件。这导致沿相关轨迹的最优控制的表达式。然后,利用焦点理论,证明了必要条件是充分的,并导致廉价的控制。强调了允许存在最优轨迹的初始状态集。对线性二次型情况进行了详细说明,以说明这些结果。

MSC公司:

91A65型 分级游戏(包括Stackelberg游戏)
49号70 差异化游戏和控制
49N90型 最优控制和微分对策的应用
91A05级 2人游戏
PDF格式BibTeX公司 XML格式引用
全文: 内政部 哈尔

参考文献:

[1] H.Abou-Kandil和P.Bertrand,开环Stackelberg博弈的分析解。IEEE传输。自动化。控制AC-30(1985),1222–1224·Zbl 0589.90097号 ·doi:10.1109/TAC.1985.1103886
[2] H.Abou Kandil、G.Freiling、V.Ionescu和G.Jank,控制和系统理论中的矩阵Riccati方程。Birkhäuser(2003年)·Zbl 1027.93001号
[3] A.Aboussoror和P.Loridan,有限维空间中的强-弱Stackelberg问题。Serdica数学。J.21(1995),151-170·兹比尔083490111
[4] _____,具有非均匀低层解的两层优化问题解的存在性。数学杂志。分析。申请。254 (2001), 348–357. ·Zbl 1054.90085号 ·doi:10.1006/jmaa.2000.7001
[5] A.Agrachev和J.-P.Gauthier,《关于卡诺-卡拉斯气味距离的亚分析性》。Ann.Inst.H.PoincaréAna。Non Linéaire 18(2001),359–382·Zbl 1001.93014号 ·doi:10.1016/S0294-1449(00)00064-0
[6] A.阿格拉乔夫和余。Sachkov,几何观点的控制理论。附件。数学。科学。87,Springer-Verlag,柏林-纽约(2004年)·Zbl 1062.93001号
[7] A.Agrachev和A.Sarychev,异常亚黎曼测地线:莫尔斯指数和刚度。Ann.Inst.H.Poincaré13(1996),635–690·Zbl 0866.58023号
[8] R.Axelrod,合作的演变。《纽约基础图书》(1984)·Zbl 1225.92037号
[9] A.Bagchi,Stackelberg经济模型中的微分对策。莱克特。注释控制通知。科学。Springer-Verlag(1984)·兹比尔0543.90095
[10] T.Ba,sar和A.Haurie,具有结构和模态不确定性的微分对策中的反馈平衡。JAE Press Inc.康涅狄格州(1984)。
[11] T.Bašar和G.J.Olsder,分层控制问题中的团队最优闭环Stackelberg策略。Automatica 16(1980),409–414·Zbl 0444.93004号 ·doi:10.1016/0005-1098(80)90026-6
[12] _____,动态非合作博弈论。SIAM(1995)·兹比尔0828.90142
[13] T.Bašar和H.Selbuz,闭环Stackelberg策略及其在多级系统最优控制中的应用。IEEE传输。自动化。控制AC-24(1979),166-179·Zbl 0405.49020号 ·doi:10.1109/TAC.1979.1101999
[14] T.Ba,sar和R.Srikant,一款拥有大量粉丝的Stackelberg网络游戏。J.优化。理论应用。115 (2002), 479–490. ·Zbl 1031.91016号 ·doi:10.1023/A:1021294828483
[15] B.Bonnard和M.Chyba,奇异轨迹在控制理论中的作用。数学。申请。40,Springer-Verlag(2003)·Zbl 1022.93003号
[16] B.Bonnard、L.Faubourg和E.Trélat,《空间系统控制》。数学。申请。51,Springer-Verlag(2006)。
[17] M.Breton、A.Alj和A.Haurie,两人博弈中的序列Stackelberg均衡。J.优化。理论应用。59 (1988), 71–97. ·Zbl 0631.90100号 ·doi:10.1007/BF00939867
[18] A.Buratto和G.Zaccour,《时尚授权合同中广告策略的协调》。J.优化。理论应用。142 (2009), 31–53. ·Zbl 1180.91013号 ·数字对象标识代码:10.1007/s10957-009-9511-x
[19] L.Cesari,优化。理论和应用。常微分方程的问题。Springer-Verlag,纽约(1983年)·Zbl 0506.49001号
[20] B.Chen和P.-A.Zadrozny,无限小时线性二次动态Stackelberg博弈的预期反馈解决方案。《经济学杂志》。发电机。控制,26(2002),1397-1416·Zbl 1100.91505号 ·doi:10.1016/S0165-1889(01)00077-X
[21] C.I.Chen和J.B.Cruz,带偏差信息模式的两人博弈的Stackelberg解。IEEE传输。自动化。控制AC-17(1972),791–797·Zbl 0262.90095号 ·doi:10.1109/TAC.1972.1100179
[22] Y.Chitour、F.Jean和E.Trélat,《特殊项目建议书》。C.R.数学。阿卡德。科学。巴黎337(2003),49-52·兹伯利1038.58019 ·doi:10.1016/S1631-073X(03)00252-8
[23] ______,奇异曲线的遗传结果。J.差异。地理。73 (2006), 45–73. ·Zbl 1102.53019号
[24] ______,仿生控制系统的奇异轨迹。SIAM J.控制优化。47 (2008), 1078–1095. ·Zbl 1157.49041号 ·数字对象标识代码:10.1137/060663003
[25] J.B.Cruz,《纳什和斯塔克伯格动态博弈均衡策略概览》。《经济学年鉴》。《社会测量4》(1975),339–344。
[26] S.Dempe,全球优化论文和调查。Springer-Verlag(2005),第165-193页。
[27] S.Dempe和N.Gadhi,双层集优化问题的二阶最优性条件。J.全球优化。47 (2010), 233–245. ·Zbl 1190.90179号 ·doi:10.1007/s10898-009-9468-1
[28] E.Dockner、S.Jorgensen、N.V.Long和G.Sorger,《经济学和管理科学中的差异博弈》。剑桥大学出版社(2000)·Zbl 0996.91001号
[29] G.Freiling、G.Jank和S.R.Lee,线性二次微分对策中开环stackelberg均衡的存在性和唯一性。J.优化。理论应用。110 (2001), 515–544. ·Zbl 0989.49027号 ·doi:10.1023/A:1017532210579
[30] 弗里德曼,超级游戏的非合作均衡。回顾经济。螺柱38(1971),1-12·Zbl 0274.90072号 ·doi:10.2307/2296617
[31] X.He、A.Prasad、S.P.Sethi和G.J.Gutierrez,供应和营销渠道中Stackelberg差分博弈模型的调查。J.系统。科学。系统。工程16(2007),385–413·数字对象标识代码:10.1007/s11518-007-5058-2
[32] M.Jungers,离散时间游戏闭环无记忆Stackelberg策略的矩阵块公式。In:程序。第47届IEEE决策与控制大会,墨西哥坎昆,2008年12月。
[33] M.Jungers和C.Oaré,离散时间开环Stackelberg策略的反盲色铅笔公式。In:程序。第19届国际研讨会。《网络与系统数学理论》(MTNS),匈牙利布达佩斯,2010年7月,第2265-2268页。
[34] S.Lasaulce、Y.Hayel、R.E.Azouzi和M.Debbah,《能源游戏中引入等级制度》。IEEE传输。无线通信。8 (2009), 3833–3843. ·doi:10.1109/TWC.2009.081443
[35] E.Lee和L.Markus,最优控制理论基础。威利,纽约(1967年)·Zbl 0159.13201号
[36] G.Leitmann,《关于广义Stackelberg策略》。J.优化。理论应用。26 (1978). ·Zbl 0372.90137号
[37] D.Limebeer、B.Anderson和H.Hendel,混合H2/H控制的纳什博弈方法。IEEE传输。自动化。控制39(1994),69-82·Zbl 0796.93027号 ·doi:10.1109/9.273340
[38] P.Loridan和J.Morgan,Stackelberg问题的理论近似方案。J.优化。理论应用。61 (1989), 95–110. ·Zbl 0642.90107号 ·doi:10.1007/BF00940846
[39] ______,弱到强Stackelberg问题:新结果。J.全球优化。8 (1996), 263–287. ·Zbl 0861.90151号 ·doi:10.1007/BF00121269
[40] L.Mallozzi和J.Morgan,两阶段Stackelberg博弈反馈均衡的存在性。IEEE传输。自动化。控制42(1997),1612-1614·Zbl 0893.90188号 ·数字对象标识代码:10.1109/9.649736
[41] J.Medanic,线性二次问题中的闭环Stackelberg策略。IEEE传输。自动化。控制23(1978),632-637·Zbl 0381.49006号 ·doi:10.1109/TAC.1978.1101788
[42] P.-Y.Nie,开环完全信息下的动态Stackelberg游戏。J.Franklin Inst.,342(2005),737-748·兹比尔1178.91025 ·doi:10.1016/j.jfranklin.2005.04.005
[43] P.-Y.Nie、L.-H.Chen和M.Fukushima,离散时间动态反馈Stackelberg游戏的动态规划方法,具有独立和依赖追随者。欧洲药典。第169号决议(2006年),310-328·Zbl 1101.91013号 ·doi:10.1016/j.ejor.2004.06.011
[44] P.-Y.Nie、M.-Y.Lai和S.-J.Zhu,具有非均匀解的动态反馈Stackelberg对策。农林。分析。69 (2008), 1904–1913. ·Zbl 1142.91381号 ·doi:10.1016/j.na.2007.07.032
[45] A.-J.Novak、G.Feichtinger和G.Leitmann,《与恐怖主义相关的差异博弈:纳什和斯塔克伯格战略》。J.优化。理论应用。,144 (2010), 533–555. ·Zbl 1188.91037号 ·doi:10.1007/s10957-009-9643-z
[46] G.P.Papavassilopoulos和J.B.Cruz,非经典控制问题和Stackelberg博弈。IEEE传输。自动化。控制24(1979),155-166·Zbl 0406.49008号 ·doi:10.1109/TAC.1979.1101986
[47] M.Simaan和J.B.Cruz,非零和博弈中Stackelberg策略的其他方面。J.优化。理论应用。11 (1973), 613–626. ·doi:10.1007/BF00935561
[48] ______,关于非零和博弈中的Stackelberg策略。J.优化。理论应用。11 (1973), 533–555. ·doi:10.1007/BF00935665
[49] A.W.Starr和Y.C.Ho,非零和微分对策的进一步性质。J.优化。理论应用。3 (1969), 207–219. ·Zbl 0169.12303号 ·doi:10.1007/BF00926523
[50] ______,非零和微分对策。J.优化。理论应用。3 (1969), 184–206. ·Zbl 0169.12301号 ·doi:10.1007/BF00929443
[51] B.Tolwinski,多级线性二次博弈的闭环Stackelberg解。J.优化。理论应用。,34 (1981), 485–501. ·Zbl 0431.90097号 ·doi:10.1007/BF00935889
[52] ______,动态游戏的Stackelberg解决方案。IEEE传输。自动化。对照28(1983),85–93·Zbl 0506.90096号 ·doi:10.1109/TAC.1983.1103139
[53] E.Trélat,可及性集沿异常轨迹的渐近性。ESAIM控制优化。计算变量6(2001),387–414·Zbl 0996.93009号 ·doi:10.1051/cocv:2001115
[54] ______,控制优化:技术和应用。Vuibert(2005)。
[55] L.N.Vicente和P.H.Calamai,《双层和多层规划:文献综述》。J.全球优化。5 (1994), 291–306. ·Zbl 0822.90127号 ·doi:10.1007/BF01096458
[56] H.von Stackelberg、Marktform und Gleichgewicht。柏林斯普林格·弗拉格(1934年)。
[57] X.Yashan,Stackelberg开环微分对策的平衡点。In:程序。第26届中国控制大会,中国湖南省张家界市,2007年7月,第446–450页。
[58] 叶俊杰,双层动态问题的最优策略。SIAM J.控制优化。35(1997),512–531·Zbl 0878.49013号 ·doi:10.1137/S0363012993256150
[59] K.Zhou、J.C.Doyle和K.Glover,鲁棒和最优控制。新泽西州普伦蒂斯·霍尔(1996)·Zbl 0999.49500
此参考列表基于出版商或数字数学图书馆提供的信息。它的项目与zbMATH标识符启发式匹配,并且可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。