×

平均场Stackelberg游戏:延迟指令的聚合。 (英语) Zbl 1320.91028号

小结:我们考虑一个(N)-玩家交互战略游戏,其中存在一个(内生)主导玩家,该玩家通过其对个体代理人控制的影响(斯塔克伯格游戏意义上的)直接影响个体代理人,进而影响整个社区。每个个体代理人在收集信息时都会受到延迟效应的影响,特别是在延迟时间,从主导玩家那里收集信息。经纪人完全知道他的延迟大小,而对于其他人,包括主宰者,他的延迟是一个隐藏的随机变量,来自一个常见的固定分布。通过调用一个非正则不动点性质,我们证明了对于一类一般的有限(N)人博弈,每一类博弈都收敛到平均场对应方,该平均场对应方可能具有一个最优解,该最优解可以作为相应的有限(N)人博弈的(epsilon)-Nash均衡。其次,我们用显式解全面研究了具有支配者时滞的小主体的相应线性二次平均场对策。给定通过平均场项从主导玩家和整个社区获得的信息流,代表代理的控制所适应的过滤是非布朗的。因此,我们建议利用反向随机动力学(而不是通过反向随机微分方程的常见方法)来构造伴随过程,以解决其最优控制问题。通过处理一类非对称Riccati方程,给出了平均场平衡唯一存在的一个简单的充分条件。最后,通过对一类前向倒向随机泛函微分方程的研究,在给定小参与者平均场平衡唯一存在的条件下,给出了主导参与者的最优控制。

理学硕士:

91A07型 有无限多玩家的游戏
91A23型 微分对策(博弈论方面)
91A65型 分级游戏(包括Stackelberg游戏)
91A06型 \(n)-人游戏,(n>2)
34K50美元 随机泛函微分方程
60小时10分 随机常微分方程(随机分析方面)
60F99型 概率论中的极限定理
93E20型 最优随机控制
PDF格式BibTeX公司 XML格式引用
全文: 内政部 链接

参考文献:

[1] T.Başar、A.Bensoussan和S.P.Sethi,《混合领导的微分博弈:开环解决方案》,应用。数学。计算。,217(2010),第972-979页·Zbl 1198.91039号
[2] A.Bensoussan,{用函数分析方法进行随机控制},数学研究。申请。11,Elsevier,纽约,1982年·Zbl 0474.93002号
[3] A.Bensoussan、M.H.M.Chau和S.C.P.Yam,{这意味着有一个支配性球员的场上比赛},Appl。数学。最佳。,出现·Zbl 1348.49031号
[4] A.Bensoussan、S.Chen和S.P.Sethi,{混合领导的线性二次微分对策:开环解},Numer。代数控制优化。,3(2013年),第95-108页·Zbl 1262.91010号
[5] A.Bensoussan和J.Frehse,(N)玩家的随机游戏,J.Optim。理论应用。,105(2000),第543-565页·Zbl 0977.91006号
[6] A.Bensoussan和J.Frehse,{关于具有超二次哈密顿量的对角椭圆和抛物系统},Commun。纯应用程序。分析。,8(2009年),第83-94页·Zbl 1152.35361号
[7] A.Bensoussan、J.Frehse和J.Vogelgesang,{非紧耦合随机微分对策的Bellman方程组}。离散连续。动态。系统。,27(2010),第1375-1389页·兹比尔1191.35275
[8] A.Bensoussan、J.Frehse和S.C.P.Yam,{平均场游戏和平均场类型控制理论},Springer Briefs Math。,施普林格,纽约,2013年·兹比尔1287.93002
[9] A.Bensoussan、K.C.J.Sung、S.C.P.Yam和S.P.Yung,{线性二次平均场游戏},J.Optim。理论应用。,已提交·Zbl 1343.91010号
[10] R.Carmona和F.Delarue,{平均场比赛的概率分析},SIAM J.控制优化。,51(2013),第2705-2734页·兹比尔1275.93065
[11] M.H.A.Davis,{线性估计和随机控制},查普曼和霍尔数学。序列号。,查普曼和霍尔出版社,伦敦,1977年·Zbl 0437.60001号
[12] R.J.Elliott,{随机微分对策中值的存在性},SIAM J.控制优化。,14(1976年),第85-94页·Zbl 0328.90085号
[13] M.Huang、P.E.Caines和R.P.Malhameá,《大群体随机无线功率控制问题中的个体和群体行为:集中式和纳什均衡解》,载于《第42届IEEE决策与控制会议论文集》,Maui,HI,2003年,第98-103页。
[14] M.Huang、R.P.Malhameí和P.E.Caines,{大种群随机动态博弈:闭环McKean-Vlasov系统和Nash确定性等价原理},Commun。信息系统。,6(2006),第221-252页·Zbl 1136.91349号
[15] M.Huang,{涉及主要参与者的大种群LQG博弈:纳什确定性等价原理},SIAM J.控制优化。,48(2010年),第3318-3353页·Zbl 1200.91020号
[16] J.M.Lasry和P.L.Lions,{it Jeux a⁄champ moyen I-Le cas stationnaire},C.R.Acad。科学。序列号。一、 343(2006),第619-625页·Zbl 1153.91009号
[17] J.M.Lasry和P.L.Lions,{it Jeux a⁄champ moyen II.Horizon fini et contrôle optimal},C.R.Acad。科学。,序列号。一、 343(2006),第679-684页·Zbl 1153.91010号
[18] J.M.Lasry和P.L.Lions,《平均场游戏》,日本数学杂志。,2(2007年),第229-260页·Zbl 1156.91321号
[19] G.Liang,T.Lyons,and Z.Qian,{过滤概率空间上的向后随机动力学},Ann.Probab。,39(2011),第1422-1448页·Zbl 1238.60064号
[20] M.Nourian和P.E.Caines,具有主要和次要代理人的非线性随机动力系统的{(1013)-Nash平均场博弈论},SIAM J.控制优化。,51(2013),第3302-3331页·Zbl 1275.93067号
[21] 彭硕,杨振中,{预期倒向随机微分方程},Ann.Probab。,37(2009),第877-902页·Zbl 1186.60053号
[22] M.Siman和J.B.Cruz,Jr.,《论非零和博弈中的Stackelberg策略》,J.Optim。理论应用。,11(1973),第533-555页·Zbl 0243.90056号
[23] H.von Stackelberg,{\it Marktform und Gleichgewich},施普林格,维也纳,1934年·Zbl 1405.91003号
[24] Xu,{\it全耦合前向-后向随机泛函微分方程及其在二次最优控制中的应用},arXiv:11310.68462013。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。