×

主要参与者的线性二次平均场博弈:多尺度方法。 (英语) Zbl 1435.91025号

摘要:本文考虑了一个主要参与者的线性二次型(LQ)平均场对策,并分析了一个渐近可解问题。它从耦合动态规划方程的大规模系统开始,并应用了在[M.黄周先生,“线性二次平均场博弈。I:渐近可解性问题”,载于:第23届网络与系统数学理论国际研讨会论文集,MTNS 2018,7月16日至20日,中国香港。香港:香港科技大学。489–495 (2018); “线性二次平均场博弈:渐近可解性和与不动点方法的关系”,IEEE Trans。自动。控制65,第4期,1397–1412(2020年;doi:10.1109/TAC.2019.2919111)]导出一组低维Riccati方程,其可解性决定了渐近可解的充要条件。接下来,我们导出了策略和值函数的平均场极限。最后,我们证明了这两种分散策略可以解释为嵌入无限总体中的主要参与者和具有代表性的次要参与者的最佳响应,它们具有一致平均场近似的性质。

MSC公司:

91A16型 平均场博弈(博弈论方面)
49N80型 平均场游戏和控制
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] 巴萨,T。;Olsder,G.J.,动态非合作博弈论(1999),SIAM:美国宾夕法尼亚州费城SIAM·Zbl 0946.91001号
[2] Bauso,D。;张,X。;Papachristodoulou,A.,通过平均场游戏实现动态网络中的密度流,IEEE自动控制汇刊,62,3,1342-1355(2017)·兹比尔1366.91033
[3] Bensoussan,A。;Chau,M。;赖,Y。;Yam,P.,具有状态和控制延迟的线性二次平均场Stackelberg对策,SIAM控制与优化杂志,55,4,2748-2781(2017)·Zbl 1372.91021号
[4] Bensoussan,A。;Chau,M.H.M。;Yam,S.C.P.,《平均场Stackelberg游戏:延迟指令的聚合》,SIAM控制与优化杂志,53,4,2237-2266(2015)·Zbl 1320.91028号
[5] 本苏桑,A。;Chau,M.H.M。;Yam,S.C.P.,《带主导玩家的平均场游戏》,《应用数学与优化》,74,191-128(2016)·Zbl 1348.49031号
[6] Bensoussan,A。;Frehse,J。;Yam,P.,《平均场游戏和平均场类型控制理论》(2013),Springer:Springer New York·Zbl 1287.93002号
[7] Buckdahn,R。;李,J。;Peng,S.,涉及一个主要参与者和大量集体代理次要代理的非线性随机微分对策,SIAM控制与优化杂志,52,1,451-492(2014)·Zbl 1292.93144号
[8] 凯恩斯,体育。;黄,M。;Malhamé,R.P.,《平均场博弈》(Basar,T.;Zaccour,G.,《动态博弈理论手册》(2017),施普林格:施普林格柏林),345-372
[9] 凯恩斯,体育。;克孜尔凯勒,A.C.,(epsilon)-部分观测到的主要玩家的LQG平均场游戏的纳什均衡,IEEE自动控制交易,62,7,3225-3234(2017)·Zbl 1371.91012号
[10] Cardaliaguet,P。;Cirant,M。;Porretta,A.,《关于主要参与者平均场博弈模型中Nash均衡的评论》(2018),arXiv:1811.02811·Zbl 1446.35213号
[11] Cardaliaguet等人。;德拉鲁,F。;Lasry,J.-M。;Lions,P.-L.,《平均场博弈中的主方程和收敛问题》(2015),arXiv:1509.02505
[12] 卡莫纳,R。;Delarue,F.,平均场博弈的概率理论及其应用I-II(2018),施普林格:施普林格-查姆,瑞士·Zbl 1422.91014号
[13] 卡莫纳,R。;Wang,P.,《有主要和次要玩家的平均场游戏的替代方法以及对牧民影响的应用》,应用数学与优化,76,1,5-27(2017)·兹比尔1378.49036
[14] 卡莫纳,R。;朱,X.,《主要和次要玩家平均场游戏的概率方法》,《应用概率年鉴》,26,3,1535-1580(2016)·Zbl 1342.93121号
[15] 库伊莱特,R。;Perlaza,S.M。;Tembine,H。;Debbah,M.,《智能电网中的电动汽车:平均场博弈分析》,IEEE通讯选定领域期刊,30,6,1086-1096(2012)
[16] Elie,R。;Mastrolia,T.肥大细胞。;波萨梅,D.,《一个校长和许多代理人的故事》,《运筹学数学》,第44、2、440-467页(2019年)·Zbl 1443.91198号
[17] Firoozi,D.和Caines,P.E.(2015)\具有主要代理人的部分观测LQG平均场博弈的(epsilon)-Nash均衡:所有代理人的部分观察。第54届IEEE决策与控制会议记录,日本大阪(第4430-4437页)。
[18] Fischer,M.,《关于对称玩家游戏和平均场游戏之间的联系》,《应用概率年鉴》,27,2,757-810(2017)·Zbl 1375.91009号
[19] Fu,G。;Horst,U.,Mean-field leader-flower games with terminal state constraint(2018年),arXiv:1809.04401
[20] Hale,J.K.,《常微分方程》(1969),威利出版社:威利纽约·Zbl 0186.40901号
[21] Herty,M。;Pareschi,L。;Steffensen,S.,Mean场控制和Riccati方程。,网络和异构媒体,10,3,699-715(2015)·Zbl 1332.35372号
[22] 胡,Y。;黄,J。;Li,X.,带控制输入约束的线性二次平均场博弈,ESAIM。《控制、优化和变分计算》,24,2,901-919(2018)·Zbl 1432.49048号
[23] Huang,M.,《分布式系统随机控制与无线通信应用》(2003),麦吉尔大学:加拿大蒙特利尔麦吉尔大学(博士论文)
[24] Huang,M.,涉及主要参与者的大种群LQG博弈:纳什确定性等价原理,SIAM控制与优化杂志,48,5,3318-3353(2010)·兹比尔1200.91020
[25] Huang,M.(2012)。具有离散状态和混合参与者的平均场随机对策。《第三届游戏网会议记录》,温哥华(第138-151页)·Zbl 1268.91018号
[26] 黄,M。;凯恩斯,体育。;Malhamé,R.P.,具有非均匀代理的大种群成本耦合LQG问题:个体-群体行为和分散的Nash均衡,IEEE自动控制汇刊,52,9,1560-1571(2007)·Zbl 1366.91016号
[27] 黄,X。;南加尔。;Nourian,M.,最佳执行的平均场博弈策略,应用数学金融,26,2153-185(2019)·Zbl 1410.91498号
[28] 黄,M。;马云,平均场随机博弈:单调成本与阈值策略(中文),《数学科学》,46,10,1445-1460(2016)·Zbl 1499.91009号
[29] 黄,M。;Malhamé,R.P。;Caines,P.E.,《大种群随机动态博弈:闭环McKean-Vlasov系统和Nash确定性等价原理》,《信息与系统中的通信》,6,3,221-252(2006)·Zbl 1136.91349号
[30] 黄,J。;王,S。;Wu,Z.,具有主要和次要代理人的后向线性二次平均场博弈,概率、不确定性和定量风险,1,1(2016)·Zbl 1443.91044号
[31] Huang,M.和Zhou,M.(2018)。线性二次平均场对策——第一部分:渐近可解性问题。第23届网络与系统数学理论国际研讨会论文集,中国香港(第489-495页)。
[32] 黄,M。;Zhou,M.,线性二次平均场对策:渐近可解性和与不动点方法的关系,IEEE自动控制汇刊,65,出版社(2020年)·Zbl 07256265号
[33] 克孜尔凯勒,A.C。;萨尔哈布,R。;Malhamé,R.P.,智能电网中基于平均场博弈的大规模负荷协调的积分控制公式,Automatica,100312-322(2019)·Zbl 1415.93039号
[34] Kolokoltsov,V.,《压力(或干扰)、阻力和协作的进化博弈》,《运筹学数学》,42,4,915-944(2017)·Zbl 1386.91028号
[35] Kordonis,I。;Papavassilopoulos,G.P.,《随机进入的LQ Nash博弈:无限视界的主要参与者和有限视界的次要参与者》,IEEE自动控制交易,60,6,1486-1500(2015)·Zbl 1360.91034号
[36] Lacker,D.,随机微分对策平均场极限的一般特征,概率论及相关领域,165,3-4,581-648(2016)·Zbl 1344.60065号
[37] Lasry,J.-M。;狮子,P.-L.,平均场游戏,日本数学杂志,2,1,229-260(2007)·Zbl 1156.91321号
[38] Lasry,J.-M。;狮子队,P.-L.,与一名主要球员Comptes Rendus Mathématique的平均场地比赛。科学院。巴黎,356886-890(2018)·Zbl 1410.91048号
[39] 李·T。;Zhang,J.-F.,大种群随机多智能体系统的渐近最优分散控制,IEEE自动控制汇刊,53,7,1643-1660(2008)·Zbl 1367.93249号
[40] 马,Z。;Callaway,D.S。;Hiskens,I.A.,《大量插入式电动汽车的分散充电控制》,IEEE控制系统技术汇刊,21,1,67-78(2013)
[41] Moon,J。;Basar,T.,线性二次平均场Stackelberg微分对策,Automatica,97,200-213(2018)·兹比尔1420.91021
[42] Nguyen,S.L.和Huang,M.(2012a)。平均场LQG游戏,大规模行为响应主要玩家。《第51届IEEE决策与控制会议记录》,马里兰州毛伊岛(第5792-5797页)。
[43] Nguyen,S.L。;Huang,M.,带连续参数化次要参与者的线性二次高斯混合博弈,SIAM控制与优化杂志,50,5,2907-2937(2012)·Zbl 1262.91020号
[44] 努里安,M。;Caines,P.E.,(epsilon)-具有主要和次要代理的非线性随机动力系统的Nash平均场博弈理论,SIAM控制与优化杂志,51,4,3302-3331(2013)·Zbl 1275.93067号
[45] Ott,E。;Antonsen,T.M.,全球耦合振荡器大型系统的低维行为,混沌,18,3,037113(2008)·Zbl 1309.34058号
[46] Papavassilopoulos,G.P.,具有对称参与者的LQ确定性无限时域Nash博弈随着参与者数量趋于无穷大的极限行为(2014),arXiv:1403.3300
[47] 帕佐,D。;Montbrió,E.,脉冲耦合振荡器种群的低维动力学,《物理评论》X,4,1,011009(2014)
[48] Priuli,F.S.,《线性二次型人与平均场游戏:具有折扣成本和奇异极限的无限地平线游戏》,《动态游戏与应用》,5,3,397-419(2015)·Zbl 1348.91024号
[49] Sen,N。;Caines,P.E.,《带有部分观察到的主要代理的平均场博弈论》,SIAM控制与优化杂志,54,6,3174-3224(2016)·Zbl 1358.35195号
[50] 王,B。;Huang,M.,《粘性价格下的平均油田产量控制:纳什和社会解决方案》,Automatica,10090-98(2019)·Zbl 1411.91064号
[51] 王,B.-C。;Zhang,J.-F.,具有随机参数的多智能体系统的分布式控制和主要智能体,Automatica,48,9,2093-2106(2012)·Zbl 1257.93008号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。