×

流形上的计算平均场游戏。 (英语) 兹伯利07679184

概述:传统的Mean-field游戏/控制研究了大量理性主体在欧几里德空间中的行为。在这项工作中,我们研究了黎曼流形上的平均场对策。我们在流形上建立了平均场对策纳什均衡。我们还建立了PDE系统与流形上相关变分形式的最优性条件之间的等价性。基于二维流形的三角网格表示,我们设计了变分平均场对策的近似梯度方法。我们在各种流形上的综合数值实验表明了所提模型和数值方法的有效性和灵活性。

MSC公司:

91A16型 平均场博弈(博弈论方面)
49平方米25 最优控制中的离散逼近
49N80型 平均场游戏和控制
65千5 数值数学规划方法
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] 阿奇杜,伊夫斯;弗朗西斯科·布埃拉。;Jean-Michel Lasry;狮子队,皮埃尔·卢伊斯;Moll,Benjamin,《宏观经济学中的偏微分方程模型》,Philos。事务处理。R.Soc.,数学。物理学。工程科学。,3722028,文章20130397 pp.(2014)·Zbl 1353.91027号
[2] 阿奇杜,伊夫斯;法比奥·卡米利;Capuzzo-Dolecetta,Italo,《平均场游戏:有限差分方法的收敛性》,SIAM J.Numer。分析。,512585-2612(2013年)·Zbl 1286.91022号
[3] 阿奇杜,伊夫斯;Capuzzo-Dolecetta,Italo,《平均场游戏:数值方法》,SIAM J.Numer。分析。,48, 3, 1136-1162 (2010) ·Zbl 1217.91019号
[4] 阿奇杜,伊夫斯;Laurière,Mathieu,《平均场游戏和应用:数值方面》(2020),arXiv预印本·Zbl 1457.91057号
[5] 诺哈·阿尔穆拉;丽塔·费雷拉;戈麦斯(Gomes)、迪奥戈(Diogo),《固定平均场游戏的两种数值方法》(Two numerical approachs to stationing mean-field games),戴恩(Dyn)。游戏应用程序。,7, 4, 657-682 (2017) ·Zbl 1391.91024号
[6] Bauschke,Heinz H。;里贾娜·布拉奇克。;组合,Patrick L。;Elser,Veit;卢克·D·拉塞尔;Wolkowicz,Henry,《科学与工程中反问题的定点算法》,第49卷(2011),Springer Science&Business Media·Zbl 1217.00018号
[7] 埃米尔·贝克;Teboulle,Marc,线性反问题的快速迭代收缩阈值算法,SIAM J.成像科学。,2, 1, 183-202 (2009) ·Zbl 1175.94009号
[8] Jean-David Benamou;Carlier,Guillaume,运输优化的增广拉格朗日方法,平均场对策和退化椭圆方程,J.Optim。理论应用。,167, 1, 1-26 (2015) ·Zbl 1326.49074号
[9] Jean-David Benamou;纪尧姆·卡利埃(Guillaume Carlier);Santambrogio,Filippo,变分平均场游戏,(《活动粒子》,第1卷(2017),斯普林格出版社),141-171
[10] 阿里埃拉·布里亚尼;Cardaliaguet,Pierre,潜在平均场博弈系统的稳定解,非线性微分。埃克。申请。,25, 1, 1-26 (2018) ·Zbl 1390.35365号
[11] 布里塞尼奥·阿里亚斯,路易斯;但丁·卡莉丝;科贝西,齐亚德;马修·劳里埃;González,A.Mateos;Silva,Francisco J.,关于具有局部耦合的二阶含时平均场对策的原对偶算法的实现,ESAIM Proc。调查。,65, 330-348 (2019) ·Zbl 1418.49032号
[12] 彼得·凯恩斯(Peter E.Caines)。;Huang,Minyi,Graphon mean field games and the GMFG equations,(2018 IEEE Conference on Decision and Control,2018 IEEE决策与控制会议,CDC(2018),IEEE),4129-4134
[13] 皮埃尔·卡达利亚奎特(Pierre Cardaliaguet);格雷伯,P.詹姆逊;阿莱西奥·波雷塔;Tonon,Daniela,具有退化扩散和局部耦合的二阶平均场对策,非线性Differ。埃克。申请。,22, 5, 1287-1317 (2015) ·Zbl 1344.49061号
[14] Carmona,Guilherme,具有连续玩家的游戏的纳什均衡(2004)·Zbl 1254.91031号
[15] 勒内·卡莫纳;Laurière,Mathieu,平均场控制和博弈数值解机器学习算法的收敛性分析:II-有限水平情况(2019),arXiv预印本·兹比尔1505.65243
[16] 勒内·卡莫纳;Laurière,马蒂厄;Tan,Zongjun,无模型平均场强化学习:平均场MDP和平均场Q学习(2019),arXiv预印本
[17] Lawrence Cayton,《流形学习算法》,加州大学圣地亚哥技术代表,12,1-17,1(2005)
[18] 安东尼奥·德·保拉(Antonio De Paola);特罗瓦托,文森佐;戴维·安吉利(David Angeli);Strbac,Goran,《用于分布式控制作用于同时节能响应市场的恒温负载的平均场博弈方法》,IEEE Trans。智能电网,10,6,5987-5999(2019)
[19] 罗穆亚德·埃利;朱利安·佩罗拉特(Julien Perolat);马修·劳里埃;盖斯特,马蒂厄;Pietquin,Olivier,《关于平均场游戏中无模型学习的收敛性》(《AAAI人工智能会议论文集》,第34卷(2020年)),7143-7150
[20] 查尔斯·费弗曼(Charles Fefferman);Sanjoy Mitter;Narayanan,Hariharan,《检验多种假设》,《美国数学杂志》。Soc.,29,4,983-1049(2016)·Zbl 1359.62122号
[21] 威尔弗里德·冈波(Wilfrid Gangbo);李武晨;牟晨晨,图上概率测度集合中的最小长度测地线,(ESAIM:COCV(2019))·Zbl 1507.05085号
[22] 高浩;李武晨;潘、苗;韩、朱;Poor,H.Vincent,《用平均场进化动力学建模新冠肺炎:社会距离和季节性》,J.Commun。净值。,23, 5, 314-325 (2021)
[23] 戈麦斯、迪奥戈;Saúde,Joáo,《电力市场价格形成的平均场博弈方法》(2018),arXiv预印本·Zbl 1416.65065号
[24] 戈麦斯,迪奥戈A。;乔安娜·莫尔(Joana Mohr);Souza,Rafael Rigao,连续时间有限状态平均场游戏,应用。数学。最佳。,68, 1, 99-143 (2013) ·Zbl 1283.91016号
[25] 戈麦斯,迪奥戈A。;Saúde,Joáo,满足单调性条件的有限状态平均场对策的数值方法,应用。数学。最佳。,83, 1, 51-82 (2021) ·Zbl 1460.91030号
[26] Guéant,Olivier,图上具有拥塞效应的平均场对策的存在唯一性结果,应用。数学。最佳。,72, 2, 291-303 (2015) ·兹比尔1348.49035
[27] 黄敏毅;彼得·凯恩斯(Peter E.Caines)。;Malhamé,Roland P.,具有非均匀代理的大种群成本耦合LQG问题:个体质量行为和分散ε-Nash均衡,IEEE Trans。自动。控制,52,9,1560-1571(2007)·Zbl 1366.91016号
[28] 黄敏毅;罗兰·马勒姆。;Caines,Peter E.,《大种群随机动态博弈:闭环Mckean-Vlasov系统和纳什确定性等价原理》,Commun。信息系统。,6, 3, 221-252 (2006) ·Zbl 1136.91349号
[29] 库恩,H.W。;塔克,A.W.,《非线性规划》(第二届伯克利数理统计与概率研讨会论文集(1951年),加利福尼亚大学出版社),481-492·Zbl 0044.05903号
[30] 赖荣杰;Chan,Tony F.,《表面内禀图像处理框架》,计算机。视觉。图像理解。,115, 12, 1647-1661 (2011)
[31] Jean-Michel Lasry;狮子队,皮埃尔·卢伊斯,平均场比赛,Jpn。数学杂志。,2, 1, 229-260 (2007) ·Zbl 1156.91321号
[32] Laurière,Mathieu,平均场游戏和平均场类型控制的数值方法(2021),arXiv预印本·Zbl 1479.65013号
[33] Lee,John M.,《光滑流形》(Smooth manifolds简介(2013),Springer),第1-31页·Zbl 1258.53002号
[34] 李泰英;莱克,梅尔文;McClamroch,N.Harris,《流形上拉格朗日和哈密顿动力学的整体公式》,第13卷,第31期(2017年),施普林格出版社
[35] Lee,Wonjun;李武晨;Osher,Stanley,疫苗分发的平均现场控制问题(2021年)·Zbl 1458.92075号
[36] Lee,Wonjun;刘思廷;哈米杜·坦宾;李武晨;Osher,Stanley,通过平均场控制控制流行病传播,SIAM J.Appl。数学。,81, 1, 190-207 (2021) ·Zbl 1458.92075号
[37] 李武晨;Lee,Wonjun;Osher,Stanley,与反应扩散方程相关的计算平均场信息动力学(2021)·Zbl 07561086号
[38] 李武晨;刘思廷;Osher,Stanley,控制守恒定律I:熵通量(2021)·兹伯利07662518
[39] Lin,Alex Tong;Fung、Samy Wu;李武晨;莱文·努尔别坎;Osher Apac-net,Stanley J.,通过两个神经网络交替进行种群和代理控制,以解决高维随机平均场游戏,Proc。国家。阿卡德。科学。美国(2021年)
[40] 刘思廷;马修·雅各布斯(Matthew Jacobs);李武晨;勒冯省努尔贝克扬;Osher,Stanley J.,一阶非局部平均场博弈的计算方法及其应用,SIAM J.Numer。分析。,59, 5, 2639-2668 (2021) ·Zbl 1477.35276号
[41] Maas,Jan,有限马尔可夫链的熵梯度流,J.Funct。分析。,261, 8, 2250-2292 (2011) ·Zbl 1237.60058号
[42] Mangasarian,Olvi L.,伪凸函数,(金融随机优化模型(1975),Elsevier),23-32
[43] 马克·梅耶(Mark Meyer);马修·德斯布伦;彼得·施罗德(Peter Schröder);Barr,Alan H.,三角2-流形的离散微分几何算子,(可视化与数学III(2003),Springer),35-57·Zbl 1069.53004号
[44] Nash,John,非合作游戏,Ann.Math。,286-295 (1951) ·Zbl 0045.08202号
[45] 勒文·努尔贝基扬;Joáo,Saúde,一阶非局部平均场博弈的傅里叶近似方法,港口数学。,75, 3, 367-396 (2019) ·Zbl 1496.35393号
[46] Rockafellar,R.Tyrrell,《凸分析》,第36卷(1970),普林斯顿大学出版社·Zbl 0193.18401号
[47] 拉斯·鲁索托;斯坦利·奥斯尔(Stanley J.Osher)。;李武晨;莱文·努尔别坎;Fung,Samy Wu,解决高维平均场游戏和平均场控制问题的机器学习框架,Proc。国家。阿卡德。科学。美国,117,17,9183-9193(2020)
[48] 贾斯汀·所罗门;加布里埃尔·佩雷;Kim,Vladimir G。;Sra,Suvrit,对应问题的熵度量对齐,ACM Trans。图表。,35, 4, 1-13 (2016)
[49] E.渭南。;韩洁群;李倩晓,深度学习的平均场最优控制公式,数学研究。科学。,6, 1, 10 (2019) ·Zbl 1421.49021号
[50] 杨忠刚;李建东;盛敏;阿拉甘·安帕拉甘;Xiao,Jia,《5g超密集网络中干扰和能量感知控制的平均场游戏理论框架》,IEEE Wirel。社区。,25, 1, 114-121 (2017)
[51] 杨耀东;罗锐;李敏;周明;张维南;Wang,Jun,Mean field multi-agent reinforcement learning,(机器学习国际会议(2018),PMLR),5571-5580
[52] 于佳佳;赖荣杰;李武晨;Osher,Stanley,动态平均场规划的快速近似梯度法和收敛性分析(2021),arXiv预印本
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。