文件Zbl 1506.65125-zbMATH Open

含不可分离哈密顿量的含时平均场对策系统的策略迭代方法。（英语） Zbl 1506.65125号

申请。数学。最佳方案。 87，第2期，第17号论文，第34页（2023年）。

摘要：我们介绍了两种基于策略迭代方法的算法来数值求解含不可分离哈密顿量的偏微分方程的含时平均场对策系统。我们用Banach不动点方法证明了这些算法在足够小的时间间隔内的收敛性。此外，我们还证明了收敛速度是线性的。我们通过数值例子说明了我们的理论结果，并讨论了所提算法的性能。

引用于2文件

MSC公司：

6500万06	含偏微分方程初值和初边值问题的有限差分方法
65H10型	方程组解的数值计算
65层10	线性系统的迭代数值方法
91A18号	广泛形式的游戏
91A23型	微分对策（博弈论方面）
49号70	差异化游戏和控制
35卢比	积分偏微分方程
91年第35季度	与博弈论、经济学、社会和行为科学相关的PDE
84年第35季度	福克-普朗克方程
35层21	哈密尔顿-雅可比方程

关键词：

平均场游戏;数值方法;策略迭代;汇聚

PDF格式 BibTeX公司 XML格式引用

全文：内政部 arXiv公司

参考文献：

[1]	Achdou，Y。；Capuzzo-Dolcetta，I.，《平均场游戏：数值方法》，SIAM J.Numer。分析。，481136-1162（2010年）·Zbl 1217.91019号 ·doi:10.1137/090758477
[2]	Achdou，Y。；卡米利，F。；Capuzzo-Dolcetta，I.，《平均场博弈：有限差分方法的收敛性》，SIAM J.Numer。分析。，512585-2612（2013年）·Zbl 1286.91022号 ·数字对象标识代码：10.1137/120882421
[3]	Achdou，Y。；Cardaliaguet，P。；德拉鲁，F。；Porretta，A。；Santambrogio，F.，《Mean Field Games:Cetraro，Italy 2019（2020）》，纽约：Springer Nature，纽约·Zbl 1456.49002号 ·数字对象标识代码：10.1007/978-3-030-59837-2
[4]	Achdou，Y。；布埃拉，F。；JM Lasry；狮子，P-L；Moll，B.，《宏观经济学中的偏微分方程模型》，Philos。事务处理。数学。物理。工程科学。，372, 2028 (2014) ·兹比尔1353.91027
[5]	Achdou，Y。；JM Lasry，《模拟人群运动的平均场游戏》。《对偏微分方程和应用的贡献》，17-42（2019），Cham:Springer，Cham·Zbl 1416.35020号 ·doi:10.1007/978-3319-78325-34
[6]	Achdou，Y。；Laurière，M。；Cardaliaguet，P。；Porretta，A.，《平均场游戏和应用：数值方面》，平均场游戏，249-307（2020），Cham:Springer，Cham·Zbl 1457.91057号 ·数字对象标识代码：10.1007/978-3-030-59837-2-4
[7]	Achdou，Y。；Laurière，M.，平均场类型控制与拥塞，应用。数学。最佳。，73, 3, 393-418 (2016) ·Zbl 1342.35136号 ·doi:10.1007/s00245-016-9342-8
[8]	Achdou，Y。；Laurière，M.，《关于平均场型控制中产生的偏微分方程组》，Discret。Contin公司。动态。系统。，35, 9, 38-79 (2015) ·Zbl 1350.49017号 ·doi:10.3934/dcds.2015.35.3879
[9]	Achdou，Y。；Laurière，M。；Lions，PL，带反馈控制的条件过程的最优控制，J.Math。Pures应用。，148, 308-341 (2021) ·兹比尔1459.93188 ·doi:10.1016/j.matpur.2020.07.014
[10]	Achdou，Y。；Porretta，A.，《拥挤情况下的平均场比赛》，安·Inst.Henri Poincare（C），35，443-480（2018）·Zbl 1476.35100号 ·文件编号：10.1016/j.anihpc.2017.06.001
[11]	Alla，A。；法尔科内，M。；Kalise，D.，动态规划方程的有效策略迭代算法，SIAM J.Sci。计算。，37、1、A181-A200（2015）·Zbl 1327.65259号 ·doi:10.1137/130932284
[12]	北阿尔穆拉。；费雷拉，R。；Gomes，D.，《平稳平均场游戏的两种数值方法》，Dyn。游戏应用程序。，7, 4, 657-682 (2017) ·Zbl 1391.91024号 ·doi:10.1007/s13235-016-0203-5
[13]	Ambrose，DM，含不可分离哈密顿量的含时平均场对策的强解，J.Math。Pures应用。，113141-154（2018）·Zbl 1388.35194号 ·doi:10.1016/j.matpur.2018.03.003
[14]	Ambrose，D.M.：Sobolev空间中不可分离平均场对策的存在性理论。印第安纳大学数学。J、出现·Zbl 1496.35390号
[15]	Ambrose，D.M.，Mészáros，A.R.：涉及不可分离局部哈密顿量的平均场对策主方程的良好性。http://arxiv.org/abs/2105.03926 (2021)
[16]	Andreev，R.，《带扩散SIAM的平稳平均场博弈的增广拉格朗日方法的预处理》，J.Sci。计算。，39、6、A2763-A2783（2017）·Zbl 1386.35156号
[17]	Bellman，R.，《动态编程》（1957），普林斯顿：普林斯顿大学出版社，普林斯顿·Zbl 0077.13605号
[18]	Benamou，JD；Carlier，G.，用于运输优化、平均场博弈和退化椭圆方程的增广拉格朗日方法，J.Optim。理论应用。，167, 1, 1-26 (2015) ·Zbl 1326.49074号 ·doi:10.1007/s10957-015-0725-9
[19]	Bensoussan，A。；Frehse，J。；Yam，P.，《平均场对策和平均场类型控制理论》（2013），纽约：施普林格数学简报，纽约·Zbl 1287.93002号 ·doi:10.1007/978-1-4614-8508-7
[20]	Bokanowski，O。；马罗索，S。；Zidani，H.，霍华德算法的一些收敛结果，SIAM J.Numer。分析。，47, 4, 3001-3026 (2009) ·Zbl 1201.49030号 ·数字对象标识码：10.1137/08073041X
[21]	Bonnans，JF；Hadikhanloo，S。；Pfeiffer，L.，Schauder对一类潜在平均场控制对策的估计，Appl。数学。最佳。，83, 3, 1431-1464 (2021) ·Zbl 1468.91016号 ·doi:10.1007/s00245-019-09592-z
[22]	布里塞尼奥·阿里亚斯，LM；Kalise，D。；Silva，FJ，具有局部耦合的平稳平均场对策的近端方法，SIAM J.Control Optim。，56, 2, 801-836 (2018) ·Zbl 1410.91090号 ·doi:10.1137/16M1095615
[23]	布里塞尼奥·阿里亚斯，LM；Kalise，D。；科贝西，Z。；Laurière，M。；冈萨雷斯，AM；Silva，FJ，关于具有局部耦合的二阶含时平均场博弈的原对偶算法的实现，ESAIM Proc。调查。，65, 330-348 (2019) ·Zbl 1418.49032号 ·doi:10.1051/proc/201965330
[24]	Cacace，S。；卡米利，F。；Goffi，A.，平均场游戏的政策迭代方法，ESAIM控制优化。计算变量，27，85（2021）·Zbl 1473.49043号 ·doi:10.1051/cocv/2021081
[25]	卡米利，F。；Tang，Q.，平均场博弈系统策略迭代方法的收敛速度，J.Math。分析。应用。，512，1126-138（2022）·Zbl 1485.91019号 ·doi:10.1016/j.jmaa.2022.126138
[26]	Cardaliaguet，P。；Hadikhanloo，S.，《在平均场游戏中学习：虚构游戏》，ESAIM Control Optim。计算变量，23，2，569-591（2017）·Zbl 1365.35183号 ·doi:10.1051/cocv/201604
[27]	Cardaliaguet，P.，Cirant，M.，Porretta，A.：平均场对策中主方程的分裂方法和短时间存在性。http://arxiv.org/abs/2001.10406
[28]	Carlini，E。；Silva，FJ，一阶平均场博弈问题的全离散半拉格朗日格式，SIAM J.Numer。分析。，52, 1, 45-67 (2014) ·Zbl 1300.65064号 ·数字对象标识代码：10.1137/120902987
[29]	Carlini，E。；Silva，FJ，退化二阶平均场博弈系统的半拉格朗日格式，Discret。Contin公司。动态。系统。，35, 9, 4269-4292 (2015) ·Zbl 1332.65138号 ·doi:10.3934/dcds.2015.35.4269
[30]	Carmona，R.，Delarue，F.：平均场对策的概率理论及其应用。一、《概率论与随机建模》第83卷（2018年）·Zbl 1422.91014号
[31]	Cirant，M。；吉安尼（Gianni，R.）。；Mannucci，P.，由平均场博弈产生的一般后向抛物系统的短时存在性，Dyn。游戏应用程序。，10, 1, 100-119 (2020) ·Zbl 1509.35130号 ·doi:10.1007/s13235-019-00311-5
[32]	Cuchiero，C.、Reisinger，C.、Rigger，S.：漂移控制过冷Stefan问题产生的最佳救援策略。http://arxiv.org/abs/2111.01783 (2021)
[33]	费雷拉，R。；戈麦斯，D。；Tada，T.，含时平均场对策弱解的存在性，非线性分析。，212 (2021) ·Zbl 1473.35226号 ·doi:10.1016/j.na.2021.112470
[34]	弗莱明，WH，《一些马尔科夫优化问题》，J.Math。机械。，12, 131-140 (1963) ·Zbl 0128.37902号
[35]	Gangbo，W.，Mészáros，A.R.，Mou，C.，Zhang，J.：具有不可分离哈密顿量和位移单调性的平均场对策主方程。http://arxiv.org/abs/201012362 (2021) ·Zbl 1501.35403号
[36]	戈麦斯，DA；Saude，J.，满足单调性条件的有限状态平均场对策的数值方法，应用。数学。最佳。，83, 1, 51-82 (2021) ·Zbl 1460.91030号 ·doi:10.1007/s00245-018-9510-0
[37]	戈麦斯，DA；Voskanyan，VK，带拥塞的平均场游戏解的短时存在性，J.Lond。数学。，92, 3, 778-799 (2015) ·Zbl 1338.35219号 ·doi:10.1112/jlms/jdv052
[38]	Graber，P.J.：具有拥塞的平均场游戏的弱解。http://arxiv.org/abs/1503.04733 (2015)
[39]	Gianni，R.，一类一维自由边界问题经典解的整体存在性，NoDEA非线性Differ。埃克。应用。，2, 3, 291-321 (1995) ·兹伯利0836.35163 ·doi:10.1007/BF01261178
[40]	Hadikhanloo，S.：在匿名非原子游戏中学习，并应用于一阶平均场游戏。http://arxiv.org/abs/1704.00378 (2017) ·Zbl 1365.35183号
[41]	Howard，R.，《动态规划和马尔可夫过程》（1960），剑桥：麻省理工学院出版社，剑桥·Zbl 0091.16001号
[42]	黄，M。；凯恩斯，体育；Malhame，RP，非均匀代理的大种群成本耦合LQG问题：个体-质量行为和分散-纳什均衡，IEEE Trans。自动。控制，52，1560-1571（2007）·Zbl 1366.91016号 ·doi:10.1109/TAC.2007.904450
[43]	克里姆库洛夫，B。；什什卡，D。；Szpruch，L.，Howards控制扩散策略改进算法的指数收敛性和稳定性，SIAM J.控制优化。，53, 1314-1340 (2020) ·Zbl 1441.93343号 ·doi:10.1137/19M1236758
[44]	Ladyzenskaja，O.A.，Solonnikov，V.A.，Ural'ceva，N.N.：抛物型线性和拟线性方程。S.Smith从俄语翻译而来。数学专著翻译，第23卷。美国数学学会，普罗维登斯（1968）·Zbl 0174.15403号
[45]	Laurière，M.：平均场游戏和平均场类型控制的数值方法。In：出现在AMS应用数学专题讨论会论文集（2021）·Zbl 1479.65013号
[46]	JM Lasry；狮子队，PL，平均场比赛，Jpn。数学杂志。，2, 229-260 (2007) ·Zbl 1156.91321号 ·doi:10.1007/s11537-007-0657-8
[47]	Nurbekyan，L。；Saúde，J.，一阶非局部平均场博弈的傅里叶近似方法，港口数学。，75, 3, 367-396 (2019) ·Zbl 1496.35393号 ·doi:10.4171/PM/2023
[48]	Pérolat，J.、Perrin，S.、Elie，R.、Laurière，M.、Piliouras，G.、Geist，M.，Tuyls，K.、Pietquin，O.：通过在线镜像下降扩大平均场游戏。在：第21届自主智能体和多智能体系统国际会议论文集（2022）
[49]	Perrin，S.，Pérolat，J.，Laurière，M.，Geist，M.、Elie，R.、Pietquin，O.：平均场游戏的虚拟游戏：连续时间分析和应用。In:神经信息处理系统进展会议录33（NeurIPS）（2020年）
[50]	Puterman，ML，关于受控扩散的政策迭代收敛性，J.Optim。理论应用。，33, 1, 137-144 (1981) ·Zbl 0421.93089号 ·doi:10.1007/BF00935182
[51]	普特曼，马里兰州；Brumelle，SL，关于平稳动态规划中策略迭代的收敛性，数学。操作。决议，4，60-69（1979）·Zbl 0411.90072号 ·doi:10.1287/门4.1.60
[52]	萨尔哈布，R。；Malhamé，RP；Le Ny，J.，多智能体系统中集体选择的动态博弈模型，IEEE Trans。自动。控制，63，3，768-782（2017）·Zbl 1390.91065号 ·doi:10.1109/TAC.2017.2723956
[53]	桑托斯，MS；Rust，J.，策略迭代的收敛性，SIAM J.控制优化。，42, 6, 2094-2115 (2004) ·兹比尔1134.90530 ·doi:10.1137/S0363012902399824

此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配，可能包含数据转换错误。在某些情况下，zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献，而不要求完整或完全匹配。

任何	在任何地方
一个	内部文档标识符
澳大利亚	作者、编辑
人工智能	内部作者标识符
钛	标题
洛杉矶	语言
所以	来源
ab公司	回顾，摘要
第页	出版年份
车辆	评审员
复写的副本	MSC代码
美国犹他州	关键字
日期	文档类型(j：期刊文章；b：book；一：图书文章）

一&b	逻辑和
一\|b	逻辑或
!ab公司	逻辑不
美国广播公司*	右通配符
"ab c公司"	短语
(ab c公司)	圆括号

示例

领域

操作员

含不可分离哈密顿量的含时平均场对策系统的策略迭代方法。（英语） Zbl 1506.65125号

MSC公司：

关键词：

参考文献：

示例

领域

操作员

含不可分离哈密顿量的含时平均场对策系统的策略迭代方法。 （英语） Zbl 1506.65125号

MSC公司：

关键词：

参考文献：

含不可分离哈密顿量的含时平均场对策系统的策略迭代方法。（英语） Zbl 1506.65125号