×

具有有限状态和动作空间的平均场对策的近视调整过程。 (英语) Zbl 1531.91029号

小结:在本文中,我们介绍了一种针对具有有限状态和动作空间的平均场博弈的自然学习规则,即所谓的近视调整过程。这些考虑的主要动机是确定动态平均场平衡所需的计算的复杂性,这使得代理是否真的能够发挥这些平衡似乎值得怀疑。我们证明了近视调整过程在相当宽的条件下局部收敛于严格的平稳平衡点。此外,我们还获得了在更强但直观的条件下的全局收敛结果。

MSC公司:

91A16型 平均场博弈(博弈论方面)
91A26型 博弈论中的理性与学习
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Asmussen S(2003)应用概率和队列,随机建模和应用概率,第51卷,第2版。纽约施普林格,ISBN 0-387-00211-1·Zbl 1029.60001号
[2] Aubin J-P,Cellina A(1984),微分包含:集值映射和生存理论,Grundlehren der mathematischen Wissenschaften,第264卷。柏林施普林格。doi:10.1007/978-3-642-69512-4·Zbl 0538.34007号
[3] Bang-Jensen J,Gutin GZ(2010)有向图:理论、算法和应用。施普林格数学专著,第二版。伦敦施普林格,ISBN 978-0-85729-041-0·Zbl 1210.05001号
[4] Belak,C。;霍夫曼,D。;Seifried,FT,有限状态空间和公共噪声的连续时间平均场博弈,应用数学优化,84,3173-3216(2021)·Zbl 1475.60141号 ·doi:10.1007/s00245-020-09743-7
[5] Bensoussan,A。;Frehse,J。;Yam,P.,平均场游戏和平均场类型控制理论。施普林格数学简报(2013),纽约:施普林格,纽约·Zbl 1287.93002号 ·doi:10.1007/978-1-4614-8508-7
[6] Besancenot,D。;Doggay,H.,《范式转换:平均场游戏方法》,《公牛经济研究》,67,3,289-302(2015)·Zbl 1406.91112号 ·doi:10.1111/boer.12024
[7] Briani A,Cardaliaguet P(2018)潜在平均场博弈系统中的稳定解。非线性Differ Equ Appl NoDEA 25(1)。doi:10.1007/s00030-017-0493-3·Zbl 1390.35365号
[8] Cardaliaguet P(2013)《平均场比赛笔记》(摘自法国大学P.-L.狮子讲座)。https://www.ceremade.dauphine.fr/cardaliaguet/MFG20130420.pdf
[9] Cardaliaguet P,Hadikhanloo S(2017)《平均场游戏中的学习:虚拟游戏》。ESAIM控制优化计算变量23(2):569-591。doi:10.1051/cocv/201604·Zbl 1365.35183号
[10] Carmona R,Delarue F(2018a)平均场博弈的概率论及其应用I:平均场FBSDE、控制和博弈,概率论和随机建模,第83卷。施普林格国际出版公司。doi:10.1007/978-3-319-58920-6·Zbl 1422.91014号
[11] Carmona R,Delarue F(2018b)《平均场博弈的概率论及其应用II:具有常见噪声和主方程的平均场博弈》,《概率论与随机建模》,第84卷。施普林格国际出版社。数字对象标识代码:10.1007/978-3-319-56436-4·兹比尔1422.91015
[12] 卡莫纳,R。;Wang,P.,扩展有限状态平均场对策的概率方法,Math Oper Res,46,2471-502(2021)·Zbl 1468.49043号 ·doi:10.1287/门2020.1071
[13] 切钦,A。;Fischer,M.,有限状态平均场博弈的概率方法,应用数学优化(2018)·Zbl 1434.60198号 ·doi:10.1007/s00245-018-9488-7
[14] Deimling K(1992)多值微分方程,非线性分析与应用中的de Gruyter级数,第1卷。Walter de Gruyter&Co.,柏林,ISBN 3-11-013212-5·Zbl 0760.34002号
[15] Doncel,J。;加斯特,N。;Gaujal,B.,离散平均场对策:平衡点和收敛的存在性,J Dyn对策,6,3,221-239(2019)·Zbl 1425.91040号 ·doi:10.3934/jdg.2019016
[16] Filippov AF(1988)《不连续右手边微分方程》,《数学及其应用》,第18卷。施普林格荷兰,多德雷赫特。doi:10.1007/978-94-015-7793-9·Zbl 0664.34001号
[17] Fudenberg D,Levine DK(1998)《游戏中的学习理论》,麻省理工学院经济学习和社会进化新闻系列,第2卷。麻省理工学院出版社,剑桥,ISBN 978-0-262-06194-0·Zbl 0939.91004号
[18] Gomes DA,Mohr J,Souza RR(2013)连续时间有限状态平均场博弈。应用数学优化68(1):99-143。doi:10.1007/s00245-013-9202-8·Zbl 1283.91016号
[19] 戈麦斯,D。;维略,RM;Wolfram,M-T,有限状态平均场博弈的社会经济应用,Philos Trans R Soc A,37220130405(2014)·Zbl 1353.91015号 ·doi:10.1098/rsta.2013.0405
[20] Guo X,Hernández-Lerma O(2009)连续时间马尔可夫决策过程:理论与应用,随机建模与应用概率,第62卷。柏林施普林格,ISBN 978-3-642-26072-8·Zbl 1209.90002号
[21] 郭X,胡A,徐R,张J(2019)学习平均场比赛。收录:Wallach H、Larochelle H、Beygelzimer A、d'AlchéBuc F、Fox E、Garnett R(eds)神经信息处理系统进展,第32卷
[22] Hadikhanloo S(2017)在匿名非原子游戏中学习,并应用于一阶平均场游戏。预印arXiv:1704.00378·Zbl 1365.35183号
[23] Hadikhanloo S(2018)在平均场比赛中学习。巴黎多芬大学博士论文。http://www.cmap.poltetechnique.fr网址/saeed.hadikhanloo/PhD_Thesis.pdf·Zbl 1365.35183号
[24] 赫希集团,MW;Smale,S.,微分方程、动力系统和线性代数。纯数学和应用数学。《一系列专著和教科书》(1974年),奥兰多:学术出版社·Zbl 0309.34001号
[25] 霍夫鲍尔,J。;桑德霍姆,WH,《稳定博弈及其动力学》,《经济理论杂志》,144,41665-1693(2009)·Zbl 1175.91036号 ·doi:10.1016/j.jet.2009.01.007
[26] Huang M,MalhaméRP,Caines PE(2006)大种群随机动态博弈:闭环McKean-Vlasov系统和Nash确定性等价原理。公共信息系统6(3):221-252。https://projecteuclid.org/euclid.cis/1183728987 ·Zbl 1136.91349号
[27] Kolokoltsov VN(2010)《非线性马尔可夫过程和动力学方程》,剑桥数学丛书,第182卷。剑桥大学出版社,剑桥,ISBN 978-0-521-11184-3·Zbl 1222.60003号
[28] 科洛科尔佐夫,VN;Bensoussan,A.,《网络安全中僵尸网络防御的Mean-field-game模型》,Appl Math Optim,74,3,669-692(2016)·Zbl 1372.49049号 ·doi:10.1007/s00245-016-9389-6
[29] 科洛科尔佐夫,VN;Malafeyev,OA,Mean-field-game腐败模型,Dyn Games Appl,7,1,34-47(2017)·Zbl 1391.91030号 ·doi:10.1007/s13235-015-0175-x
[30] 科洛科尔佐夫,VN;Malafeyev,OA,《腐败与僵尸网络防御:平均场博弈方法》,《国际J博弈论》,47,977-999(2018)·Zbl 1417.91074号 ·doi:10.1007/s00182-018-0614-1
[31] Lasry J-M,《狮子队P-L》(2007),平均场比赛。Jpn J数学2(1):229-260。doi:10.1007/s11537-007-0657-8·Zbl 1156.91321号
[32] Lauriére M,Perrin S,Geist M,Pietquin O(2022)《学习平均田赛:一项调查》。arXiv公司:2205.12944
[33] 洛格曼,H。;Ryan,EP,常微分方程:分析、定性理论和控制(2014),伦敦:施普林格,伦敦·Zbl 1300.34001号 ·doi:10.1007/978-1-4471-6398-5
[34] Marden,JR,《基于国家的潜在游戏》,Automatica,48,12,3075-3088(2012)·Zbl 1255.93012号 ·doi:10.1016/j.automatica.2012.08.037
[35] 马斯金,E。;Tirole,J.,《马尔可夫完全均衡:I.可观测作用》,《经济理论杂志》,100,2,191-219(2001)·Zbl 1011.91022号 ·doi:10.1006/jeth.2000.2785
[36] Mouzouni,C.,《关于准静态平均场博弈模型》,应用数学优化(2018)·Zbl 1440.35328号 ·doi:10.1007/s00245-018-9484-y
[37] Nachbar J(2009)游戏中的学习。收录:Meyers RA(ed)复杂性和系统科学百科全书。纽约州施普林格,第5177-5187页。doi:10.1007/978-0-387-30440-3_307·Zbl 1171.93001号
[38] Neumann BA(2019)具有有限状态和作用空间的平均场对策的平稳平衡:存在性、计算、稳定性和短视调整过程。汉堡大学博士论文。https://ediss.sub.uni-hamburg.de/volltexte/2020/10313/
[39] Neumann,BA,有限状态和作用空间平均场对策的平稳平衡,Dyn games Appl,10845-871(2020)·Zbl 1457.91061号 ·doi:10.1007/s13235-019-00345-9
[40] Neumann,BA,有限状态空间非线性马尔可夫链:不变分布和长期行为,《应用概率杂志》,60,1,30-44(2023)·Zbl 1515.60260号 ·doi:10.1017/jpr.2022.23
[41] Perrin S、Perolat J、Laurière M、Geist M、Elie R、Pietquin O(2020)《平均场游戏的虚拟游戏:连续时间分析和应用》。收录:Larochelle H、Ranzato M、Hadsell R、Balcan MF、Lin H(eds)《神经信息处理系统进展》,第33卷
[42] 桑德霍姆,WH,人口博弈与进化动力学。《经济学习与社会进化》(2010),剑桥:麻省理工学院出版社,剑桥·Zbl 1208.91003号
[43] Sandholm,WH,进化博弈动力学下严格均衡的局部稳定性,J Dyn Games,1,3485-495(2014)·Zbl 1332.91025号 ·doi:10.3934/jdg.2014.1.485
[44] Sandholm WH(2015)人口博弈与确定性进化动力学,第13章。摘自:Young HP,Zamir S(eds)《经济学应用博弈论手册》,第4卷。Elsevier,第703-778页。doi:10.1016/B978-0-444-53766-9.00013-6
[45] Zusai D(2020)《进化动力学的收获:联系静态和动态稳定性的统一直观方法》。arXiv:1805.04898版本7
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。