×

平均场和稀疏区域中大型图上随机博弈的案例研究。 (英语) Zbl 1489.91017号

摘要:我们研究了一类线性二次随机微分对策,其中每个参与者只与给定图中的最近邻居直接交互。根据图的规范化拉普拉斯矩阵的经验特征值分布,我们找到了任何传递图的半显式马尔可夫均衡。这有助于各种图序列的大种群渐近性,并详细讨论了几个稀疏和稠密的例子。特别是,平均场对策只有在稠密图的情况下才是正确的极限,即当度在适当的意义上发散时。尽管平衡策略是非局部的,但根据所有参与者的行为,我们使用相关衰减估计来证明混沌在稠密和稀疏状态下的传播,稀疏情况是由于典型顶点之间的距离大。在不假设图是传递的情况下,我们还证明了平均场对策解可以用于在任何足够稠密的图序列上构造分散的近似均衡。

MSC公司:

91A15型 随机博弈,随机微分博弈
91A43型 涉及图形的游戏
93E20型 最优随机控制
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] [1] Basak A,Mukherjee S(2017),波茨模型平均场的普遍性。概率论相关领域168(3-4):557-600.谷歌学者交叉引用·兹比尔1369.60066 ·doi:10.1007/s00440-016-0718-0
[2] [2] Bhamidi S,Budhiraja A,Wu R(2019)非均匀随机图上的弱相互作用粒子系统。随机处理应用。129(6):2174-2206.谷歌学者交叉引用·Zbl 1455.60017号 ·doi:10.1016/j.spa.2018.06.014
[3] [3] Bordenav C,Lelarge M(2010)大型随机图的分解。随机结构算法37(3):332-352.Crossref,谷歌学者·Zbl 1209.05222号 ·doi:10.1002/rsa.20313
[4] [4] Boucheron S、Lugosi G、Massart P(2013)集中不等式:一个非渐近独立理论(英国牛津大学出版社)。Crossref,谷歌学者·Zbl 1337.60003号 ·doi:10.1093/acprof:oso/9780199535255.001.0001
[5] [5] Caines P,Huang M(2018)Graphon平均场游戏和GMFG方程。程序。2018年IEEE决策与控制会议(IEEE,纽约),4129-4134,谷歌学者
[6] [6] Capponi A、Sun X、Yao D(2020)银行间借贷的动态网络模型——系统风险和流动性拨备。数学。操作。物件。45(3):1127-1152.Link,谷歌学者·Zbl 1457.91406号
[7] [7] Cardaliaguet P、Delarue F、Lasry JM、Lions PL(2019年)平均场博弈中的主方程和收敛问题:(AMS-201),第201卷(普林斯顿大学出版社,新泽西州普林斯顿)。谷歌学者·Zbl 1430.91002号
[8] [8] Carmona R,Delarue F(2018年)平均场对策的概率理论及其应用I-II(纽约州施普林格)。Crossref,谷歌学者·Zbl 1422.91015号 ·数字对象标识代码:10.1007/978-3-319-56436-4
[9] [9] Carmona R、Fouque JP、Sun LH(2013)《平均场上比赛和系统风险》。预印本,8月9日提交,https://dx.doi.org/10.2139/ssrn.2307814.谷歌学者
[10] [10] Carmona R,Cooney D,Graves C,Lauriere M(2019)《随机图形游戏:I.静态案例》。11月25日提交的预印本,https://arxiv.org/abs/1911.10664谷歌学者
[11] [11] 钟F(1997)谱图论(美国数学学会,普罗维登斯,RI)。谷歌学者·Zbl 0867.05046号
[12] [12] Coppini F,Dietert H,Giacomin G(2019)erdös-rényi图上相互作用扩散的大数定律和大偏差。随机动力学20(2):2050010.谷歌学者·Zbl 1434.60279号
[13] [13] Delarue F(2017)《平均场游戏:Erdös-Renyi图上的玩具模型》。ESAIM程序。调查60:1-26.Crossref,谷歌学者·Zbl 1407.91054号 ·doi:10.1051/proc/201760001
[14] [14] Detering N,Fouque JP,Ichiba T(2019)定向链随机微分方程。随机处理应用。130(4):2519-2551.谷歌学者·Zbl 1457.60088号
[15] [15] 杜勒特R(2007)随机图动力学,第200卷(英国剑桥大学出版社)。谷歌学者
[16] [16] Feinstein Z,Sojmark A(2019)动态违约传染模型:从Eisenberg-Noe到平均场。预印本,于12月18日提交,https://arxiv.org/abs/1912.08695谷歌学者
[17] [17] Feng Y,Fouque JP,Ichiba T(2020)有向链网络上的线性二次随机微分对策。预印本,3月19日提交,https://arxiv.org/abs/2003.08840.谷歌学者
[18] [18] Fleming W,Soner H(2006)受控马尔可夫过程与粘度解,第25卷(Springer Science&Business Media,纽约)。谷歌学者·Zbl 1105.60005号
[19] [19] Gao S,Caines P(2017)通过图形极限控制线性系统的任意尺寸网络:初步研究。程序。IEEE第56届决策与控制年度会议(IEEE,纽约),1052-1057。谷歌学者
[20] [20] Gao S,Caines P(2018)线性系统任意尺寸网络的图-LQR控制。程序。第23届国际。交响乐。网络和系统数学理论MTNS-18(香港科技大学),120-127。谷歌学者
[21] [21]高S,Caines PE,Huang M(2020)LQG graphon mean field games。预印本,4月1日提交,https://arxiv.org/abs/2004.00679.谷歌学者
[22] [22]Godsil C,Royle G(2013)代数图论,第207卷(Springer Science&Business Media,纽约)。谷歌学者
[23] [23]Huang M,MalhaméR,Caines P(2006)大种群随机动态博弈:闭环McKean-Vlasov系统和Nash确定性等价原理。通信通知。系统6(3):221-252.Crosref,谷歌学者·Zbl 1136.91349号 ·doi:10.4310/CIS.2006版本n3.a5
[24] [24]杰克逊·M(2010)社会和经济网络(普林斯顿大学出版社,新泽西州普林斯顿)。Crossref,谷歌学者·兹比尔1203.91001 ·doi:10.2307/j.ctvcm4gh1
[25] [25]Kesten H(1959)群上的对称随机游动。事务处理。阿默尔。数学。Soc公司。92(2):336-354.Crossref,谷歌学者·Zbl 0092.33503号 ·doi:10.1090/S0002-9947-1959-0109367-6
[26] [26]Kim J,Sudakov B,Vu V(2002)关于随机正则图和随机图的不对称性。随机结构算法21(3-4):216-224.Crossref,谷歌学者·Zbl 1012.05143号 ·doi:10.1002/rsa.10054
[27] [27]Krylov N,Roeckner M(2005)具有奇异依赖时间漂移的随机方程的强解。概率论相关领域131(2):154-196.Crossref,谷歌学者·邮编1072.60050 ·doi:10.1007/s00440-004-0361-z
[28] [28]Lacker D,Ramanan K,Wu R(2019)相互作用扩散的大型稀疏网络。预印本,4月4日提交,https://arxiv.org/abs/1904.02585.谷歌学者
[29] [29]Lasry JM,Lions PL(2007)平均场比赛。日语J.数学。2(1):229-260.Crossref,谷歌学者·Zbl 1156.91321号 ·doi:10.1007/s11537-007-0657-8
[30] [30]Lovász L(2012)大型网络与图的极限,第60卷(美国数学学会,普罗维登斯,RI)。Crossref,谷歌学者·Zbl 1292.05001号 ·doi:10.1090/coll/060
[31] [31]McKay B(1981)大型正则图的期望特征值分布。线性代数应用。40:203-216.Crossref,谷歌学者·Zbl 0468.05039号 ·doi:10.1016/0024-3795(81)90150-6
[32] [32]梅德韦杰夫G(2014)稠密图上的非线性热方程和图极限。SIAM J.数学。分析。46(4):2743-2766.Crossref,谷歌学者·Zbl 1307.34062号 ·数字对象标识代码:10.1137/130943741
[33] [33]Nadtochiy S,Shkolnikov M(2018)网络上的平均场系统,通过命中时间进行奇异交互。预印本,7月5日提交,https://arxiv.org/abs/1807.02015.谷歌学者
[34] [34]Oliveira R,Reis G(2019)具有发散平均度的随机图上的相互扩散:流体动力学和大偏差。J.统计。物理。176(5):1057-1087.Crossref,谷歌学者·Zbl 1421.05081号 ·doi:10.1007/s10955-019-02332-1
[35] [35]Oliveira R,Reis G,Stolerman L(2018)稀疏图上的相互扩散:局部弱极限的流体力学。预印本,于12月31日提交,https://arxiv.org/abs/1812.11924.谷歌学者
[36] [36]Parise F,Ozdaglar A(2019)Graphon游戏。程序。2019年ACM经济大会。和计算。(纽约计算机协会),457-458谷歌学者
[37] [37]范H(2009)金融应用中的连续时间随机控制与优化,第61卷(Springer Science&Business Media,纽约)。Crossref,谷歌学者·Zbl 1165.93039号 ·数字对象标识代码:10.1007/978-3-540-89500-8
[38] [38]Reid W(1963)Riccati矩阵微分方程和相关线性微分系统的非振动准则。太平洋数学杂志。13(2):665-685.Crossref,谷歌学者·Zbl 0119.07401号 ·doi:10.2140/pjm.1963.13.665
[39] [39]van der Hofstad R(2016)《随机图和复杂网络》,第2卷。2021年2月22日访问,https://www.win.tue.nl/rhofstad/NotesRGCNII.pdf.谷歌学者
[40] [40]Vasal D,Mishra R,Vishwanath S(2020)石墨平均场博弈的序列分解。预印本,于年月日提交,https://arxiv.org/abs/2001.05633谷歌学者
[41] [41]Veretennikov A(1981)关于随机积分方程解的强解和显式公式。数学。苏联斯博尼克39:387-403.Crossref,谷歌学者·Zbl 0462.60063号 ·doi:10.1070/SM1981v039n03ABEH001522
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。