×

McKean-Vlasov过程不变量测度的经验近似:平均场相互作用与自相互作用。 (英语) Zbl 1517.60006号

众所周知,McKean-Vlasov过程是一个由随机微分方程(SDE)描述的随机过程,其系数取决于解的分布。因此,它不是通常意义上的马尔可夫过程。该方程通常被称为McKean-Vlasov SDE或平均场SDE,由具有平均场相互作用的粒子系统的“混沌传播”推导而来。本文考虑了McKean-Vlasov过程的以下问题:McKean-Volasov过程的不变测度能否以及如何用过程本身或其他过程的经验测度来近似。证明了在单调性条件下,McKean-Vlasov过程的不变概率测度可以用某些过程(包括其自身)的加权经验测度来近似。本文的主要贡献是为设计在线算法来评估一类McKean-Vlasov过程的不变测度奠定了理论基础。经验近似克服了经典混沌传播的两个不足。首先,当时间趋于无穷大时,提供了一个无偏近似,即使一条轨迹也足以计算近似测度。其次,该算法允许充分利用历史信息。在某种程度上,作者通过承认时间平均值和空间平均值之间的等价性来计算无限采样路径。此外,与“混沌传播”相比,本文还介绍了作者的方法的优点,并与该领域的先前结果和类似算法进行了比较。

MSC公司:

60B05型 拓扑空间上的概率测度
60J60型 扩散过程
60 H10型 随机常微分方程(随机分析方面)
60华氏35 随机方程的计算方法(随机分析方面)
60F99型 概率论中的极限定理
60F05型 中心极限和其他弱定理
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] 艾哈迈德,N.U.和丁,X.(1993)。关于非线性马尔可夫过程的不变测度。J.应用。数学。斯托克。分析。6 385-406. 10.1155/S1048953393000310·Zbl 0806.60046号
[2] AlRachid,H.、Bossy,M.、Ricci,C.和Szpruch,L.(2019年)。遍历McKean-Vlasov SDE的新粒子表示。CEMRACS 2017-随机模型的数值方法:控制、不确定性量化、平均场.ESAIM程序。调查65 68-83. Les Ulis:EDP科学。10.1051/proc/201965068·Zbl 1418.65006号
[3] Ambrosio,L.、Stra,F.和Trevisan,D.(2019年)。二维匹配问题的PDE方法。普罗巴伯。理论相关领域173 433-477. 2007年10月7日/00440-018-0837-x·Zbl 1480.60017号
[4] Bao,J.、Scheutzow,M.和Yuan,C.(2022)。函数McKean-Vlasov SDE的不变概率测度的存在性。电子。J.遗嘱认证。27第43、14号论文。10.1214/22-ejp773·Zbl 1487.60144号
[5] Benachour,S.、Roynette,B.和Vallois,P.(1998年)。非线性自稳定过程。二、。收敛到不变概率。随机过程。申请。75 203-224. 10.1016/S0304-4149(98)00019-2·Zbl 0932.60064号
[6] 贝纳伊姆,m.、勒杜,m.和雷蒙德,O.(2002)。自交互扩散。普罗巴伯。理论相关领域122 1-41. 2007年10月7日/004400100161·Zbl 1042.60060号
[7] Birkhoff,G.D.(1931年)。遍历定理的证明。程序。国家。阿卡德。科学。美国17 656-660。
[8] Bogachev,V.I.、Röckner,M.和Shaposhnikov,S.V.(2019年)。非线性Fokker-Planck-Kolmogorov方程解的平稳分布收敛性。数学杂志。科学。(纽约)242 69-84. 2007年10月10日/10958-019-04467-8·Zbl 1431.35208号
[9] Boissard,E.和Le Gouic,T.(2014)。关于Wasserstein距离中经验测度和占领测度的平均收敛速度。亨利·彭加雷·普罗巴布(Henri PoincaréProbab)安·Inst。统计。50 539-563. 10.1214/12-AIHP517·兹比尔1294.60005
[10] Buckdahn,R.、Li,J.、Peng,S.和Rainer,C.(2017)。平均场随机微分方程和相关的偏微分方程。安·普罗巴伯。45 824-878. 10.1214/15-AOP1076·Zbl 1402.60070号
[11] Carmona,R.和Delarue,F.(2018年)。平均场对策的概率理论及其应用I-II施普林格·Zbl 1422.91015号
[12] Carrillo,J.A.、McCann,R.J.和Villani,C.(2003)。颗粒介质的动力学平衡速率和相关方程:熵耗散和质量输运估计。马特·伊贝罗姆(Mat.Iberoam)版本。19 971-1018. 10.4171/RMI/376·兹比尔1073.35127
[13] Da Prato,G.和Zabczyk,J.(1996年)。无限维系统的遍历性.伦敦数学学会讲座笔记系列229.剑桥:剑桥大学出版社。10.1017/CBO9780511662829·Zbl 0849.60052号
[14] Dawson,D.A.(1983年)。合作行为平均场模型的临界动力学和波动。《统计物理学杂志》。31 29-85. 2007年10月10日/BF01010922
[15] Driver,R.D.(2012年)。常微分方程和时滞微分方程20.施普林格科技与商业媒体。
[16] Durrett,R.T.和Rogers,L.C.G.(1992年)。布朗聚合物的渐近行为。普罗巴伯。理论相关领域92 337-349. 2007年10月10日/BF01300560·Zbl 0767.60080号
[17] Eberle,A.、Guillin,A.和Zimmer,R.(2019年)。扩散和McKean-Vlasov过程的定量Harris型定理。事务处理。阿默尔。数学。Soc公司。371 7135-7173. 10.1090/tran/7576·Zbl 1481.60154号
[18] Fournier,N.和Guillin,A.(2015)。关于经验测度的Wasserstein距离的收敛速度。普罗巴伯。理论相关领域162 707-738. 10.1007/s00440-014-0583-7·Zbl 1325.60042号
[19] Giné,E.和Zinn,J.(1984)。经验过程的一些极限定理。安·普罗巴伯。12 929-998. 经过讨论·Zbl 0553.60037号
[20] Gu,H.,Guo,X.,Wei,X.和Xu,R.(2021)。平均场多智能体强化学习:一种分散网络方法。arXiv预打印arXiv:2108.02731。
[21] Hammersley,W.R.P.,Šiška,D.和Szpruch,Ł。(2021). 基于测量的Lyapunov条件下的McKean-Vlasov SDE。亨利·彭加雷·普罗巴布(Henri PoincaréProbab)安·Inst。统计。57 1032-1057. 10.1214/20-aihp1106·Zbl 1489.60099号
[22] Hernández-Lerma,O.和Lasserre,J.B.(2012)。马尔可夫链与不变概率211.Birkhä用户。10.1007/978-3-0348-8024-4
[23] Herrmann,S.和Tugaut,J.(2010)。自稳定过程平稳测度的非唯一性。随机过程。申请。120 1215-1246. 2016年10月10日/j.spa.2010.03.009·Zbl 1197.60052号
[24] Horowitz,J.和Karandikar,R.L.(1994年)。Wasserstein度量中经验度量的平均收敛速度。J.计算。申请。数学。55 261-273. 10.1016/0377-0427(94)90033-7 ·Zbl 0819.60031号
[25] Huang,X.、Röckner,M.和Wang,F.-Y.(2019年)。路径空间和路径分布相关SDE上概率测度的非线性Fokker-Planck方程。离散连续。动态。系统。39 3017-3035. 10.3934/cds.2019125·Zbl 1417.60056号
[26] Kac,M.(1956年)。动力学理论基础。第三届伯克利数理统计与概率研讨会论文集,1954-1955年,第三卷171-197. 加州伯克利-洛杉矶:加州大学出版社·Zbl 0072.42802号
[27] Kleptsyn,V.和Kurtzmann,A.(2012年)。自吸引运动的遍历性。电子。J.遗嘱认证。17编号50、37。10.1214/EJP.v17-2121版·Zbl 1261.60093号
[28] Lamberton,D.和Pagès,G.(2002年)。扩散不变分布的递归计算。伯努利8 367-405. 10.1142/S0219493703000838·Zbl 1006.60074号
[29] Lasry,J.-M.和Lions,P.-L.(2007)。平均场比赛。日本。数学杂志。2 229-260. 2007年10月17日/11537-007-0657-8·Zbl 1156.91321号
[30] Liu,W.,Wu,L.和Zhang,C.(2021)。与McKean-Vlasov方程相关的平均场相互作用粒子系统的长时间行为。公共数学。物理学。387 179-214. 2007年10月7日/0200220-021-04198-5·Zbl 1475.60128号
[31] McKean,H.P.Jr.(1966年)。与非线性抛物方程相关的一类马尔可夫过程。程序。国家。阿卡德。科学。美国56 1907-1911年。10.1073/pnas.56.6.1907·Zbl 0149.13501号
[32] Mehri,S.、Scheutzow,M.、Stannat,W.和Zangeneh,B.Z.(2020年)。跳跃扩散驱动的具有延迟的随机空间结构神经元网络的混沌传播。附录申请。普罗巴伯。30 175-207. 10.1214/19-AAP1499·Zbl 1434.60299号
[33] Mishura,Y.和Veretennikov,A.(2020年)。McKean-Vlasov随机方程解的存在唯一性定理。理论问题。数学。统计人员。103 59-101之间。10.1090/tpms/1135·Zbl 1482.60079号
[34] Pemantle,R.(2007)。钢筋随机过程的调查。普罗巴伯。Surv公司。4 1-79. 2014年7月10日-PS094·Zbl 1189.60138号
[35] Prévót,C.和Röckner,M.(2007年)。随机偏微分方程简明教程.数学课堂笔记。1905.柏林:斯普林格·Zbl 1123.60001号
[36] Ren,P.和Wang,F.-Y.(2021年)。McKean-Vlasov SDE的熵和Wasserstein指数收敛性。非线性分析。206论文编号112259,20。10.1016/j.na.2021.112259·Zbl 1458.60014号
[37] Riekert,A.(2022)。对偶距离和Wasserstein距离中Markov链经验测度的收敛速度。统计师。普罗巴伯。莱特。189论文编号109605,8。2016年10月10日/j.spl.2022.109605·Zbl 1496.60005号
[38] Sharrock,L.、Kantas,N.、Parpas,P.和Pavliotis,G.A.(2021年)。McKean-Vlasov随机微分方程的参数估计。arXiv预打印arXiv:2106.13751。
[39] Spitzer,F.(1991)。马尔可夫过程的相互作用。随机行走、布朗运动和相互作用粒子系统66-110. 斯普林格。
[40] Sznitman,A.-S.(1991)。混沌传播的主题。圣弗朗西斯科概率研究所XIX-1989.数学课堂笔记。1464 165-251. 柏林:斯普林格。2007年10月10日/BFb0085169·Zbl 0732.60114号
[41] Touboul,J.(2014)。神经场中混沌的传播。附录申请。普罗巴伯。24 1298-1328. 10.1214/13-AAP950·Zbl 1305.60107号
[42] Veretennikov,A.Y.(2006年)。McKean-Vlasov随机方程的遍历测度。2004年蒙特卡罗和准蒙特卡罗方法471-486中。柏林:斯普林格。10.1007/3-540-31186-6_29 ·Zbl 1098.60056号
[43] Villani,C.(2009年)。最佳交通:新旧.Grundlehren der Mathematischen Wissenschaften[数学科学基本原理]338.柏林:施普林格。10.1007/978-3-540-71050-9 ·Zbl 1156.53003号
[44] Wang,F.-Y(2018)。Landau型方程的分布相关SDE。随机过程。申请。128 595-621. 2016年10月10日/j.spa.2017.05.006·Zbl 1380.60077号
[45] Wang,F.-Y.(2021)。非耗散McKean-Vlasov SDE的指数遍历性。arXiv预打印arXiv:2101.12562。
[46] Wang,F.-Y.(2022)。非紧流形上经验测度的Wasserstein收敛速度。随机过程。申请。144 271-287. 2016年10月10日/j.spa.2021.11.006·Zbl 1480.58015号
[47] Wang,F.-Y.和Zhu,J.-X.(2019)。黎曼流形上扩散过程经验测度的Warsserstein距离极限定理。arXiv预打印arXiv:1906.03422。
[48] Yang,Y.,Luo,R.,Li,M.,Zhou,M.、Zhang,W.和Wang,J.(2018)。平均场多智能体强化学习。第35届机器学习国际会议论文集(J.Dy和A.Krause编辑)。机器学习研究进展80 5571-5580. PMLR。
[49] 张世清(2021)。分布相关SDE平稳分布的存在性和非唯一性。arXiv预打印arXiv:2105.04226
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。