×

通过深度学习解决Kolmogorov PDE。 (英语) Zbl 1490.65006号

摘要:随机微分方程(SDEs)和与其相关的Kolmogorov偏微分方程(PDEs)已广泛应用于工程、金融和自然科学的模型中。特别是,SDE和Kolmogorov PDE分别在金融衍生品近似定价模型中得到了高度应用。Kolmogorov偏微分方程和SDE通常无法明确求解,设计和分析能够分别近似求解Kolmogoriv偏微分方程与SDE的数值方法一直是并且仍然是一个活跃的研究课题。文献中几乎所有Kolmogorov偏微分方程的近似方法都受到维数诅咒的影响,或者只提供了在单个固定时空点上偏微分方程解的近似。本文推导并提出了一种数值逼近方法,旨在克服上述两个缺点,并打算在整个区域([a,b]^d)上对Kolmogorov PDE进行数值逼近,而不受维数诅咒的影响。热方程、Black-Scholes模型、随机Lorenz方程和Heston模型等算例的数值结果表明,所提出的近似算法在高维上无论在精度还是速度上都非常有效。

MSC公司:

65立方米 随机微分和积分方程的数值解
35卢比60 随机偏微分方程的偏微分方程
60 H10型 随机常微分方程(随机分析方面)
62M45型 神经网络及从随机过程推断的相关方法
68T07型 人工神经网络与深度学习
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Alfonsi,A.,关于CIR(和贝塞尔平方)过程的离散化方案,Monte Carlo方法应用。,11, 4, 355-384 (2005) ·Zbl 1100.65007号 ·doi:10.1515/156939605777438569
[2] 呼吸暂停,CD;Border,KC,《无限维度分析:搭便车指南》(2006),柏林:施普林格出版社,柏林·Zbl 1156.46001号
[3] Bach,F.,Moulines,E.:收敛速度为(O({1}/{n})的非严格凸光滑随机逼近。摘自:《神经信息处理系统进展》,第773-781页(2013年)
[4] Beck,C.,Jentzen,A.,Kuckuck,B.:深度神经网络训练的全面误差分析。arXiv:1910.00121(2019)
[5] 贝克尔,S。;切里迪托,P。;Jentzen,A.,深度最佳停车,J.Mach。学习。第20、74、25号决议(2019年)·Zbl 1495.60029号
[6] 贝尔曼,RE,《动态编程》(1957),普林斯顿:普林斯顿大学出版社,普林斯顿·Zbl 0077.13605号
[7] Bercu,B.,Fort,J.-C.:通用随机梯度法。摘自:《威利运筹学与管理科学百科全书》,第1-8页(2011年)
[8] 伯纳,J。;Grohs,P。;Jentzen,A.,《泛化误差分析:深度人工神经网络的经验风险最小化克服了Black-Scholes偏微分方程数值逼近中的维数灾难》,SIAM J.Math。数据科学。,2, 3, 631-657 (2020) ·Zbl 1480.60191号 ·doi:10.1137/19M125649X
[9] Bishop,CM,模式识别和机器学习。信息科学与统计(2006),纽约:Springer,纽约·Zbl 1107.68072号
[10] Bölcskei,H。;Grohs,P。;Kutyniok,G。;Petersen,P.,稀疏连接深度神经网络的最佳逼近,SIAM J.Math。数据科学。,1, 1, 8-45 (2019) ·Zbl 1499.41029号 ·doi:10.1137/18M118709X
[11] MJ Brennan;Schwartz,ES,《未定权益定价中的有限差分方法和跳跃过程:综合》,J.Financ。数量。分析。,13, 3, 461-474 (1978) ·doi:10.2307/2330152
[12] Brenner,S。;Scott,R.,《有限元方法的数学理论》(2007),柏林:施普林格,柏林
[13] 新罕布什尔州Chau,El.Moulines。,Rásonyi,M.,Sabanis,S.,Zhang,Y.:关于具有相依数据流的随机梯度Langevin动力学:完全非凸情况。arXiv:1905.13142(2019)·Zbl 1475.60156号
[14] Cox,S.、Hutzenthaler,M.、Jentzen,A.地方:非线性随机微分方程初值的Lipschitz连续性和强完备性。arXiv:1309.5595(2013)。已在内存中接受。美国数学。Soc公司
[15] Cucker,F。;Smale,S.,《学习的数学基础》,布尔。美国数学。Soc.(N.S.),39,1,1-49(2002)·Zbl 0983.68162号 ·doi:10.1090/S0273-0979-01-00923-5
[16] 德里奇,S。;Müller-Gronbach,T.,Robbins-Monro和Polyak-Ruppert型随机近似算法的一般多级自适应,Numer。数学。,142, 2, 279-328 (2019) ·Zbl 1464.62366号 ·doi:10.1007/s00211-019-01024-y
[17] Fehrman,B。;Gess,B。;Jentzen,A.,非凸目标函数随机梯度下降法的收敛速度,J.Mach。学习。决议,21,136,48(2020年)·Zbl 1520.68143号
[18] Fujii,M。;高桥,A。;Takahashi,M.,《渐进扩展作为高维BSDEs深度学习方法的先验知识》,亚洲-太平洋。财务。作记号。,26, 3, 391-408 (2019) ·Zbl 1422.91694号 ·doi:10.1007/s10690-019-09271-7
[19] Giles,MB,多级蒙特卡罗路径模拟,Oper。研究,56,3,607-617(2008)·Zbl 1167.65316号 ·doi:10.1287/opre.1070.0496
[20] Glrot,X.,Bengio,Y.:理解训练深度前馈神经网络的困难。摘自:《第十三届国际人工智能与统计会议记录》,第249-256页(2010年)
[21] Golub,生长激素;Van Loan,CF,《矩阵计算》,《约翰·霍普金斯数学科学研究》(2013),巴尔的摩:约翰·霍普金斯大学出版社,巴尔的摩尔·兹比尔1268.65037
[22] Graham,C.,Talay,D.:随机模拟和蒙特卡罗方法,《随机建模和应用概率》第68卷。施普林格,海德堡(2013)。随机模拟的数学基础·Zbl 1281.65003号
[23] Grohs,P.,Hornung,F.,Jentzen,A.,von Wursemberger,P.A.:证明人工神经网络在Black-Scholes偏微分方程的数值逼近中克服了维数灾难。arXiv:1809.02362(2018)。以备忘录形式接受。美国数学。Soc公司
[24] Grohs,P.,Hornung,F.,Jentzen,A.,Zimmermann,P.:微分方程深度神经网络近似的时空误差估计。arXiv:1908.03833(2019)
[25] Grohs,P.,Perekrestenko,D.,Elbrächter,D.,Bölcskei,H.深度神经网络近似理论。arXiv:1901.02220(2019)·Zbl 1473.68178号
[26] Györfi,L。;科勒,M。;Krzyżak,A。;Walk,H.,非参数回归的无分布理论。Springer统计学系列(2002),纽约:Springer,纽约·Zbl 1021.62024号 ·数字对象标识代码:10.1007/b97848
[27] 海尔,M。;Hutzenthaler,M。;Jentzen,A.,Kolmogorov方程的正则性损失,Ann.Probab。,43, 2, 468-527 (2015) ·Zbl 1322.35083号 ·doi:10.1214/13-AOP838
[28] Han,J.,Jentzen,A.,E,W.:使用深度学习解决高维偏微分方程。程序。国家。阿卡德。科学。美国115(34),8505-8510(2018)·Zbl 1416.35137号
[29] Hefter,M。;Herzwurm,A.,Cox-Ingersoll-Ross过程的强收敛速度-全参数范围,J.Math。分析。申请。,459, 2, 1079-1101 (2018) ·Zbl 1388.60117号 ·doi:10.1016/j.jmaa.2017.10.076
[30] Henry-Laborder,P.:BSDEs的深原对偶算法:机器学习在CVA和IM中的应用。SSRN电子。J.(2017)。SSRN提供:https://ssrn.com/abstract=3071506
[31] Hörmander,L.,亚椭圆二阶微分方程,数学学报。,119, 147-171 (1967) ·Zbl 0156.10701号 ·doi:10.1007/BF02392081
[32] Hutzenthaler,M.,Jentzen,A.:具有非全局Lipschitz连续系数的随机微分方程的数值逼近。内存。美国数学。Soc.2361112,v+99(2015)·Zbl 1330.60084号
[33] Hutzenthaler,M。;Jentzen,A。;Kloeden,PE,非全局Lipschitz连续系数SDE显式数值方法的强收敛性,Ann.Appl。概率。,22, 4, 1611-1641 (2012) ·Zbl 1256.65003号 ·doi:10.1214/11-AAP803
[34] Hutzenthaler,M。;Jentzen,A。;Salimova,D.,随机Kuramoto Sivashinsky方程的全离散非线性截断加速指数Euler型近似的强收敛性,Commun。数学。科学。,16, 6, 1489-1529 (2018) ·Zbl 1406.60102号 ·doi:10.4310/CMS.2018.v16.n6.a2
[35] Hutzenthaler,M。;Jentzen,A。;Wang,X.,非线性随机微分方程数值逼近过程的指数可积性,数学。计算。,87, 311, 1353-1413 (2018) ·Zbl 1432.65011号 ·doi:10.1090/mcom/3146
[36] Ioffe,S.,Szegedy,C.:批量规范化:通过减少内部协变量的转移来加速深层网络训练。arXiv:1502.03167(2015)
[37] Jentzen,A。;von Wurstemberger,P.,随机梯度下降优化算法的误差下限:缓慢和快速衰减学习速率的快速收敛速度,J.复杂性,57,101438,16(2020)·Zbl 1433.68353号 ·doi:10.1016/j.jco.2019.101438
[38] Jentzen,A.,Welti,T.:通过随机初始化的随机梯度下降对深度神经网络进行训练的总体误差分析。arXiv:2003.01291(2020)
[39] Kingma,D.,Ba,J.:亚当:一种随机优化方法。国际学习代表大会(ICLR)会议记录(2015年)
[40] Klenke,A.:概率论。Universitext,第二版。施普林格,伦敦(2014)。综合课程·Zbl 1295.60001号
[41] 科洛登,PE;Platen,E.,《随机微分方程的数值解》,《数学应用》第23卷(纽约)(1992年),柏林:施普林格出版社,柏林·Zbl 0752.60043号 ·doi:10.1007/978-3-662-12616-5
[42] 科洛登,PE;Platen,E。;Schurz,H.,《通过计算机实验对SDE进行数值求解》(2012),柏林:施普林格出版社,柏林·Zbl 0789.65100号
[43] Kushner,HJ,扩散和条件扩散过程密度的Kolmogorov方程弱解的有限差分方法,J.Math。分析。申请。,53, 2, 251-265 (1976) ·Zbl 0329.65059号 ·doi:10.1016/0022-247X(76)90109-8
[44] Kutyniok,G.,Petersen,P.,Raslan,M.,Schneider,R.:深度神经网络和参数PDE的理论分析。arXiv:1904.00377(2019)
[45] 雷,Y。;胡,T。;李·G。;Tang,K.,无边界梯度假设非凸学习的随机梯度下降,IEEE Trans。神经网络。学习。系统。,31, 10, 4394-4400 (2020) ·doi:10.109/TNNLS.2019.2952219
[46] Maruyama,G.,连续马尔可夫过程和随机方程,Rend。循环。马特·巴勒莫,2,4,48-90(1955)·兹比尔0053.40901 ·doi:10.1007/BF02846028
[47] Massart,P.:《浓度不等式与模型选择》,数学课堂讲稿第1896卷。施普林格,柏林(2007)。2003年7月6日至23日在圣弗洛尔举行的第33届概率论暑期学校讲座。Jean Picard的前言
[48] 米尔斯坦,G.N.:《随机微分方程的数值积分》,《数学及其应用》第313卷。Kluwer学术出版集团,Dordrecht(1995)。翻译和修订自1988年俄文原件·Zbl 0682.60045号
[49] 米尔斯坦,GN;Tretyakov,MV,《数学物理随机数值》,科学计算(2004),柏林:施普林格出版社,柏林·Zbl 1085.60004号 ·doi:10.1007/978-3-662-10063-9
[50] 米尔斯坦,GN;Tretyakov,MV,非全局Lipschitz系数随机微分方程的数值积分,SIAM J.Numer。分析。,43, 3, 1139-1154 (2005) ·Zbl 1102.60059号 ·数字对象标识代码:10.1137/040612026
[51] Müller-Gronbach,T.,Ritter,K.:随机微分方程强近似和弱近似的最小误差。摘自:蒙特卡罗和准蒙特卡罗方法2006,第53-82页。2008年柏林施普林格·Zbl 1140.65305号
[52] Øksendal,B.:随机微分方程,Universitext,第6版。施普林格,柏林(2003)。应用程序简介·Zbl 1025.60026号
[53] 罗杰斯,L.C.G.,威廉姆斯,D.:扩散,马尔可夫过程和鞅。第2卷。剑桥数学图书馆。剑桥大学出版社,剑桥(2000)。《微积分》,第二版(1994年)再版·兹比尔0949.60003
[54] Ruder,S.:梯度下降优化算法概述。arXiv:1609.04747(2016)
[55] Sabanis,S.,关于驯服欧拉近似的注释,电子。Commun公司。概率。,18, 47, 10 (2013) ·Zbl 1329.60237号
[56] Sabanis,S.,变系数欧拉近似:超线性增长扩散系数的情况,Ann.Appl。可能性。,26, 4, 2083-2105 (2016) ·Zbl 1352.60101号 ·doi:10.1214/15-AAP1140
[57] 沙列夫·施瓦茨,S。;Ben-David,S.,《理解机器学习:从理论到算法》(2014),剑桥:剑桥大学出版社,剑桥·Zbl 1305.68005号 ·doi:10.1017/CBO9781107298019
[58] E、 W.,Han,J.,Jentzen,A.:基于深度学习的高维抛物型偏微分方程和倒向随机微分方程数值方法。Commun公司。数学。Stat.5(4),349-380(2017)·兹比尔1382.65016
[59] E、 W.,Yu,B.:深度Ritz方法:一种基于深度学习的求解变分问题的数值算法。Commun公司。数学。统计数据6(1),1-12(2018)·Zbl 1392.35306号
[60] 赵,J。;戴维森,M。;Corless,RM,美国期权定价的紧凑有限差分法,J.Compute。申请。数学。,206, 1, 306-321 (2007) ·Zbl 1151.91552号 ·doi:10.1016/j.cam.2006.07.006
[61] 齐恩基维茨,OC;RL泰勒;齐恩基维茨,OC;Taylor,RL,《有限元法》(1977),伦敦:McGraw-Hill出版社,伦敦·Zbl 0991.74002号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。