×

用高斯过程求解和学习非线性偏微分方程。 (英语) Zbl 07516428号

摘要:我们介绍了一个简单、严格和统一的框架,用于求解非线性偏微分方程(PDE),以及使用高斯过程框架求解涉及PDE中参数识别的反问题(IP)。提出的方法:(1)将配置核方法自然推广到非线性偏微分方程和微分方程;(2) 保证了一类非常一般的偏微分方程的收敛性,并配备了一条计算特定偏微分方程近似误差边界的路径;(3) 继承了稠密核矩阵线性求解器的最新计算复杂性。我们方法的主要思想是将给定PDE的解近似为高斯过程的最大后验(MAP)估计,条件是在有限个配置点处求解PDE。虽然这个优化问题是无限维的,但通过引入与配置点处解的导数值相对应的附加变量,可以将其简化为有限维的优化问题;这推广了高斯过程回归中的代表定理。简化优化问题具有受非线性约束的二次目标函数的形式;它是用高斯-纽顿方法的一种变体来求解的。由此产生的算法(a)可以解释为求解非线性偏微分方程的连续线性化,并且(b)在实践中发现,对于广泛的偏微分方程,在少量迭代(2到10)中收敛。大多数传统的IP方法将参数更新与PDE的数值解交织在一起;我们的算法同时求解参数解和PDE解。非线性椭圆偏微分方程、Burgers方程、正则化Eikonal方程和Darcy流渗透率识别IP的实验证明了该框架的有效性和适用范围。

MSC公司:

65立方厘米 概率方法,随机微分方程
68泰克 人工智能
62Gxx公司 非参数推理
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] 亚当斯,R.A。;Fournier,J.J.,Sobolev Spaces(2003),Elsevier·Zbl 1098.46001号
[2] 安德森,W。;Trapp,G.,Shorted运算符。二、 SIAM J.应用。数学。,28, 60-71 (1975) ·Zbl 0295.47032号
[3] 巴布什卡,I。;Osborn,J.,有限元方法能任意糟糕地执行吗?,数学。计算。,69, 443-462 (2000) ·Zbl 0940.65086号
[4] Bar-Sinai,Y。;霍耶,S。;希基,J。;Brenner,M.P.,学习偏微分方程的数据驱动离散化,Proc。国家。阿卡德。科学。,116, 15344-15349 (2019) ·Zbl 1431.65195号
[5] 巴塔查亚,K。;侯赛尼,B。;科瓦奇奇,N.B。;Stuart,A.M.,参数偏微分方程的模型简化和神经网络,SMAI J.Compute。数学。,7, 121-157 (2021) ·Zbl 1481.65260号
[6] Bogachev,V.I.,高斯测度(1998),美国数学学会·Zbl 0938.28010号
[7] Boncoraglio,G。;Farhat,C.,用于多学科分析和优化的主动流形和模型约简,(AIAA科学技术2021论坛(2021)),1694
[8] Brezis,H.,函数分析,Sobolev空间和偏微分方程(2010),Springer科学与商业媒体·Zbl 1218.46002号
[9] Calderhead,B。;Girolma,M。;Lawrence,N.D.,用高斯过程加速非线性微分方程的贝叶斯推断,(神经信息处理系统进展(2009)),217-224
[10] 陈,Y。;奥哈迪,H。;Stuart,A.,层次参数估计的经验贝叶斯和核流的一致性,数学。计算。(2021) ·Zbl 1472.62012年
[11] Cochocki,A。;Unbehauen,R.,《用于优化和信号处理的神经网络》(1993),John Wiley&Sons,Inc·Zbl 0824.68101号
[12] Cockayne,J。;奥茨,C。;T·沙利文。;Girolma,M.,PDE约束贝叶斯反问题的概率数值方法,AIP Conf.Proc。,1853年,第060001条pp.(2017)
[13] Cockayne,J。;Oates,C.J。;T·J·沙利文。;Girolma,M.,贝叶斯概率数值方法,SIAM Rev.,61756-789(2019)·Zbl 1451.65179号
[14] 科特,S.L。;Dashti,M。;Stuart,A.M.,偏微分方程的贝叶斯反问题逼近,SIAM J.Numer。分析。,48, 322-345 (2010) ·Zbl 1210.35284号
[15] 科特,S.L。;Roberts,G.O。;Stuart,A.M。;White,D.,MCMC函数方法:修改旧算法使其更快,Stat.Sci。,424-446 (2013) ·Zbl 1331.62132号
[16] Dashti,M。;法律,K.J。;Stuart,A.M。;Voss,J.,Bayesian非参数反问题中MAP估计及其一致性,逆问题。,29,第095017条pp.(2013)·兹比尔1281.62089
[17] Dashti,M。;Stuart,A.M.,《反问题的贝叶斯方法》,(Ghanem,R.;Higdon,D.;Owhadi,H.,《不确定性量化手册》(2016),施普林格国际出版公司),1-118
[18] Diaconis,P.,《贝叶斯数值分析》(Gupta,S.S.;Berger,J.,《统计决策理论及相关主题IV》(1988),Springer)·Zbl 0671.65117号
[19] 杰里丹,B。;Lygeros,J.,PDE解的神经近似:可达性计算的应用,(第45届IEEE决策与控制会议论文集(2006),IEEE),3034-3039
[20] 英国,H.W。;汉克,M。;Neubauer,A.,《反问题的正则化》,第375卷(1996),Springer Science&Business Media·兹比尔0859.65054
[21] 弗里德曼,J。;哈斯蒂,T。;Tibshirani,R.,《统计学习的要素》(2001),斯普林格出版社·Zbl 0973.62007号
[22] 古德费罗,I。;Y.本吉奥。;科尔维尔,A。;Bengio,Y.,《深度学习》,第1卷(2016),麻省理工出版社·Zbl 1373.68009号
[23] Han,J。;Jentzen,A。;Weinan,E.,使用深度学习求解高维偏微分方程,Proc。国家。阿卡德。科学。,115, 8505-8510 (2018) ·Zbl 1416.35137号
[24] He,K。;张,X。;任,S。;Sun,J.,图像识别的深度剩余学习,(IEEE计算机视觉和模式识别会议论文集(2016)),770-778
[25] Hennig,P。;奥斯本,医学硕士。;Giramia,M.,《概率数字与计算中的不确定性》,Proc。R.Soc.A,471,第20150142条,pp.(2015)·Zbl 1372.65010号
[26] Hinze,M。;皮诺,R。;Ulbrich,M。;Ulbrich,S.,《PDE约束下的优化》,第23卷(2008),Springer Science&Business Media·Zbl 1167.49001号
[27] Jacot,A。;加布里埃尔,F。;Hongler,C.,《神经切线核:神经网络中的收敛和泛化》,(第32届神经信息处理系统国际会议论文集(2018)),8580-8589
[28] 凯皮奥,J。;Somersalo,E.,《统计与计算反问题》,第160卷(2006年),Springer Science&Business Media
[29] 卡尼亚达基斯,G。;凯夫雷基迪斯,I。;卢,L。;佩迪卡里斯,P。;王,S。;Yang,L.,《基于物理的机器学习》,《自然科学评论》。(2021)
[30] Kimeldorf,G。;Wahba,G.,关于切比雪夫样条函数的一些结果,J.Math。分析。申请。,33, 82-95 (1971) ·Zbl 0201.39702号
[31] Kimeldorf,G.S。;Wahba,G.,《随机过程贝叶斯估计与样条曲线平滑之间的对应关系》,《数学年鉴》。Stat.,41,495-502(1970)·Zbl 0193.45201号
[32] Krischer,K。;Rico-Martínez,R。;凯夫雷基迪斯,I。;Rotermund,H。;Ertl,G。;Hudson,J.,时空变化催化反应的模型识别,AIChE J.,39,89-98(1993)
[33] 拉加里斯,I.E。;利卡斯,A.C。;Fotiadis,D.I.,求解常微分方程和偏微分方程的人工神经网络,IEEE Trans。神经网络。,9, 987-1000 (1998)
[34] 拉加里斯,I.E。;利卡斯,A.C。;Papageorgiou,D.G.,不规则边界边值问题的神经网络方法,IEEE Trans。神经网络。,11, 1041-1049 (2000)
[35] Larkin,F.M.,希尔伯特空间中的高斯测度及其在数值分析中的应用,J.Math。,2 (1972) ·Zbl 0258.65058号
[36] Li,Z。;科瓦奇奇,N。;Azizzadenesheli,K。;巴塔查亚,K。;Stuart,A。;Anandkumar,A.,参数偏微分方程的傅里叶神经算子(国际学习表征会议(2020))
[37] Li,Z。;科瓦奇奇,N。;Azizzadenesheli,K。;刘,B。;Stuart,A。;巴塔查亚,K。;Anandkumar,A.,参数偏微分方程的多极图神经算子,高级神经信息处理。系统。(2020)
[38] Liang,H。;Wu,H.,使用回归模型中测量误差框架的微分方程模型参数估计,美国统计协会,103,1570-1583(2008)·Zbl 1286.62039号
[39] 长,Z。;卢,Y。;马,X。;Dong,B.,PDE-net:从数据中学习PDE,(机器学习国际会议,机器学习国际大会,PMLR(2018)),3208-3216
[40] 米切利,C.A。;Rivlin,T.J.,《最佳采收率调查》(Michelli,C.;Rivlin.,T.J,《近似理论中的最佳估计》(1977),Springer),1-54·Zbl 0386.93045号
[41] 新罕布什尔州内尔森。;Stuart,A.M.,巴拿赫空间之间输入-输出映射的随机特征模型(2020),arXiv预印本
[42] Nocedal,J。;Wright,S.,《数值优化》(2006),Springer Science&Business Media·Zbl 1104.65059号
[43] Owhadi,H.,贝叶斯数值均匀化,多尺度模型。同时。,13, 812-828 (2015) ·兹比尔1322.35002
[44] Owhadi,H.,《分层信息游戏中粗糙系数和多分辨率算子分解的多重网格》,SIAM Rev.,59,99-149(2017)·Zbl 1358.65071号
[45] Owhadi,H.,想法有形状吗?柏拉图的形式理论作为人工神经网络的连续极限(2020),arXiv预印本
[46] 奥哈迪,H。;Scovel,C.,希尔伯特空间上的条件高斯测度,J.Math。统计人员。分析。,1 (2018)
[47] 奥哈迪,H。;Scovel,C.,《算子自适应小波、快速解算器和数值均匀化:从博弈论方法到数值逼近和算法设计》(2019),剑桥大学出版社·Zbl 1477.65004号
[48] 奥哈迪,H。;Scovel,C。;Schäfer,F.,统计数值近似,Not。AMS,66,10,1608-1617(2019)·兹伯利07146568
[49] 奥哈迪,H。;Scovel,C。;Yoo,G.R.,《内核模式分解和可编程/可解释回归网络》(2019),arXiv预印本
[50] 奥哈迪,H。;Yoo,G.R.,《内核流:从数据中学习内核到深渊》,J.Compute。物理。,389, 22-47 (2019) ·Zbl 1452.65028号
[51] 奥哈迪,H。;Zhang,L.,打开具有粗糙系数的双曲型和抛物型常微分方程/偏微分方程隐式格式复杂性瓶颈的Gamblets,J.Comput。物理。,347, 99-128 (2017) ·Zbl 1380.65406号
[52] 帕拉斯蒂一世。;Renyi,A.,《内插理论和博弈论》,MTA Mat.Kat.Int.Kozl。,1, 529-540 (1956)
[53] 佩林,O。;Monestiez,P.,使用参数径向基变形的非平稳空间结构建模,(GeoENV II-环境应用地球统计(1999),Springer),175-186
[54] Poincaré,H.,概率计算(1896),乔治·卡雷斯
[55] 基诺内罗·坎德拉,J。;Rasmussen,C.E.,稀疏近似高斯过程回归的统一观点,J.Mach。学习。1939-1959年第6号决议(2005年)·Zbl 1222.68282号
[56] Rédulescu,V.D.,《非线性椭圆偏微分方程的定性分析:单调性、解析和变分方法》(2008),Hindawi Publishing Corporation·Zbl 1190.35003号
[57] 莱斯,M。;佩迪卡里斯,P。;Karniadakis,G.E.,含时和非线性偏微分方程的数值高斯过程,SIAM J.Sci。计算。,40,A172-A198(2018)·Zbl 1386.65030号
[58] 莱斯,M。;佩迪卡里斯,P。;Karniadakis,G.E.,《基于物理的神经网络:用于解决涉及非线性偏微分方程的正问题和逆问题的深度学习框架》,J.Compute。物理。,378, 686-707 (2019) ·Zbl 1415.68175号
[59] 莱斯,M。;亚兹达尼,A。;Karniadakis,G.E.,《隐藏流体力学:从流动可视化中学习速度和压力场》,《科学》,3671026-1030(2020)·Zbl 1478.76057号
[60] J.O.拉姆齐。;胡克,G。;坎贝尔,D。;Cao,J.,微分方程的参数估计:广义平滑方法,J.R.Stat.Soc.,Ser。B、 统计方法。,69, 741-796 (2007) ·Zbl 07555374号
[61] Rico-Martinez,R。;Kevrekidis,I.G.,《非线性系统的连续时间建模:基于神经网络的方法》,(IEEE神经网络国际会议(1993),IEEE),1522-1525
[62] P.D.桑普森。;Guttorp,P.,非平稳空间协方差结构的非参数估计,J.Am.Stat.Assoc.,87108-119(1992)
[63] Sard,A.,线性近似(1963),美国数学学会·Zbl 0115.05403号
[64] 沙巴克,R。;Wendland,H.,《核心技术:从机器学习到无网格方法》,《数值学报》。,15, 543 (2006) ·Zbl 1111.65108号
[65] Schäfer,F。;Katzfuss,M。;Owhadi,H.,《通过Kullback-Leibler最小化进行稀疏Cholesky因式分解》,SIAM J.Sci。计算。,43,A2019-A2046(2021)·兹伯利07364386
[66] Schäfer,F。;T·沙利文。;Owhadi,H.,近线性计算复杂性下稠密核矩阵的压缩、反演和近似主成分分析,多尺度模型。同时。,19, 688-730 (2021) ·兹比尔1461.65067
[67] 肖伯,M。;Duvenaud,D。;Hennig,P.,使用Runge-Kutta平均值的概率ODE解算器,(第28届神经信息处理系统年会(2014)),739-747
[68] 肖尔科夫,B。;Smola,A.J.,《使用内核学习:支持向量机、正则化、优化及超越》(2018),麻省理工学院出版社
[69] Shin,Y。;Darbon,J。;Karniadakis,G.E.,《关于物理信息神经网络的收敛和推广》(2020年),arXiv预印本
[70] 西里尼亚诺,J。;Spiliopoulos,K.,DGM:解偏微分方程的深度学习算法,J.Compute。物理。,375, 1339-1364 (2018) ·Zbl 1416.65394号
[71] Skilling,J.,常微分方程的贝叶斯解,(Smith,C.R.;Erickson,G.J.;Neudorfer,P.O.,最大熵和贝叶斯方法(1992),Springer),23-37·Zbl 0828.65078号
[72] Smoller,J.,《冲击波和反应扩散方程》(2012),Springer Science&Business Media
[73] Stein,M.L.,《克里金的筛选效应》,《美国统计年鉴》,30,298-323(2002)·Zbl 1012.62102号
[74] Stuart,A.M.,《逆向问题:贝叶斯观点》,《数值学报》。,19, 451-559 (2010) ·Zbl 1242.65142号
[75] Sul'din,A.V.,Wiener测度及其在近似方法中的应用。一、 伊兹夫。维斯什。Učebn。扎韦德。,材料,145-158(1959)·Zbl 0092.05901号
[76] 斯威勒,L.P。;M.古利安。;Frankel,A.L。;萨夫塔,C。;Jakeman,J.D.,《约束高斯过程回归的调查:方法和实施挑战》,J.Mach。学习。模型。计算。,1 (2020)
[77] Tadmor,E.,非线性偏微分方程数值方法综述,Bull。美国数学。Soc.,49,507-554(2012)·Zbl 1258.65073号
[78] 特劳布,J.F。;Wasilkowski,G。;沃兹尼亚科夫斯基,H。;Novak,E.,《基于信息的复杂性》,SIAM Rev.,36,514(1994)
[79] Traub,J.F。;Wasilkowski,G.W。;Woźniakowski,H.,线性问题的平均情况最优性,Theor。计算。科学。,29, 1-25 (1984) ·Zbl 0543.68029号
[80] 内山,T。;Sonehara,N.,用递归神经网络解决非线性偏微分方程中的逆问题,(IEEE神经网络国际会议(1993)),99-102
[81] 范德米尔,R。;Oosterlee,C。;Borovykh,A.,用神经网络求解偏微分方程的最优加权损失函数(2020),arXiv预印本
[82] 范德法特,A.W。;van Zanten,J.H.,再现高斯先验的核Hilbert空间,(推动当代统计的极限:Jayanta K.Ghosh的贡献(2008),数学统计研究所),200-222·Zbl 1159.62004号
[83] Vecchia,A.V.,《连续空间过程的估计和模型识别》,J.R.Stat.Soc.B,50297-312(1988)
[84] Wahba,G.,观测数据的样条模型(1990),SIAM·Zbl 0813.62001号
[85] 王,S。;Wang,H。;Perdikaris,P.,《关于傅里叶特征网络的特征向量偏差:从回归到用物理信息神经网络求解多尺度偏微分方程》,计算。方法应用。机械。工程,384,文章113938 pp.(2021)·兹比尔1506.35130
[86] 王,S。;Yu,X。;Perdikaris,P.,《PINN何时以及为何无法训练:神经切线内核视角》(2020),arXiv预印本
[87] E.渭南。;Yu,B.,The deep Ritz method:一种基于深度学习的数值算法,用于求解变分问题,Commun。数学。统计,6,1-12(2018)·Zbl 1392.35306号
[88] Wendland,H.,《分散数据近似》(2004),剑桥大学出版社
[89] 威廉姆斯,C.K.I。;Rasmussen,C.E.,《机器学习的高斯过程》(2006),麻省理工学院出版社·Zbl 1177.68165号
[90] Wilson,A.G。;胡,Z。;Salakhutdinov,R。;Xing,E.P.,深核学习,(《人工智能与统计》,《人工智能和统计》,PMLR,第51卷(2016年),370-378
[91] 张,X。;宋,K.Z。;卢,M.W。;Liu,X.,基于径向基函数配置的无网格方法,计算。机械。,26, 333-343 (2000) ·Zbl 0986.74079号
[92] Zhu,Y。;Zabaras,N.,《替代建模和不确定性量化的贝叶斯深度卷积编解码网络》,J.Compute。物理。,366, 415-447 (2018) ·Zbl 1407.62091号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。