×

基于神经网络的偏微分方程行波解。 (英语) Zbl 1503.65273号

综述报告:近年来对耦合偏微分方程行波解的研究已在化学物理、数学生物学和许多应用科学中发现。在过去三十年中,这个问题一直是人们非常感兴趣的课题,并成为一个重要的研究领域。因此,研究行波解及其相关速度,从而深入了解自然和生物化学现象具有重要意义。在本文中,作者提出了一种通过深度学习网络逼近行波解的新方法,并将其应用于当前感兴趣的三个选定问题,即趋化性的Keller-Segel模型,Allen-Cahn化学动力学模型和Lotka-Volterra种群调节模型由耦合PDE建模,本质上是非线性的。分析此类方程的动机来自于其他研究人员为探索上述模型的动力学和应用而进行的方法论处理。这些模型中的每一个都有一个唯一的解决方案,这些解决方案都得到了广泛的研究(作者)。使用ANN对其进行分析的动机来自于之前的相关工作[Hwang先生等人,J.Comput。物理学。419,文章ID 109665,25 p.(2020;Zbl 07507228号);H·乔等,Netw。埃特罗格。媒体15,第2期,247-259(2020;Zbl 1442.35474号);J.西里尼亚诺K.斯皮廖普洛斯,J.计算。物理学。375, 1339–1364 (2018;Zbl 1416.65394号)]以及神经网络的普遍逼近定理(UAT)。
内容和结构:本文的材料结构如下。第2节介绍了在一般情况下获得行波解的抽象模型,并详细描述了使用相应的神经网络模型寻找行波解近似值和相应速度的拟议方法。使用控制方程的(L2)误差定义了损失函数。由于难以施加边界条件,因此适当定义了损失函数。类似地,为了更准确地估计波速,在解渐近满足的截断区间边界处添加了Neumann边界条件,并使用极限平均值定义损失,以克服平移的影响。简要说明了由前馈和反向传播两部分组成的训练过程。优化过程用于减少通过合并上述所有损失而产生的总损失。给出了原理图(总体架构)。该优化问题可用梯度下降(GD)算法求解。损失函数的偏导数可以通过自动微分(AD)轻松计算[A.帕斯克等,《pytorch中的自动区分》。NeurIPS、Autodiff Workshop(2017)]和ADAM采用了优化器[D.P.金马J.巴,“Adam:一种随机优化方法”,预印本,arXiv:1412.6980]. 第3节讨论了应用于KS模型的深度神经网络的模式,以近似行波解和相应的速度。首先,作者讨论了经典的KS模型。通过施加行波安萨兹,得到了带边界条件的耦合常微分方程。对于解的存在性和唯一性[T.李Z.-A.王,数学。Biosci公司。240,第2期,161-168(2012年;Zbl 1316.92013号)]被调用,它给出显式计算波速的表达式。为了表示神经网络可以近似的函数集,作者参考了[十、李《神经计算》第12卷第4期,第327-343页(1996年;Zbl 0861.41013号)]. 作为理论背景的一部分,本文阐述了两个定理,并给出了证明,以确保损失函数值收敛到零,估计速度收敛到正确值。对KS模型进行了足够小的数值实验,以保证解的存在唯一性和模型参数的变化。通过少量修改,证明了具有域(mathbb{R})的经典模型在选择(n=4)时的多维模型的扩展。总体而言,根据作者的说法,可以观察到所提出的方法可以用于在更高维度上近似行波解。第4节讨论了该方法在具有松弛的Allen-Cahn模型中的应用。如前一节所述,原始区域实线是截断区间([-a,a]\),并在其中进行学习。选择(a=200\)和改变模型参数可获得数值结果。进行实验来估计区间的宽度,以获得所研究模型的解的相当好的近似值。第5节重点介绍了该方法在两种群LV竞争模型中的应用。解的存在唯一性在[Y.Kan关于,SIAM J.数学。分析。26,第2期,340-363页(1995年;Zbl 0821.34048号)]. 据作者所知,该模型中关于速度的唯一已知事实是它的符号。第一个实验旨在近似驻波(波前),这是唯一已知准确速度的情况。最后,第6节对应的结论是进一步研究的领域。通过截断实线,解决了域的无界性带来的困难。此外,为了提高近似解的精度,在截断区间的端点处增加了Neumann边界条件。
然而,作为作者未来工作的一部分,仍有一些有待解决的问题。
观察和评论:1)(O)在本论文中,作者将人工神经网络应用于由耦合非线性偏微分方程(PDE)模拟的物理、化学和生物现象,该方程包含行波解。(C) ANN为PDE解提供了一个理想的表示工具,因为它们的特点是可以通过增量训练算法修改的可调参数。2) (O)在本文中,作者表明深度神经网络具有强大的函数设置和逼近能力,在偏微分方程的研究中具有很大潜力。(C) 与FDM和FEM解相比,PDE的ANN解具有其他优点,这些优点在非平稳环境中尤为重要。3) (O)本文为通过ANN求解偏微分方程提供了一个自然的范例,因为ANN可以通过控制方程和边界条件使适当定义的损失函数最小化。(C) 如今,越来越多的研究人员在使用深度学习方法研究偏微分方程。4) (O)作者采用了最直接、最流行的基于梯度下降的优化算法ADAM。(C) 优化算法决定了如何调整神经网络中的参数。5) (O)提供了A-C和L-V模型不同模型参数的估计波速和训练期总损失轨迹图。(C) ANN模型的准确性取决于大量参数,如权重、偏差、隐藏层数量、不同类型的激活函数和超参数。Epochs是一种超参数形式,在模型的训练过程中起着不可或缺的作用。6) (O)Sigmoid/logistic激活函数和(tan h)(tan双曲)函数用作激活函数。(O) 在ANN模型中,激活函数的主要作用是将节点的加权输入总和转换为输出值,以馈送到下一个隐藏层或作为输出。激活函数的主要目的是向神经网络添加非线性。非线性激活函数是最常用的激活函数。这两个函数都是可微的,并且是单调的,范围分别为\([0,1]\)和\([-1,1]\。7) (O)模损失函数,也称为最小二乘误差(LSE),用于定义所选模型的总损失函数。(C) 神经网络使用需要损失函数来计算模型误差的优化过程进行训练。损失函数衡量网络输出的质量。8) (O)LeCun初始化、Xavier统一初始化是用于数值实验的初始化类型。(C) 偏差和权重的初始化是一个对模型最终性能至关重要的步骤,它取决于激活函数的选择。Xavier初始化与\(\tan h\)激活一起工作。有时,掌握这个概念有助于理解数学证明。两者都旨在根据各自的输入和输出来表示权重的方差。9) (O)所提方法的神经网络模型的验证和验证,包括选择适当的误差度量,依赖于从相关和当前工作中推导和证明的理论结果。(C) 神经网络模型是数据驱动的,因此无法进行分析或理论验证,因此必须进行实证验证。10) 作者开发的(O)ANN模型能够以较高的精度和较快的收敛速度逼近行波解和相应的速度。(C) 目前,越来越多的研究人员使用深度学习方法研究偏微分方程、偏微分方程系统和耦合非线性偏微分方程。
主要贡献:1)引入了一个额外的损失函数来处理无限域;2) 行波解与给定偏微分方程波速的同时逼近;3) 保证波速的理论依据;4) 即使在无法保证唯一性的情况下,也要提供唯一的解决方案作为正确答案;5) 克服维度的诅咒。
结论:利用本文提出的方法,作者进行了实验分析,验证了三个重要偏微分方程的理论结果。由于神经网络强大的函数逼近能力以及NCPDE(非线性耦合偏微分方程)中包含的物理、化学和生物信息,本文提出的方法取得了良好的实验结果。尽管本文使用的方法有很多优点,例如不必考虑PDE的离散化,也不需要插值来覆盖问题的整个领域。然而,该方法还面临许多问题,例如求解偏微分方程的神经网络严重依赖于训练数据,当训练数据质量较差时,往往需要更多的训练时间。因此,研究如何构建高质量的训练数据集以减少训练时间也很重要。本文主要研究一维耦合偏微分方程的非线性性质,采用深度学习人工神经网络。据作者所知和所信,该方法可以扩展到多维问题,只需对所提出的方法进行一些修改。

MSC公司:

65米99 偏微分方程、初值和含时初边值问题的数值方法
2017年10月68日 人工神经网络与深度学习
35C07型 行波解决方案
35A02型 偏微分方程的唯一性问题:全局唯一性、局部唯一性、非唯一性
35A01型 偏微分方程的存在性问题:全局存在、局部存在、不存在
92立方厘米 细胞运动(趋化性等)
92秒20 生物研究、人工生命和相关主题中的神经网络
92D25型 人口动态(一般)
80A30型 热力学和传热中的化学动力学
92年第35季度 与生物、化学和其他自然科学相关的PDE
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] A.阿里。;沙阿·K。;Khan,RA,分数维whitham-broer-kaup方程行波解的数值处理,Alex。Eng.J.,57,3,1991-1998(2018)·doi:10.1016/j.aej.2017.04.012
[2] Bramburger,JJ,keller-segel模型中行波的精确最小速度,应用。数学。莱特。,111, 106594 (2020) ·Zbl 1448.92035号 ·doi:10.1016/j.aml.2020.106594
[3] 陈,X。;刘,G。;Qi,Y.,非kpp等温扩散系统行波解的最小速度的存在性,J.Differ。Equ.、。,263, 3, 1695-1707 (2017) ·Zbl 1385.34025号 ·doi:10.1016/j.jde.2017.03.023
[4] Guo,J-S;Lin,Y-C,lotka-volterra竞争扩散系统的波速符号,Commun。纯应用程序。分析。,12, 5, 2083 (2013) ·兹比尔1267.35064 ·doi:10.3934/cpaa.2013.12.2083
[5] Hagan,PS,抛物方程的行波解和多重行波解,SIAM J.Math。分析。,13717-738(1982年)·Zbl 0504.35050号 ·doi:10.1137/0513049
[6] 哈格斯特罗姆,T。;Keller,HB,非线性抛物方程行波解的数值计算,SIAM J.Sci。统计计算。,7, 3, 978-988 (1986) ·Zbl 0613.65098号 ·doi:10.1137/0907065
[7] He,J-H;徐宏,W.,非线性波动方程的表达式方法,混沌,孤子分形,30,3,700-708(2006)·Zbl 1141.35448号 ·doi:10.1016/j.chaos.2006.03.020
[8] 赫希集团,MW;斯梅尔,S。;Devaney,RL,《微分方程、动力系统和混沌导论》(2012),剑桥:学术出版社,剑桥·Zbl 1239.37001号
[9] Hwang,H.J.,Jang,J.W.,Jo,H.,Lee,J.Y.:通过神经网络方法实现动力学福克普朗克方程的平衡趋势,J.Compute。物理学。419, 109665 (2020) ·Zbl 07507228号
[10] 乔·H。;儿子H。;Hwang,HJ;Kim,EH,深度神经网络正向问题方法,Netw。异质。媒体,15,2,247-259(2020)·Zbl 1442.35474号 ·doi:10.3934/nhm.2020011
[11] Kan-On,Y.,竞争扩散方程行波传播速度的参数依赖性,SIAM J.Math。分析。,26, 2, 340-363 (1995) ·Zbl 0821.34048号 ·doi:10.1137/S0036141093244556
[12] 卡亚,D。;Inan,IE,使用符号计算的非线性耦合方程的精确和数值行波解,应用。数学。计算。,151, 3, 775-787 (2004) ·Zbl 1048.65096号
[13] Keller,EF;Segel,LA,趋化细菌的旅行带:理论分析,J.Theor。生物学,30,2,235-248(1971)·Zbl 1170.92308号 ·doi:10.1016/0022-5193(71)90051-8
[14] Kingma,D.P.,Ba,J.:Adam:随机优化方法,arXiv预印本arXiv:1412.6980(2014)
[15] Larson,DA,fisher型非线性方程解的瞬态界和时间渐近性,SIAM J.Appl。数学。,第34页,第1页,第93-104页(1978年)·Zbl 0373.35036号 ·数字对象标识代码:10.1137/0134008
[16] 拉坦齐奥,C。;马西娅,C。;RG广场;Simeoni,C.,带松弛的艾伦-卡恩模型行波的分析和数值研究,数学。模型方法应用。科学。,26, 5, 931-985 (2016) ·Zbl 1337.35022号 ·doi:10.1142/S0218202516500226
[17] 李·T。;Wang,Z-A,行波对趋化守恒定律的渐近非线性稳定性,J.Differ。Equ.、。,250, 3, 1310-1333 (2011) ·Zbl 1213.35109号 ·doi:10.1016/j.jde.2010.09.020
[18] 李·T。;Wang,Z-A,趋化模型的稳定传播波,数学。生物科学。,240, 2, 161-168 (2012) ·Zbl 1316.92013号 ·doi:10.1016/j.mbs.2012.07.003
[19] Li,X.,用单隐层神经网络同时逼近多元函数及其导数,神经计算,12,4,327-343(1996)·Zbl 0861.41013号 ·doi:10.1016/0925-2312(95)00070-4
[20] 卢,L。;X孟。;毛,Z。;Karniadakis,GE,Deepxde:解微分方程的深度学习库,SIAM Rev.,63,1,208-228(2021)·Zbl 1459.65002号 ·doi:10.1137/19M1274067
[21] Malfliet,W.,《非线性波动方程的孤立波解》,美国物理学杂志。,60, 7, 650-654 (1992) ·Zbl 1219.35246号 ·数字对象标识代码:10.1119/1.17120
[22] Mansour,MBA,细菌模式形成的非线性反应扩散趋化模型的行波解,应用。数学。型号。,32, 2, 240-247 (2008) ·Zbl 1134.35067号 ·doi:10.1016/j.apm.2006.11.013
[23] 梅恩德斯,V。;J.福特。;Farjas,J.,双曲反应扩散方程的波前解速度,物理学。E版,60、5、5231(1999)·doi:10.103/物理版本E.60.5231
[24] Murray,JD,《数学生物学:I.导论》(2007),柏林:施普林格出版社,柏林
[25] Paszke,A.、Gross,S.、Chintala,S.,Chanan,G.、Yang,E.、DeVito,Z.、Lin,Z.,Desmaison,A.、Antiga,L.、Lerer,A.:《pytorch中的自动区分》,论文由NeurIPS,Autodiff Workshop于2017年发表
[26] Paszke,A.、Gross,S.、Massa,F.、Lerer,A.、Bradbury,J.、Chanan,G.、Killeen,T.、Lin,Z.、Gimelshein,N.、Antiga,L.等人:Pytorch:命令式、高性能深度学习库,arXiv预印本arXiv:1912.01703(2019)
[27] 秦,C-Y;田,S-F;Wang,X-B;张,T-T;Li,J.,(3+1)维广义kadomtsev-petviashvili方程的Rogue波、亮暗孤子和行波解,计算。数学。申请。,75, 12, 4221-4231 (2018) ·Zbl 1420.35323号 ·doi:10.1016/j.camwa.2018.03.024
[28] 罗苏,HC;Cornejo-Pérez,O.,多项式非线性扭结的超对称配对,Phys。版本E,71,4,046607(2005)·doi:10.1103/PhysRevE.71.046607
[29] Salako,R.,Shen,W.:具有逻辑源的抛物线-椭圆趋化系统的传播速度和行波,arXiv预印本arXiv:1609.05387(2016)·Zbl 1373.35073号
[30] 西里尼亚诺,J。;Spiliopoulos,K.,Dgm:解偏微分方程的深度学习算法,J.Compute。物理。,375, 1339-1364 (2018) ·Zbl 1416.65394号 ·doi:10.1016/j.jcp.2018.08.029
[31] 塔里克·H。;Akram,G.,非线性cahn-allen方程的新行波精确和近似解:非连续量的演化,非线性动力学。,88, 1, 581-594 (2017) ·Zbl 1373.35335号 ·doi:10.1007/s11071-016-3262-7
[32] 王,Q。;陈,Y。;张华,一种新的riccati方程有理展开方法及其在(2+1)维burgers方程中的应用,混沌,孤子分形,25,5,1019-1028(2005)·Zbl 1070.35073号 ·doi:10.1016/j.chaos.2005.01.039
[33] Wang,Z-C;李,W-T;阮,S.,具有非局部时滞的反应-对流扩散方程中行波波前的存在性和稳定性,J.Differ。Equ.、。,238, 1, 153-200 (2007) ·Zbl 1124.35089号 ·doi:10.1016/j.jde.2007.03.025
[34] Wazwaz,A-M,非线性抛物方程孤子和扭结解的tanh-coth方法,应用。数学。计算。,188, 2, 1467-1475 (2007) ·Zbl 1119.65100号
[35] Shi-Liang,W。;Chen,G.,多类型sis非局部流行病模型行波阵面的唯一性和指数稳定性,非线性分析。真实世界应用。,36, 267-277 (2017) ·Zbl 1364.35064号 ·doi:10.1016/j.nonrwa2017.02.01
[36] Xin,X.,双稳态非线性控制的周期介质中行波的存在和稳定性,J.Dyn。差异Equat。,3541-573(1991年)·Zbl 0769.35033号 ·doi:10.1007/BF01049099
[37] 杨,C。;Rodriguez,N.,骚乱活动系统中行波解的数值透视,应用。数学。计算。,364, 124646 (2020) ·Zbl 1472.11233号 ·doi:10.1016/j.cam.2019.112359
此参考列表基于出版商或数字数学图书馆提供的信息。它的项目与zbMATH标识符启发式匹配,并且可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。