×

在非线性动力学格中增强物理对称性的神经网络:Ablowitz-Ladik模型的例子。 (英语) Zbl 1512.35512号

小结:在这项工作中,我们介绍了对称性保护、物理信息神经网络(S-PINNs),它由非线性动力学格解中普遍存在的对称性驱动。虽然最近PINN的使用在数据驱动的主要是偏微分方程解的发现中引起了人们的广泛关注,但我们证明,PINN无法执行重要的物理定律,包括解的对称性和守恒定律。通过微分方程解在空间和时间上的奇偶对称性与其群等变表示的相关性,我们构造了尊重时空奇偶对称的群等变NN。此外,我们对所提出的体系结构进行了调整,以增强非线性动力学格解的不同类型的周期性(或局部化)。为此,我们将S-PINNs应用于完全可积的Ablowitz-Ladik模型,并进行数值实验,特别关注与流氓结构相关的波形。其中包括库兹涅佐夫-Ma孤子、阿赫梅迪耶夫呼吸器以及佩雷格林孤子。我们的数值结果表明,与标准PINN相比,该架构具有优越性和鲁棒性。

MSC公司:

51年第35季度 孤子方程
55年第35季度 NLS方程(非线性薛定谔方程)
35问题35 与流体力学相关的PDE
35C08型 孤子解决方案
65M99型 偏微分方程、初值和含时初边值问题的数值方法
65K10码 数值优化和变分技术
68T07型 人工神经网络与深度学习
37K10型 完全可积无穷维哈密顿和拉格朗日系统、积分方法、可积性检验、可积层次(KdV、KP、Toda等)
37K15型 无限维哈密顿和拉格朗日系统的逆谱和散射方法
37千卡60 晶格动力学;可积晶格方程
35卢比60 随机偏微分方程的偏微分方程
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] S.Haver,1995年1月1日在Draupner夹克上测得的一个可能的畸形波浪事件,载于:Rogue Waves 2004:Ifremer组织的研讨会会议记录,于法国布雷斯特举行,20042004年,第1-8页,URLhttp://www.ifremer.fr/web-com/stw2004/rw/fullpapers/walk_on_haver.pdf。
[2] Walker,D.A。;P.H.泰勒。;Taylor,R.E.,《公海上大面波的形状和Draupner新年波》,应用。海洋研究,26,3-4,73-83(2004)
[3] Adcock,T.A。;泰勒,P.H。;Yan,S。;马庆伟。;Janssen,P.A.,draupner波是在横渡大海时产生的吗?,程序。R.Soc.A,467,2134,3004-3021(2011)
[4] Mori,N。;Liu,P.C.,《日本海畸形波测量分析》,海洋工程,29,11,1399-1414(2002)
[5] 卡里夫,C。;Pelinovsky,E.,流氓波现象的物理机制,《欧洲力学杂志》。B/流体,22、6、603-634(2003)·Zbl 1058.76017号
[6] Chabchoub,A。;霍夫曼,N.P。;Akhmediev,N.,水波箱中的流氓波观测,Phys。修订稿。,106、20,第204502条,pp.(2011),URLhttps://link.aps.org/doi/10.103/PhysRevLett.106.204502
[7] Chabchoub,A。;霍夫曼,N。;奥诺拉托,M。;Akhmediev,N.,《超级无赖波:水波中高阶呼吸器的观测》,Phys。第X版,第2、1、2-7页(2012年)
[8] McAllister,M.L。;Draycott,S。;Adcock,T.A。;P.H.泰勒。;Van Den Bremer,T.S.,《排水波的实验室再现和破浪在跨海中的作用》,《流体力学杂志》。,860, 767-786 (2018)
[9] 徐,G。;Chabchoub,A。;佩利诺夫斯基,D.E。;Kibler,B.,《平稳周期波上调制不稳定性和无赖呼吸的观测》,《物理学》。Rev.Res.,2,3,33528(2020),URLhttps://link.aps.org/doi/10.103/PhysRevResearch.2.033528
[10] Solli,D.R。;罗尔斯,C。;Koonath,P。;贾拉利,B.,《光学流氓波》,《自然》,450,7172,1054-1057(2007)
[11] 达德利,J.M。;直径,F。;埃尔金塔罗,M。;Genty,G.,光学中的不稳定性、呼吸和流氓波,自然光子学,8,10,755-764(2014),网址https://www.nature.com/articles/nphoton.2014.220
[12] 弗里斯克,B。;Kibler,B。;莫林,P。;巴罗尼奥,F。;康福尔蒂,M。;Millot,G。;Wabnitz,S.,《光学暗流氓波》,科学。代表,6,1,1-9(2016)
[13] Tikan,A。;钢坯,C。;El,G。;托夫比斯,A。;贝托拉,M。;西尔维斯特,T。;古斯塔夫,F。;Randoux,S。;Genty,G。;苏雷特,P。;Dudley,J.M.,三次非线性薛定谔方程聚焦动力学中游走孤子的普遍性,Phys。修订稿。,119、3、33901(2017),网址https://link.aps.org/doi/10.103/PhysRevLett.119.033901
[14] Ruderman,M.S.,《实验室和空间等离子体中的奇异波》,《欧洲物理学》。J.:专题,185,1,57-66(2010)
[15] Sabry,R。;穆斯林,W.M。;Shukla,P.K.,《白矮星和磁星中的怪异波》,Phys。Plasmas,19,12(2012)
[16] 贝恩斯,A.S。;李,B。;Xia,L.D.,超热等离子体中的动力学Alfvén孤波和流氓波,物理学。等离子体,21,3(2014),arXiv:1403.3745
[17] 托尔巴,R.E。;穆斯林,W.M。;El-Bedwehy,N.A。;El-Labany,S.K.,《尘埃等离子体中流氓波的演化》,《物理学》。等离子体,22,4(2015)
[18] Charalampidis,E.G。;Cuevas-Maraver,J。;Frantzeskakis,D.J。;Kevrekidis,P.G.,《超冷波罗的海中的流氓波》,罗马尼亚共和国物理学。,70、1、1-25(2018),arXiv:1609.01798
[19] 奥诺拉托,M。;雷斯多里,S。;Bortolozzo,美国。;蒙蒂纳,A。;Arecchi,F.T.,不同物理环境中的Rogue波及其生成机制,《物理学》。众议员,528,2,47-89(2013)
[20] 达德利,K。;Genty,G。;穆索特,A。;Chabchoub,A。;Dias,F.,《光学和海洋学中的流氓波和类比》,自然科学出版社。,1, 675-689 (2019)
[21] R.Osborne,A.,《非线性海浪和逆散射变换》(2010),Elsevier:Elsevier Amsterdam,URLhttps://books.google.com/books?hl=ja&lr=lang_ja ·Zbl 1250.86006号
[22] 佩利诺夫斯基,E。;Kharif,C.,《极端海浪》,1-236(2016),Springer International Publishing:Springer国际出版社Cham,URLhttp://link.springer.com/10.1007/978-3-319-21575-4 ·Zbl 1348.86003号
[23] Dissanayake,M。;Phan-Thien,N.,解偏微分方程的基于神经网络的近似,Commun。数字。方法。工程,10,3,195-201(1994)·Zbl 0802.65102号
[24] 拉加里斯,I.E。;利卡斯,A。;Fotiadis,D.I.,求解常微分方程和偏微分方程的人工神经网络,IEEE Trans。神经网络。,987-10000年9月5日(1998年)
[25] 陆克文,K。;Ferrari,S.,使用人工神经网络求解偏微分方程的约束积分(CINT)方法,神经计算,155,277-285(2015)
[26] Carleo,G。;Troyer,M.,用人工神经网络解决量子多体问题,《科学》,355,6325,602-606(2017)·Zbl 1404.81313号
[27] Han,J。;Jentzen,A。;Weinan,E.,使用深度学习求解高维偏微分方程,Proc。国家。阿卡德。科学。,115, 34, 8505-8510 (2018) ·Zbl 1416.35137号
[28] E.渭南。;Han,J。;Jentzen,A.,基于深度学习的高维抛物型偏微分方程和倒向随机微分方程数值方法,Commun。数学。Stat.,5,4,349-380(2017)·Zbl 1382.65016号
[29] 伯格,J。;Nyström,K.,复杂几何偏微分方程的统一深度人工神经网络方法,神经计算,317,28-41(2018)
[30] Khoo,Y。;卢,J。;Ying,L.,使用人工神经网络求解高维承诺函数,研究数学。科学。,2019年6月1日至13日·Zbl 1498.60222号
[31] 莱斯,M。;佩迪卡里斯,P。;Karniadakis,G.E.,《基于物理的神经网络:解决涉及非线性偏微分方程的正问题和逆问题的深度学习框架》,J.Compute。物理。,378, 686-707 (2019) ·Zbl 1415.68175号
[32] 雅格塔普,A.D。;Kharazmi,E。;Karniadakis,G.E.,守恒定律离散域上的守恒物理信息神经网络:正问题和逆问题的应用,计算。方法应用。机械。工程,365,第113028条pp.(2020)·Zbl 1442.92002号
[33] 卢,L。;X孟。;毛,Z。;Karniadakis,G.E.,DeepXDE:解微分方程的深度学习库,SIAM Rev.,63,1,208-228(2021)·Zbl 1459.65002号
[34] 西里尼亚诺,J。;Spiliopoulos,K.,DGM:解偏微分方程的深度学习算法,J.Compute。物理。,375, 1339-1364 (2018) ·Zbl 1416.65394号
[35] E.渭南。;Yu,B.,The deep Ritz method:一种基于深度学习的数值算法,用于求解变分问题,Commun。数学。统计,6,1,1-12(2018)·Zbl 1392.35306号
[36] 顾毅。;Yang,H。;周,C.,Selectnet:高维偏微分方程的自定步长学习,J.Compute。物理。,441,第110444条pp.(2021)·Zbl 07513823号
[37] Han,J。;张,L。;Weinan,E.,使用深度神经网络求解多电子薛定谔方程,J.Comput。物理。,399,第108929条pp.(2019)·Zbl 1457.81010号
[38] 赫尔曼,J。;佐治亚州Schätzle。;Noé,F.,电子薛定谔方程的深度神经网络解,自然化学。,12, 10, 891-897 (2020)
[39] Pfau,D。;斯宾塞,J.S。;马修斯,A.G。;Foulkes,W.M.C.,带深度神经网络的多电子薛定谔方程的从头算解,Phys。Rev.Res.,2,3,第033429条pp.(2020)
[40] Karniadakis,G.E。;Kevrekidis,I.G。;卢,L。;佩迪卡里斯,P。;王,S。;Yang,L.,《物理告知机器学习》,自然科学出版社。,3, 6, 422-440 (2021)
[41] Shin,Y。;Darbon,J。;Karniadakis,G.E.,关于线性二阶椭圆和抛物线型偏微分方程的物理信息神经网络的收敛性(2020),arXiv预印本arXiv:2004.01806·Zbl 1473.65349号
[42] Shin,Y。;张,Z。;Karniadakis,G.E.,使用神经网络对线性偏微分方程进行残差最小化的误差估计(2020年),arXiv预印本arXiv:2010.08019
[43] Luo,T。;Yang,H.,《偏微分方程的双层神经网络:优化和泛化理论》(2020),arXiv预印本arXiv:2006.15733
[44] 苏莱姆,C。;Sulem,P.,《非线性薛定谔方程:自聚焦和波崩塌》(1999),纽约斯普林格-Verlag出版社,URLhttps://books.google.com/books?hl=ja&lr=lang_ja ·Zbl 0928.35157号
[45] Ablowitz,M.J。;Prinari,B。;Trubatch,A.D.,《离散和连续非线性SchrÖDinger系统》,第302卷(2004年),剑桥大学出版社·Zbl 1057.35058号
[46] 苗,Z。;Chen,Y.,高维可积系统中基于物理的神经网络方法(2021),ArXiv E-Prints ArXiv:2107.02985
[47] Lin,S。;Chen,Y.(2012),ArXiv E-Prints ArXiv:2107.01009
[48] Wang,L。;Yan,Z.,数据驱动的流氓波和散焦非线性薛定谔方程中的参数发现,具有使用PINN深度学习的潜力,Phys。莱特。A、 404,第127408条pp.(2021),URLhttps://www.sciencedirect.com/science/article/pii/S0375960121002723 ·Zbl 07409914号
[49] 方,Y。;Wu,G。;Wang,Y。;Dai,C.-Q.,数据驱动的飞秒光孤子激发和使用PINN的高阶NLSE参数发现,非线性发电机。,105, 603-616 (2021)
[50] Pu,J。;Li,J.等人。;Chen,Y.,用改进的PINN方法求解导数非线性薛定谔方程的局域波解,非线性动力学。,105, 1723-1739 (2021)
[51] Pu,J。;彭,W。;Chen,Y.,使用改进的PINN方法的导数非线性Schrödinger方程的数据驱动局部波解,波动,107,文章102823 pp.(2021),URLhttps://www.sciencedirect.com/science/article/pii/S0165212521001219 ·兹比尔1524.35597
[52] 彭,W。;Pu,J。;Chen,Y.,PINN对Chen-Lee-Liu方程的深度学习:周期背景上的Rogue波(2021),ArXiv E-Prints ArXiv:2105.13027·Zbl 1497.35440号
[53] 科诺托普,V.V。;杨,J。;Zezyulin,D.A.,对称系统中的非线性波,现代物理学评论。,88,文章035002 pp.(2016),URLhttps://link.aps.org/doi/10.103/RevModPhys.88.035002
[54] Christodoulides,D。;Yang,J.,《奇偶校验时间对称及其应用》,1-579(2018),Springer Singapore,URLhttps://www.springer.com/gp/book/9789811312465
[55] 哈,我。;杨,E。;黄禹锡。;Shin,J.,时间反向对称ODE网络,(Larochelle,H.;Ranzato,M.;Hadsell,R.;Balcan,M.F.;Lin,H..,《神经信息处理系统的进展》,第33卷(2020年),Curran Associates,Inc.),19016-19027,URLhttps://proceedings.neurips.cc/paper/2020/file/db8419f41d890df802dca330e6284952-paper.pdf
[56] Jin,P。;张,Z。;朱,A。;Tang,Y。;Karniadakis,G.E.,SympNets:识别哈密顿系统的内在结构保辛网络,神经网络。,132166-179(2020),网址https://www.sciencedirect.com/science/article/pii/S0893608020303063 ·Zbl 1475.68316号
[57] Kevrekidis,P.G.,《晶格中的非线性波:过去、现在、未来》,IMA J.Appl。数学。,76、3、389-423(2011),arXiv:https://academy.oup.com/imamat/article-pdf/76/3/389/2257051/hxr015.pdf ·Zbl 1230.37099号
[58] Ankiewicz,A。;阿赫梅迪耶夫,N。;Soto Crespo,J.M.,Ablowitz-Ladik和Hirota方程的离散无赖波,Phys。版本E(3),82,2(2010)
[59] J·沙利文。;Charalampidis,E。;Cuevas-Maraver,J。;Kevrekidis,P.G。;Karachalios,N.I.,Kuznetsov-Salerno模型中的类呼吸溶液,欧洲物理学。J.Plus,135,7,1-12(2020年)
[60] Ablowitz,M.J。;Ladik,J.F.,《非线性微分方程和傅里叶分析》,J.Math。物理。,17, 6, 1011-1018 (1976) ·Zbl 0322.42014号
[61] Ablowitz,M.J。;Ladik,J.F.,非线性微分方程,J.Math。物理。,16, 3, 598-603 (1975) ·Zbl 0296.34062号
[62] Kevrekidis,P.,《离散非线性薛定谔方程:数学分析、数值计算和物理透视》,第232卷(2009年),Springer-Velag·Zbl 1169.35004号
[63] 蔡,D。;Bishop,A.R。;Grönbech-Jensen,N.,离散可积非线性薛定谔方程的摄动理论,物理学。修订版E,5314131-4136(1996),网址https://link.aps.org/doi/10.103/PhysRevE.53.4131(物理版)
[64] 卡皮图拉,T。;Kevrekidis,P.,离散系统中波的稳定性,非线性,14,3,533-566(2001)·Zbl 1001.37080号
[65] Prinari,B.,聚焦Ablowitz-Ladik方程的离散孤子,通过逆散射具有非零边界条件,J.Math。物理。,第57、8条,第083510页(2016年)·Zbl 1351.35190号
[66] Akhmediev,N.N。;Eleonskii,V.M。;Kulagin,N.E.,非线性Schroedinger方程的精确一阶解,Theor。数学。物理。;(美国),72,2(1988年)
[67] 科恩,T。;Welling,M.,群等变卷积网络,(机器学习国际会议(2016),PMLR),2990-2999
[68] 科恩,T.S。;盖革,M。;Weiler,M.,齐次空间上等变CNN的一般理论,(Wallach,H.;Larochelle,H.,Beygelzimer,A.;d’Alché-Buc,F.;Fox,E.;Garnett,R.,《神经信息处理系统的进展》,第32卷(2019年),Curran Associates,Inc.),URLhttps://proceedings.neurips.cc/paper/2019/file/b9cfe8b6042cf759dc4c0cccb27a6737-paper.pdf
[69] 康多,R。;Trivedi,S.,关于神经网络中等方差和卷积对紧群作用的推广,(机器学习国际会议(2018),PMLR),2747-2755
[70] T.Cohen,M.Welling,Steerable CNN,摘自:2017年国际学习代表大会。
[71] 韦勒,M。;Cesa,G.,General E(2)-等变可操纵CNN,(Wallach,H.;Larochelle,H.,Beygelzimer,A.;d’Alché-Buc,F.;Fox,E.;Garnett,R.,《神经信息处理系统进展》,第32卷(2019年),Curran Associates,Inc.)
[72] X.Cheng,Q.Qiu,R.Calderbank,G.Sapiro,RotDCF:用于旋转等变深度网络的卷积滤波器的分解,在:国际学习表征会议,2019。
[73] E.Hoogeboom、J.W.Peters、T.S.Cohen、M.Welling、HexaConv,摘自:2018年国际学习代表大会。
[74] D.E.Worrall,S.J.Garbin,D.Turmukhambetov,G.J.Brostow,《谐波网络:深度平移和旋转等方差》,载《IEEE计算机视觉和模式识别会议论文集》,2017年,第5028-5037页。
[75] Bekkers,E.J。;Loog,M。;特哈尔·罗梅尼,B.M。;Duits,R.,通过旋转平移组上的密度进行模板匹配,IEEE Trans。模式分析。马赫。智力。,40, 2, 452-466 (2017)
[76] 周瑜、叶琦、邱琦、焦建杰,面向响应网络,载《IEEE计算机视觉与模式识别会议论文集》,2017年,第519-528页。
[77] D.Marcos,M.Volpi,N.Komodakis,D.Tuia,《旋转等变矢量场网络》,载于《IEEE计算机视觉国际会议论文集》,2017年,第5048-5057页。
[78] M.Weiler、F.A.Hamprecht、M.Storath,《学习旋转等变CNN的可操纵滤波器》,载于《IEEE计算机视觉和模式识别会议论文集》,2018年,第849-858页。
[79] 韦勒,M。;盖革,M。;韦林,M。;布姆斯马,W。;Cohen,T.,3D可操纵cnns:学习体积数据中的旋转等变特征,(神经信息处理系统进展(2018)),10381-10392
[80] D.Worrall,G.Brostow,《Cubenet:3D旋转和平移的等量性》,摘自:《欧洲计算机视觉会议论文集》,ECCV,2018年,第567-584页。
[81] N.托马斯。;斯米特,T。;科恩斯,S。;Yang,L。;李,L。;科尔霍夫,K。;Riley,P.,《张量场网络:三维点云的旋转与平移等效神经网络》(Tensor field networks:Rotation and translation-equivariant neural networks for 3d point clouds)(2018),arXiv预印本arXiv:1802.08219
[82] T.S.Cohen、M.Geiger、J.Köhler、M.Welling,球形CNN,收录于:2018年国际学习代表大会。
[83] C.Esteves、C.Allen-Blanchette、A.Makadia、K.Danilidis,《学习球面CNN的SO(3)等变表示》,载于《欧洲计算机视觉会议论文集》,ECCV,2018年,第52-68页。
[84] 温克尔斯,M。;Cohen,T.S.,用于肺结节检测的3D G-CNN(2018),arXiv预印本arXiv:1804.04656
[85] 安德烈亚茨克,V。;Fageot,J。;奥雷勒,V。;蒙特特,X。;Depeursinge,A.,《利用可控制滤波器探索3D CNN中的局部旋转不变性》(2019年医学成像与深度学习国际会议,PMLR),15-26
[86] 金泽,A。;Sharma,A。;Jacobs,D.,局部尺度不变卷积神经网络(2014),arXiv预印本arXiv:1412.5104
[87] 马科斯,D。;Kellenberger,B。;Lobry,S。;Tuia,D.,带向量场的CNN中的尺度等方差(2018),arXiv预印本arXiv:1807.11783
[88] Xu,Y。;肖,T。;张杰。;Yang,K。;Zhang,Z.,尺度不变卷积神经网络(2014),arXiv预印本arXiv:1411.6369
[89] 沃拉尔,D。;Welling,M.,《深度尺度空间:尺度上的均衡》,(Wallach,H.;Larochelle,H.,Beygelzimer,A.;d’Alché-Buc,F.;Fox,E.;Garnett,R.,《神经信息处理系统的进展》,第32卷(2019年),Curran Associates,Inc.)
[90] I.Sosnovik,M.Szmaja,A.Smelders,尺度等变可操纵网络,载于:国际学习表征会议,2020。
[91] 北卡罗来纳州古腾堡。;北卡罗来纳州处女座。;O.维特科夫斯基。;青木,H。;Kanai,R.,置换等效神经网络应用于动力学预测(2016),arXiv预印本arXiv:1612.04530
[92] Sannai,A。;Takai,Y。;Cordonnier,M.,深度神经网络对置换不变/等变函数的通用逼近(2019),arXiv预印本arXiv:1903.01939
[93] Lee,J。;Lee,Y。;Kim,J。;Kosiorek,A。;Choi,S。;Teh,Y.W.,《Set transformer:基于注意力的排列变异神经网络框架》,(机器学习国际会议(2019),PMLR),3744-3753
[94] 萨托拉斯,V.G。;Hoogeboom,E。;Welling,M.,E(n)等变图神经网络(2021),arXiv预印本arXiv:2102.09844
[95] 北卡罗来纳州克里文。;通用不变和等变图神经网络,高级神经信息处理。系统。,327092-7101(2019)
[96] W.富尔顿。;Harris,J.,《表征理论:第一课程》,第129卷(2013),Springer Science&Business Media
[97] Fuchs,F。;沃拉尔,D。;费舍尔,V。;Welling,M.,SE(3)-变压器:3D旋转-翻译等变注意网络,(Larochelle,H.;Ranzato,M.;Hadsell,R.;Balcan,M.F.;Lin,H..,《神经信息处理系统进展》,第33卷(2020),Curran Associates,Inc.),1970-1981,URLhttps://proceedings.neurips.cc/paper/2020/file/15231a7ce4ba789d13b722cc5c955834-paper.pdf
[98] Baydin,A.G。;Pearlmutter,B.A。;Radul,A.A。;Siskind,J.M.,《机器学习中的自动差异化:一项调查》,J.Mach。学习。第18号决议(2018年)·Zbl 06982909号
[99] Kingma,D.P。;Ba,J.,Adam:随机优化方法(ICLR(Poster)(2015))
[100] 刘博士。;Nocedal,J.,《关于大规模优化的有限内存BFGS方法》,数学。程序。,45, 1, 503-528 (1989) ·Zbl 0696.90048号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。