×

使用人工神经网络的多精度回归:参数相关输出量的有效近似。 (英语) Zbl 1507.65184号

摘要:获得高精度的数值或物理实验通常非常耗时或昂贵。当时间或预算限制禁止生成额外数据时,可用样本的数量可能太有限,无法提供令人满意的模型结果。高保真度方法通过合并来自其他来源的信息来处理这些问题,这些信息在理想情况下与高保真度数据很好地相关,但可以以较低的成本获得。通过利用不同数据集之间的相关性,与仅基于少量高保真数据的模型相比,多保真方法通常能产生更好的泛化效果。在当前的工作中,我们将人工神经网络应用于多保真度回归问题。通过阐述几种现有的方法,我们提出了用于多保真回归的新的神经网络结构。将引入的模型与传统的多保真度回归方案(协克里金)进行了比较。提出了一组人工基准来衡量分析模型的性能。结果表明,交叉验证与贝叶斯优化相结合可以得到优于协同克立格方法的神经网络模型。此外,我们还展示了多保真度回归在工程问题中的应用。考虑了压力波在具有参数化形状和频率的变幅杆中的传播,并使用所提出的多保真度模型近似了反射强度指数。高保真度和低保真度分别采用有限元、全阶模型和通过降阶基方法建立的降阶模型。结果表明,多保真度神经网络返回的输出具有与昂贵的全阶模型相当的精度,只需很少的全阶评估,再加上大量不准确但廉价的降阶模型评估。

MSC公司:

65M60毫米 涉及偏微分方程初值和初边值问题的有限元、Rayleigh-Ritz和Galerkin方法
65D07年 使用样条曲线进行数值计算
65天12 数值径向基函数近似
68T07型 人工神经网络与深度学习
92B20型 用于/用于生物研究、人工生命和相关主题的神经网络
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Lecun,Y。;博图,L。;Y.本吉奥。;Haffner,P.,《基于梯度的学习应用于文档识别》,Proc。IEEE,86,2278-2324(1998)
[2] 陈,M。;李毅。;李荣,神经机器翻译模型研究,J.Phys。Conf.序列号。,1237,第052020条pp.(2019)
[3] Ghosh,S。;Reilly,D.L.,《利用神经网络检测信用卡欺诈》(1994年第27届夏威夷国际系统科学会议论文集,第3卷(1994年)),621-630
[4] 贝克,N。;亚历山大,F。;Bremer,T。;哈格伯格,A。;Kevrekidis,Y。;Najm,H。;Parashar,M。;Patra,A。;塞提安,J。;Wild,S.,《科学机器学习的基本研究需求研讨会报告:人工智能的核心技术技术报告》(2019年),USDOE科学办公室(SC),华盛顿特区(美国)
[5] 莱斯,M。;佩迪卡里斯,P。;Karniadakis,G.E.,《基于物理的神经网络:解决涉及非线性偏微分方程的正问题和逆问题的深度学习框架》,J.Compute。物理。,378, 686-707 (2019) ·Zbl 1415.68175号
[6] E.渭南。;Han,J。;Jentzen,A.,基于深度学习的高维抛物型偏微分方程和倒向随机微分方程数值方法,Commun。数学。Stat.,5,4,349-380(2017)·Zbl 1382.65016号
[7] 西里尼亚诺,J。;Spiliopoulos,K.,Dgm:求解偏微分方程的深度学习算法,J.Comput。物理。,375, 1339-1364 (2018) ·Zbl 1416.65394号
[8] 赫塞文,J.S。;Ubbiali,S.,《使用神经网络对非线性问题进行非侵入式降阶建模》,J.Compute。物理。,363, 55-78 (2018) ·兹比尔1398.65330
[9] Lee,K。;Carlberg,K.T.,使用深度卷积自编码器对非线性流形上动力系统的模型简化,J.Compute。物理。,404,第108973条pp.(2020)·Zbl 1454.65184号
[10] 弗雷斯卡,S。;Dedè,L。;Manzoni,A.,基于深度学习的非线性时变参数化偏微分方程降阶建模综合方法(2020),arXiv:2001.04001
[11] 雷·D。;Hesthaven,J.S.,《作为故障细胞指示器的人工神经网络》,J.Compute。物理。,367, 166-191 (2018) ·Zbl 1415.65229号
[12] 雷加佐尼,F。;Dedè,L。;Quarteroni,A.,高效模拟心脏机电的多尺度主动力生成模型的机器学习,计算。方法应用。机械。工程,370,第113268条pp.(2020)·Zbl 1506.74212号
[13] Wang,Y。;姚明,Q。;郭敬通(Kwok,J.T.)。;Ni,L.M.,从几个例子中归纳:关于少快照学习的调查,ACM Compute。调查。,53, 3, 1-34 (2020)
[14] 周,Z.-H.,《弱监督学习简介》,Natl。科学。版次:5、1、44-53(2018)
[15] Journel,A.G.,(五课地质统计学基础。五课地质统计基础,地质学短期课程,第8卷(1989),美国地球物理联合会(AGU)),10-15
[16] 莱斯,M。;佩迪卡里斯,P。;Karniadakis,G.E.,《利用噪声多保真数据推断微分方程解》,J.Compute。物理。,335, 736-746 (2017) ·Zbl 1382.65229号
[17] Kast,M。;郭,M。;Hesthaven,J.S.,非线性问题降阶建模的非侵入多重性方法,计算。方法应用。机械。工程,364,第112947条pp.(2020)·Zbl 1442.65094号
[18] 佩赫斯托弗,B。;Willcox,K。;Gunzburger,M.,《不确定性传播、推理和优化中的多重性方法综述》,SIAM Rev.,60,3,550-591(2018)·Zbl 1458.65003号
[19] 奥哈根,A。;Kennedy,M.C.,当快速近似可用时预测复杂计算机代码的输出,Biometrika,87,1,1-13(2000)·Zbl 0974.62024号
[20] 阿尔瓦雷斯,文学硕士。;Rosasco,L。;Lawrence,N.D.,向量值函数的内核:综述,发现。Trends®马赫数。学习。,4, 3, 195-266 (2012) ·兹比尔1301.68212
[21] X孟。;Karniadakis,G.E.,《从多保真数据中学习的复合神经网络:函数逼近和PDE逆问题的应用》,J.Compute。物理。,401 (2019)
[22] Motamed,M.,《用于不确定性量化的多保真神经网络替代采样方法》,国际期刊Uncert。数量。,10, 4, 315-332 (2020) ·Zbl 1498.65012号
[23] 艾丁,R.C。;Braeu,F.A。;Cyron,C.J.,用计算模型训练人工神经网络的通用多保真度框架,Front。材料。,6, 61 (2019)
[24] 刘,D。;Wang,Y.,多精度物理约束神经网络及其在材料建模中的应用,J.Mech。设计。,141, 12 (2019)
[25] 莱斯,M。;Karniadakis,G.,深多保真度高斯过程(2016),arXiv:1604.07484
[26] 库塔哈尔,K。;普林,M。;Damianou,A。;劳伦斯,N。;González,J.,《用于多保真度建模的深高斯过程》(2019),arXiv:1903.07320
[27] 孟,X。;Babaee,H。;Karniadakis,G.E.,《多精度贝叶斯神经网络:算法和应用》,J.Compute。物理。,438,第110361条pp.(2021)·Zbl 07505956号
[28] Strang,G.,《线性代数与从数据中学习》(2019),韦尔斯利-剑桥出版社·Zbl 1422.15001号
[29] Lee,J。;Bahri,Y。;诺瓦克,R。;Schoenholz,S.S。;彭宁顿,J。;Sohl-Dickstein,J.,《作为高斯过程的深度神经网络》(2017),ArXiv预印本编号1711.00165
[30] Neal,R.M.,《神经网络的贝叶斯学习》,第118卷(2012),施普林格科学与商业媒体
[31] Durrett,R.,《概率论:理论与实例》,第49卷(2019),剑桥大学出版社·Zbl 1440.60001号
[32] Guo,M.,关于将神经网络理解为高斯过程的简要说明(2021),arXiv:2107.11892
[33] Friedman,J.,《贪婪函数近似:梯度提升机》,Ann.Statist。,29, 5, 1189-1232 (2001) ·Zbl 1043.62034号
[34] 威廉姆斯,C。;Rasmussen,C.,《机器学习的高斯过程》(2006),麻省理工学院出版社·Zbl 1177.68165号
[35] Bergstra,J。;Yamins,D。;Cox,D.D.,《建立模型搜索科学:视觉架构数百维超参数优化》(第30届国际机器学习会议论文集第28卷)。第30届国际机器学习会议论文集——第28卷,ICML’13(2013),JMLR.org,115-123
[36] Bergstra,J.S。;Bardenet,R。;Y.本吉奥。;Kégl,B.,超参数优化算法,(神经信息处理系统进展(2011)),2546-2554
[37] GPY:python中的高斯过程框架(自2012年以来),http://github.com/ShefeldML/GPy
[38] Negri,F。;Manzoni,A。;Amsallem,D.,通过矩阵离散经验插值对参数化系统进行有效模型简化,J.Compute。物理。,303, 431-454 (2015) ·Zbl 1349.65154号
[39] Bängtsson,E。;诺兰,D。;Berggren,M.,声喇叭的形状优化,计算。方法应用。机械。工程,192,11-12,1533-1571(2003)·Zbl 1175.76127号
[40] Negri,F.,RedbKIT 2.2版(2016),http://redbkit.github.io/redbkit/
[41] 赫塞文,J.S。;Rozza,G。;Stamm,B.,参数化偏微分方程的认证简化基方法(2016),Springer国际出版公司·Zbl 1329.65203号
[42] Quarteroni,A。;Manzoni,A。;Negri,F.,偏微分方程的约化基方法。《导言》(2016),施普林格国际出版公司·Zbl 1337.65113号
[43] 查图兰塔布特,S。;Sorensen,D.C.,《通过离散经验插值进行非线性模型简化》,SIAM J.Sci。计算。,32, 5, 2737-2764 (2010) ·Zbl 1217.65169号
[44] 卡尔伯格,K.T。;杜米纳罗,R。;Boggs,P.,《在非线性模型简化中保持拉格朗日结构并应用于结构动力学》,SIAM J.Sci。计算。,37、2、B153-B184(2015)·Zbl 1320.65193号
[45] 本纳,P。;古吉丁,S。;Willcox,K.,参数动力系统基于投影的模型简化方法综述,SIAM Rev.,57,4,483-531(2015)·Zbl 1339.37089号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。