×

CPU需求反应输运模型的仿真:高斯过程、多项式混沌扩展和深度神经网络的比较。 (英语) Zbl 1427.86002号

摘要:本文详细比较了模拟CPU密集型反应传输模型(RTMs)的三种方法:高斯过程(GP)、多项式混沌扩展(PCE)和深度神经网络(DNN)。每个仿真方法都使用最先进的开放源码库,而所考虑RTM的一次前向运行所产生的CPU时间从1小时到1小时到30分钟再到5天不等。除了对模拟铀浓度时间序列进行直接仿真外,还研究了用其仿真器代替原始RTM进行全局敏感性分析(GSA)、不确定性传播和使用马尔可夫链蒙特卡罗(MCMC)采样进行概率校准。发现所选DNN在再现所考虑的8维和13维CPU密集型RTM的输入输出行为方面优于GP和PCE。尽管使用的训练集很小,从75到500个样本。此外,两种使用的PCE变体,标准PCE和稀疏PCE(sPCE),似乎总是提供最低的准确性,但性能差异不大。由于其更好的仿真能力,DNN方法在不确定性传播方面优于其他两种方法。对于GSA应用,DNN和GP方法对真实的一阶和总阶Sobol敏感性指数提供了同样好的近似值,而PCE则做得不太好。最令人惊讶的是,尽管DNN方法具有卓越的仿真技能,但它还是导致了所考虑的合成逆问题的最差解决方案,该问题涉及1224个低噪声测量数据。所用DNN的这种明显矛盾行为至少部分是由于影响基于DNN的预测的小而复杂的确定性噪声。事实上,在高质量测量数据的情况下,这种复杂的误差结构会使仿真解远离真实的后验分布。在所考虑的3种方法中,只有GP方法允许检索联合(1)将高质量测量数据拟合到适当的噪声水平(对数似然值)和(2)最接近地拟合真实模型参数值的模拟后验解。总的来说,我们的研究结果表明,当可用的训练集相对较小(75到500个输入-输出示例)并且预先固定时,PCE不是模拟CPU密集型RTM的最佳选择。相反,应首选GP或DNN。然而,DNN可以提供过度偏倚的模型校准结果。相比之下,GP方法在所有考虑的任务中都表现得相当好:直接仿真、全局灵敏度分析、不确定性传播和校准。

MSC公司:

86-08 地球物理问题的计算方法
76S05号 多孔介质中的流动;过滤;渗流
76伏05 流动中的反应效应
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Abadi,M.、Agarwal,A.、Barham,P.等人:Tensorflow:异构分布式系统上的大规模机器学习。ArXiv电子打印https://www.tensorflow.org (2016)
[2] Aster,R.,Borchers,B.,Thurber,C.H.:参数估计和反问题,第二版。爱思唯尔(2012)·Zbl 1273.35306号
[3] Blatman,G.,Sudret,B.:使用稀疏多项式混沌展开有效计算全局灵敏度指数。Reliab公司。工程系统安全。95(11), 1216-1229 (2010) ·doi:10.1016/j.ress.2010.06.015
[4] Cho,Y.,Saul,L.K.:深度学习的核心方法。神经信息处理系统进展,22。http://papers.nips.cc/paper/3628-kernel-methods-for-depe-learning.pdf (2009)
[5] Chollet,F.等人:Keras。https://keras.io网址 (2015)
[6] Cybenko,G.:通过S形函数的叠加进行逼近。数学。控制信号系统。2(4), 303-314 (1989) ·Zbl 0679.94019号 ·doi:10.1007/BF02551274文件
[7] Feinberg,J.,Langtangen,H.P.:混沌:设计不确定性量化方法的开源工具。J.计算。科学。2015年11月46日至57日。https://doi.org/10.1016/j.jocs.2015.08.008, https://github.com/jonathf/chaospy网站 ·doi:10.1016/j.jocs.2015.08.008
[8] Gelman,AG,Rubin,DN:使用多序列的迭代模拟推断。统计科学。7, 457-472 (1992) ·Zbl 1386.65060号 ·doi:10.1214/ss/117701136
[9] Ghanem,R.G.,Spanos,S.P.:随机有限元:谱方法。柏林施普林格(1991)·Zbl 0722.73080号 ·doi:10.1007/978-1-4612-3094-6
[10] Goodfellow,I.,Bengio,Y.,Courville,A.:深度学习。麻省理工学院出版社。http://www.deeplearningbook.org(2016) ·Zbl 1373.68009号
[11] Greskowiak,J.,Prommer,H.,Liu,C.,Post,V.E.A.,Ma,R.,Zheng,C.,Zachra,J.M.:双域分布速率反应系统中铀迁移的实验室和现场模型参数敏感性的比较。水资源。第46号决议,W009509(2010)。https://doi.org/10.1029/2009WR008781 ·doi:10.1029/2009WR008781
[12] Greskowiak,J.、Gwo,J.,Jacques,D.、Yin,J.和Mayer,K.U.:U(VI)的多速率表面络合和一维双域多组分反应迁移的基准。计算。地质科学。19, 585-597 (2015). https://doi.org/10.1007/s10596-014-9457-4 ·doi:10.1007/s10596-014-9457-4
[13] Hornik,K.:多层前馈网络的近似能力。神经网络。4(2), 251-257 (1991) ·doi:10.1016/0893-6080(91)90009-T
[14] Iooss,B.,Lemaêtre,P.:《复杂系统仿真优化中的不确定性管理:算法和应用》,第A章《全局灵敏度分析方法综述》。斯普林格(2015)·Zbl 1332.90003号
[15] Jacques,D.、Šimunek,J.、Mallants,D.和van Genuchten,M.Th.:水文和化学过程耦合建模:磷施肥后的长期铀迁移。渗流区J.7,698-711(2008)·doi:10.2136/vzj2007.0084
[16] Jacques,D.、Šimunek,J.、Mallants,D.和van Genuchten,M.Th.:可变饱和流中多组分反应迁移的HPx软件:最新发展和应用。J.水文学。液压机械。66 (2), 211-226 (2018). https://doi.org/10.1515/johh-2017-0049 ·doi:10.1515/johh-2017-0049
[17] Jansen,M.J.W.:模型输出的方差设计分析。计算。物理学。Commun公司。117, 35-43 (1999) ·Zbl 1015.68218号 ·doi:10.1016/S0010-4655(98)00154-4
[18] Jatnieks,J.、De Lucia,M.、Dransch,D.、Sips,M.:用于改进反应性传输模拟性能的数据驱动替代模型方法。《能源媒体》97,447-453(2016)。https://doi.org/10.1016/j.egypro.2016.10.047 ·doi:10.1016/j.egypro.2016.10.047
[19] Jolliffe,I.T.:主成分分析,第2版。斯普林格(2002)·Zbl 1011.62064号
[20] Jones,E.、Oliphant,E.、Peterson,P.等人:SciPy:Python的开源科学工具。网址:http://www.scipy.org/ (2001)
[21] Keating,E.H.,Harp,D.H.,Dai,Z.,Pawar,R.J.:评估浅层非承压含水层中CO2影响的降阶模型。《国际温室气体控制杂志》46,187-196(2016)·doi:10.1016/j.ijggc.2016.01.008
[22] Kingma,D.P.,Ba,J.L.:ADAM:一种随机优化方法。In:学习代表国际会议(ICLR,圣地亚哥(2015))
[23] Laloy,E.,Vrugt,J.A.:使用多重DREAM(ZS)和高性能计算对水文模型进行高维后验探索。水资源。第48号决议,W01526(2012)。https://doi.org/10.1029/2011WR010608 ·doi:10.1029/2011WR010608
[24] Laloy,E,Linde,N,Jacques,D,Vrugt,J.A.:使用循环嵌入和降维从间接水文数据中对多高斯场进行概率推断。水资源。第51号决议。https://doi.org/10.1002/2014WR016395 (2015) ·doi:10.1002/2014WR016395
[25] Le Maêtre,O.P.,Knio,O.M.:不确定性量化的光谱方法:科学计算。施普林格(2010)·Zbl 1193.76003号
[26] Liu,C.,Zachara,J.M.,Qafoku,N.P.,Wang,Z.:铀从受污染地下沉积物中的尺度依赖性解吸。水资源。第44号决议,W08413(2008)。https://doi.org/10.1029/2007WR006478 ·doi:10.1029/2007WR006478
[27] Marrel,A.,Perot,N.,Mottet,C.:时空数值模拟器代理模型的开发和敏感性分析。斯托克。环境。Res.风险评估。29, 959-974 (2015). https://doi.org/10.1007/s00477-014-0927-y ·doi:10.1007/s00477-014-0927-y
[28] Matthews,A.G.G.,van der Wilk,M.,Nickson,T.,Fujii,K.,Boukouvalas,A.,Le'on-Villagr'A,P.,Ghahramani,Z.,Hensman,J.:GPflow:使用TensorFlow的高斯过程库。J.马赫。学习。第18(40)号决议,1-6(2017)。https://github.com/GPflow ·兹比尔1437.62127
[29] McKay,M.D.,Conover,W.J.,Beckman,R.J.:计算机代码输出分析中选择输入变量值的三种方法的比较。技术计量学221239-245(1979)·Zbl 0415.62011号
[30] Plischke,E.:计算全局敏感性指数(EASI)的有效算法。Reliab公司。工程系统。安全95(4),354-360(2010)·doi:10.1016/j.ress.2009.11.005
[31] Rasmussen,C.E.,Williams,C.K.I.:机器学习的高斯过程。麻省理工学院出版社(2006)·Zbl 1177.68165号
[32] Robert,C.P.,Casella,G.:蒙特卡洛统计方法,第二版。斯普林格(2004)·兹比尔1096.62003
[33] Roy,PT,Segui,LM,Jouhaud,J.-C.,Gicguel,L.:改进基于替代模型的不确定性量化的重采样策略:LS89的LES应用。国际期刊数字。方法。流体。第87607-627页(2018)。https://doi.org/10.1002/fld.4504网址 ·文件编号:10.1002/fld.4504
[34] Saltelli,A.、Annoni,P.、Azzini,I.、Campolongo,F.、Ratto,M.、Tarantola,S.:基于方差的模型输出敏感性分析。总敏感性指数的设计和估算。计算。物理学。Commun公司。181, 259-270 (2010) ·Zbl 1219.93116号 ·doi:10.1016/j.cpc.2009.09.018
[35] Shao,Q.,Younes,A.,Fahs,A.,Mara,T.A.:用于全局敏感性分析的贝叶斯稀疏多项式混沌展开。计算。方法。申请。机械工程318、474-496(2017)·Zbl 1439.62088号 ·doi:10.1016/j.cma.2017.01.033
[36] Sobol’,I.M.:非线性数学模型的灵敏度估计。数学。建模计算。实验1,407-14(1993)·Zbl 1039.65505号
[37] Sobol’,I.M.:非线性数学模型的全局敏感性指数及其蒙特卡罗估计。数学。计算。模拟。55, 271-280 (2001) ·Zbl 1005.65004号 ·doi:10.1016/S0378-4754(00)00270-6
[38] Steefel,C.I.,DePaolo,D.J.,Lichtner,P.C.:反应输运建模:地球科学的一个基本工具和一种新的研究方法。地球行星。科学。莱特。240, 539-558 (2015) ·doi:10.1016/j.epsl.2005.09.017
[39] Steefel,C.I.,Appelo,C.A.J.,Arora,B.,Jacques,D.,Kalbacher,T.,Kolditz,O.,Lagneau,V.,Lichtner,P.,Mayer,C.K.U.,Meeussen,J.C.L.,Molins,S.,Moulton,D.,Shao,H.,Simunek,J.,Spycher,N.,Yabusaki,S.B.,Yeh,G.T.:地下环境模拟的反应传输代码。计算。地质科学。19, 445-478 (2015). https://doi.org/10.1007/s10596-014-9443-x ·Zbl 1323.86002号 ·doi:10.1007/s10596-014-9443-x
[40] Sudret,B.:使用多项式混沌展开进行全局敏感性分析。Reliab公司。工程系统。安全。93964-979(2008年)·doi:10.1016/j.ress.2007.04.002
[41] Sun,Y,Tong,C,Duan,Q,Buscheck,T,Blink,J.:结合模拟和仿真来校准顺序反应传输系统。运输多孔介质。92(2), 509-526 (2012) ·doi:10.1007/s11242-011-9917-4
[42] Vrugt,J.A.、ter Braak,C.、Diks,C.,Robinson,B.A.、Hyman,J.M.、Higdon,D.:通过自适应随机子空间采样的差分进化加速马尔可夫链蒙特卡罗模拟。国际非线性科学杂志。数字。模拟。10(3), 273-290 (2009) ·doi:10.1515/IJNSNS.2009.10.3.273
[43] Yin,J.、Haggerty,R.、Stoliker,D.L.、Kent,D.B.、Istok,J.D.、Greskowiak,J.和Zachar,M.:河流附近的瞬态地下水化学:实验室柱实验中对U(VI)迁移的影响。水资源。第47号决议,W04502(2001)。https://doi.org/10.1029/2010WR009369 ·doi:10.1029/20110WR009369
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。