×

扩散方程基于大规模优化的非负计算框架:并行实现和性能研究。 (英语) Zbl 1359.65250号

摘要:众所周知,在求解自共轭扩散方程的有限元方法下,通常选择的标准Galerkin公式不满足各向异性扩散方程的最大值原理和非负约束。最近,针对稳态和瞬态扩散型方程,提出了满足最大值原理和非负约束的基于优化的方法。迄今为止,这些方法仅在小规模学术问题上进行了测试。本文旨在系统研究非负方法在高性能计算(HPC)环境下的性能。PETSc和TAO库分别用于并行环境和优化求解器。对于大规模问题,计算科学家必须了解这些科学库中现有算法的计算性能。数值实验在最先进的HPC系统上进行,并使用单核性能模型来更好地表征求解器的效率。我们的研究表明,所提出的扩散型方程的非负计算框架对实际大规模问题具有良好的强标度性。

MSC公司:

65N30型 含偏微分方程边值问题的有限元、Rayleigh-Ritz和Galerkin方法
2005年5月 并行数值计算
35J25型 二阶椭圆方程的边值问题
35亿B50 偏微分方程背景下的最大原则
65年20月 数值算法的复杂性和性能
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Adams,R.J.,Fournier,J.J.F.:Sobolev Spaces,第二版。学术出版社,阿姆斯特丹(2003)·Zbl 1098.46001号
[2] Ayachit,U.:ParaView指南:并行可视化应用程序。Kitware,克利夫顿公园(2015)
[3] Balay,S.、Abhyankar,S.,Adams,M.F.、Brown,J.、Brune,P.、Buschelman,K.、Eijkhout,V.、Gropp,W.D.、Kaushik,D.、Knepley,M.G.、McInnes,L.C.、Rupp,K.,Smith,B.F.、Zampini,S.和Zhang,H.:PETSc用户手册。技术报告ANL-95/11-3.6版,阿贡国家实验室,2015年
[4] Benson,S.J.、Munson,T.S.:用于大规模应用的灵活互补解算器。最佳方案。方法软件。21, 155-168 (2006) ·Zbl 1181.90255号 ·doi:10.1080/10556780500065382
[5] Boyd,S.,Vandenberghe,L.:凸优化。剑桥大学出版社,英国剑桥(2004)·Zbl 1058.90049号 ·doi:10.1017/CBO9780511804441
[6] Childs,H.、Brugger,E.、Whitlock,B.、Meredith,J.、Ahern,S.、Pugmire,D.、Biagas,K.、Miller,M.、Harrison,C.、Weber,G.H.、Krishnan,H.,Fogal,T.、Sanderson,A.、Garth,C.、Bethel,E.W.、Camp,D.、Rübel,O.、Durant,M.,Favre,J.M.、Navrátil,P.:VisIt:可视化和分析超大数据的最终用户工具。摘自:《高性能可视化——实现极端规模的科学洞察力》(第357-372页)(2012年)。https://wci.llnl.gov/simulation/computer-codes/visit
[7] Ciarlet,P.G.,Raviart,P.-A.:有限元方法的最大值原理和一致收敛性。计算。方法应用。方法工程2,17-31(1973)·Zbl 0251.65069号 ·doi:10.1016/0045-7825(73)90019-4
[8] Evans,L.C.:偏微分方程。美国数学学会,普罗维登斯(1998)·Zbl 0902.35002号
[9] Facchinei,F.,Pang,J.-S.:有限维变分不等式和互补问题。施普林格,纽约(2003)·Zbl 1062.90002号
[10] Graser,C.,Kornhuber,R.:障碍物问题的多重网格方法。J.计算。数学。27, 1-44 (2009) ·兹比尔1199.65401
[11] Gropp,W.D.、Kaushik,D.K.、Keyes,D.E.、Smith,B.F.:隐式CFD代码的现实性能界限。《并行CFD’99会议录》,第233-240页。爱思唯尔(1999)·Zbl 1349.65630号
[12] Hammond,G.E.,Lichtner,P.C.:使用高性能计算的Hanford 300地区铀自然衰减的场尺度模型。水资源。第46号决议,W09602(2010年)·doi:10.1029/2009WR008819
[13] Harp,D.R.,Vesselinov,V.V.:利用信息差距理论进行污染物修复决策分析。斯托克。环境。Res.风险评估。27(1),159-168(2013)·doi:10.1007/s00477-012-0573-1
[14] Heikoop,J.M.,Johnson,T.M.,Birdsell,K.H.,Longmire,P.,Hickmott,D.D.,Jacobs,E.P.,Broxton,D.E.,Katzman,D.,Vesselinov,V.V.,Ding,M.,Vanimana,D.T.,Reneaua,S.L.,Goering,T.J.,Glessnerb,J.,Basu,A.:洛斯阿拉莫斯国家实验室地下水中人为六价铬减少的同位素证据。化学。地质。373, 1-9 (2014) ·doi:10.1016/j.chemgeo.2014.02.022
[15] Hjelmstad,K.D.:结构力学基础,第2版。施普林格,纽约(2005)
[16] Karra,S.、Painter,S.L.、Lichtner,P.C.:永久冻土区地下水文的三阶段数值模型(PFLOTRAN-ICE v1.0)。冰球8(5),1935-1950(2014)·doi:10.5194/tc-8-1935-2014年
[17] Karypis,G.,Kumar,V.:一种快速且高质量的划分不规则图的多级方案。SIAM J.科学。计算。20, 359-392 (1999) ·兹比尔0915.68129 ·doi:10.1137/S1064827595287997
[18] Kelkar,S.、Lewis,K.、Karra,S.和Zyvoloski,G.、Rapaka,S.以及Viswanathan,H.、Mishra,P.K.、Chu,S.,Coblentz,D.、Pawar,R.:模拟地下地质介质中热-水-机械耦合过程的模拟器。国际岩石力学杂志。最小科学。70, 569-580 (2014)
[19] Kinderlehrer,D.,Stampacchia,G.:变分不等式及其应用简介。《SIAM应用数学经典》,纽约(2000)·Zbl 0988.49003号 ·数字对象标识代码:10.1137/1.9780898719451
[20] Kirby,R.C.:FIAT:有限元基函数的数值构造,第13章。施普林格,纽约(2012)
[21] Knepley,M.G.,Brown,J.,Rupp,K.,Smith,B.F.:通过统一的剩余评估实现高绩效。arXiv:1309.1204,2013年9月·Zbl 1181.90255号
[22] Knepley,M.G.,Karpeev,D.A.:PDE与vieve I的网格算法:网格分布。科学。程序。17, 215-230 (2009)
[23] Lange,M.、Knepley,M.G.、Gorman.、。,G.J.:使用PETSc DMPlex进行灵活、可扩展的网格和数据管理。《第三届Exascale应用与软件国际会议论文集》,EASC’15,第71-76页。爱丁堡大学(2015)
[24] Lichtner,P.C.、Hammond,G.E.、Lu,C.、Karra,S.、Bisht,G.、Andre,B.、Mills,R.T.、Kumar,J.:PFLOTRAN用户手册:用于描述地表和地下过程的大规模并行反应流和传输模型。技术报告报告编号:LA-UR-15-20403,洛斯阿拉莫斯国家实验室,(2015)
[25] Lichtner,P.C.,Karra,S.:多孔介质中多尺度多相多组分反应流建模:使用pflotran应用于CO\[_22]隔离和增强地热能。在R.Al-Khoury和J.Bundschuh编辑的《CO\[22\]地质封存和压缩空气储能的计算模型》中,第81-136页。CRC出版社,http://www.crcnetbase.com/doi/pdfplus/10.1201/b16790-6网址, (2014)
[26] Liska,R.,Shashkov,M.:二阶椭圆问题线性有限元解的离散最大值原理。Commun公司。计算。物理学。3(4), 852-877 (2008) ·兹比尔1199.65381
[27] Lo,Y.J.,Williams,S.,Straalen,B.V.,Ligocki,T.J.,Cordery,M.J.,Wright,N.J.,Hall,M.W.,Oliker,L.:Roofline:多核建筑的一种有见地的视觉表现模型。高性能计算。系统。Perfom公司。模型。基准模拟。8966, 129-148 (2015)
[28] Logg,A.:计算网格的有效表示。国际期刊计算。科学。工程4,283-295(2009)·doi:10.1504/IJCSE.2009.029164
[29] Logg,A.、Mardal,K.A.、Wells,G.N.:用有限元法自动求解微分方程。施普林格,纽约(2012)·Zbl 1247.65105号 ·doi:10.1007/978-3642-23099-8
[30] May,D.A.,Brown,J.,Laetitia,L.L.:pTatin3D:长期岩石圈动力学的高性能方法。摘自:《高性能计算、网络、存储和分析国际会议论文集》,SC'14,第274-284页。IEEE出版社,(2014)
[31] McCalpin,J.:STREAM:高性能计算机中的可持续内存带宽,(1995年)。https://www.cs.virginia.edu/stream网址/
[32] Mudunuru,M.K.,Nakshatrala,K.B.:关于在有限元方法下对对流-扩散-反应方程实施最大值原理并实现元素-整体物种平衡。J.计算。物理学。305, 448-493 (2016) ·Zbl 1349.65630号 ·doi:10.1016/j.jcp.2015.09.057
[33] Mudunuru,M.K.,Nakshatrala,K.B.:关于满足比较原则、最大值原则和非负约束的网格限制:最新发展和新结果。《先进材料与结构力学》(2016)。doi:10.1080/15502287.2016.1166160·Zbl 1349.65630号 ·doi:10.1080/15502287.2016.1166160
[34] Munson,T.、Sarich,J.、Wild,S.、Benson,S.和McInnes,L.C.:TAO 2.0用户手册。技术报告ANL/MCS-TM-322,阿贡国家实验室数学和计算机科学部。http://www.mcs.anl.gov/tao (2012)
[35] Nagarajan,H.,Nakshatrala,K.B.:在一般计算网格上强制执行非负性约束和衰减扩散的最大值原理。国际期刊数字。《液体方法》67,820-847(2011)·Zbl 1229.65218号 ·文件编号:10.1002/fld.2389
[36] Nakshatrala,K.B.,Mudunuru,M.K.,Valocchi,A.J.:扩散控制双分子反应系统的数值框架,以执行最大值原理和非负约束。J.计算。物理学。253, 278-307 (2013) ·Zbl 1349.92011号 ·doi:10.1016/j.jp.2013.07.010
[37] Nakshatrala,K.B.,Nagarajan,H.,Shabouei,M.:瞬态扩散方程的最大值原理和非负约束的数值方法。Commun公司。计算。物理学。19, 53-93 (2016) ·Zbl 1388.65087号 ·doi:10.4208/cicp.180615.280815a
[38] Nakshatrala,K.B.,Valocchi,A.J.:张量扩散方程的非负混合有限元公式。J.计算。物理学。228, 6726-6752 (2009) ·Zbl 1175.65137号 ·doi:10.1016/j.jcp.2009.05.039
[39] Payette,G.S.,Nakshatrala,K.B.,Reddy,J.N.:关于扩散型方程的最大值原理和非负约束的高阶有限元性能。国际期刊数字。方法工程91,742-771(2012)·Zbl 1253.65190号 ·doi:10.1002/nme.4291
[40] Pruess,K.:TOUGH代码——可渗透介质中多相流和传输过程的模拟工具系列。渗流区J.3(3),738-746(2004)
[41] HDF集团。分层数据格式,版本5。http://www.hdfgroup.org/HDF5/ (1997-2015)
[42] Ulbrich,M.:函数空间中变分不等式和约束优化问题的半光滑牛顿方法。SIAM,费城(2011)·Zbl 1235.49001号
[43] 美国环保局。清理国家垃圾场:市场和技术趋势。技术报告EPA 542-R-04-015,(2004)
[44] Williams,S.、Waterman,A.、Patterson,D.:Roofline:多核架构的一种有见地的视觉性能模型。Commun公司。ACM 52,65-76(2009)·数字对象标识代码:10.1145/1498765.1498785
[45] Zyvoloski,G.:FEHM:模拟地下多相多流体传热和传质的控制体积有限元代码。洛斯阿拉莫斯未分类报告LA-UR-07-3359,(2007)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。