×

混合网格上向量值偏微分方程的模板缩放及其在广义牛顿流体中的应用。 (英语) 兹比尔1508.65157

摘要:由于大大减少了内存消耗,大型应用程序的无矩阵有限元实现为标准稀疏矩阵数据格式提供了一个有吸引力的替代方案。在这里,我们表明,如果结合适当的模板缩放技术,它们在低阶情况下的运行时间方面也具有竞争力。我们关注于变系数向量值偏微分方程,因为它们在许多物理应用中出现。该方法基于线性有限元离散化产生的缩放常数参考模板,而不是动态评估双线性形式。该方法假定使用分层混合网格,可以直接应用于向量值二阶椭圆偏微分方程,也可以作为更复杂问题的一部分。我们提供了理论和实验性能估计,表明了与传统的现场集成和存储矩阵方法相比,这种新方法的优势。在我们的数值实验中,我们考虑了两个特定的数学模型,即线性弹性静力学和不可压缩Stokes流。最后一个例子考虑了非线性剪切收缩广义牛顿流体。对于这类非线性,我们提出了一种有效的方法来计算正则化应变率,然后将其用于定义节点方向的粘度。根据计算架构的不同,与实时集成相比,我们可以观察到64%和122%的最大加速。最大的被考虑的例子是在最先进的超级计算机SuperMUC-NG上用12288个计算核解决Stokes问题。

理学硕士:

65N30型 含偏微分方程边值问题的有限元、Rayleigh-Ritz和Galerkin方法
65号55 多重网格方法;偏微分方程边值问题的域分解
第65年 并行数值计算
65年20月 数值算法的复杂性和性能
76D07型 斯托克斯和相关(Oseen等)流量
76D05型 不可压缩粘性流体的Navier-Stokes方程
74B10型 具有初始应力的线性弹性

软件:

HyTeG公司
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] A.Afzal,《计算成本:科学计算中现代多核系统的度量与模型》,硕士论文,信息学系,埃伦根-努恩贝格弗里德里希·亚历山大大学,2015年。
[2] C.L.Alappat、J.Hofmann、G.Hager、H.Fehske、A.R.Bishop和G.Wellein,了解Intel Broadwell和Cascade Lake处理器上的HPC基准性能,预印本,https://arxiv.org/abs/2002.03344, 2020.
[3] P.Arbenz、G.H.van Lenth、U.Mennel、R.Muöller和M.Sala,《人体骨骼结构无矩阵有限元分析的可扩展多级预处理程序》,国际期刊Numer。方法工程,73(2008),第927-947页·Zbl 1262.74031号
[4] S.Bauer、D.Drzisga、M.Mohr、U.Ruïde、C.Waluga和B.Wohlmuth,加速无矩阵有限元实现的模板缩放方法,SIAM J.Sci。计算。,40(2018),第C748-C778页,https://doi.org/10.1137/17M1148384。 ·Zbl 1410.65425号
[5] B.Bergen,《分层混合网格:超级计算机上高效有限元模拟的数据结构和核心算法》,SCS出版社,2005年。
[6] B.Bergen和F.Huílsemann,《分层混合网格:多重网格的数据结构和核心算法》,Numer。线性代数应用。,11(2004年),第279-291页·兹比尔1164.65517
[7] B.Bergen、G.Wellein、F.Hu¨lsemann和U.Ru¨de,《分层混合网格:在大规模有限元模拟中实现TERAFLOP性能》,国际期刊《并行紧急分布系统》。,22(2007年),第311-329页。
[8] J.Bey,《四面体网格细化》,《计算》,55(1995),第355-378页·Zbl 0839.65135号
[9] J.Bielak、O.Ghattas和E.-J.Kim,用于大规模地震地面运动模拟的并行八叉树有限元方法,CMES Compute。模型。工程科学。,10(2005年),第99-112页·Zbl 1232.86004号
[10] F.Brezzi和J.Pitkaïranta,《关于斯托克斯方程有限元近似的稳定性》,《椭圆系统的有效解》,施普林格,1984年,第11-19页·Zbl 0552.76002号
[11] J.Brown,《D(3)中节点高阶有限元的高效非线性解算器》,J.Sci。计算。,45(2010年),第48-63页·Zbl 1203.65245号
[12] G.F.Carey和B.N.Jiang,单元线性和非线性解方案,Comm.Appl。数字。方法,2(1986年),第145-153页·Zbl 0591.65075号
[13] R.S.Dembo、S.C.Eisenstat和T.Steihaug,《不精确牛顿法》,SIAM J.Numer。分析。,19(1982),第400-408页,https://doi.org/10.1137/0719025。 ·Zbl 0478.65030号
[14] D.Drzisga、L.John、U.Rude、B.Wohlmuth和W.Zulehner,《关于鞍点问题的块平滑器分析》,SIAM J.Matrix Anal。申请。,39(2018),第932-960页,https://doi.org/10.1137/16M1106304。 ·兹比尔1391.65064
[15] C.Flaig和P.Arbenz,《基于无点八叉树的有限元分析的高可伸缩无矩阵多重网格解算器》,载于《大尺度科学计算:第八届国际会议》(LSSC 2011),保加利亚索佐波尔,修订论文集,I.Lirkov,S.Margenov,J.Wasíniewski,eds.,Springer,2012,第498-506页。
[16] G.P.Galdi、R.Rannacher、A.M.Robertson和S.Turek,《血流动力学:建模、分析和模拟》,Birkha¨user出版社,2008年·Zbl 1137.76005号
[17] L.J.Gibson和M.F.Ashby,《细胞固体:结构和性质》,剑桥大学出版社,1999年·Zbl 0723.73004号
[18] B.Gmeiner、T.Gradl、H.Ko¨stler和U.Ru¨de,分层混合电网的高度并行几何多重网格算法,摘自2012年NIC研讨会——德国Ju¨lich会议记录,NIC Ser。2012年第45期,第323-330页。
[19] G.Hager和G.Wellein,《科学家和工程师高性能计算导论》,CRC出版社,2010年。
[20] A.Ilic、F.Pratas和L.Sousa,Cache-aware Roofline模型:升级阁楼,IEEE计算。建筑Lett。,13(2013),第21-24页。
[21] 英特尔公司、英特尔顾问、,https://software.intel.com/en-us/intel-advisor-xe, 2019.
[22] 英特尔公司、英特尔VTune档案器、,https://software.intel.com/en-us/vtune(https://software.intel.com/en-us/vtune), 2019.
[23] N.Kohl、D.Thoïnnes、D.Drzisga、D.Bartuschat和U.Ruïde,用于可扩展多网格求解器的HyTeG有限元软件框架,Int.J.Parallel Emergent Distrib.Syst。,34(2019年),第477-496页。
[24] M.Kronbichler和K.Kormann,基于并行单元的有限元算子应用的通用接口,计算与《流体》,63(2012),第135-147页·Zbl 1365.76121号
[25] K.Ljungkvist,采用自适应细化非结构化网格的图形处理器上的无矩阵有限元计算,第25届高性能计算研讨会论文集(HPC’17),国际计算机模拟学会,2017年,第1:1-1:12页。
[26] K.Ljungkvist和M.Kronbichler,《图形处理器上无矩阵有限元计算的多重网格》,技术报告2017-006,乌普萨拉大学信息技术系,2017年。
[27] J.Loffeld和J.Hittinger,《关于双曲守恒律方程组高阶有限体积离散化的算术强度》,《国际高性能计算》。申请。,33(2019年),第25-52页。
[28] LRZ,SuperMUC-NG硬件,https://doku.lrz.de/display/PUBLIC/硬件++SuperMUC-NG(2020年2月25日检索)。
[29] LRZ、SuperMUC Petascale系统,https://www.lrz.de/services/compute/supermuc/systemdescription网站/(2018年11月29日检索)。
[30] D.A.May、J.Brown和L.L.Pourhiet,非均匀Stokes流有限元离散的可扩展无矩阵多重网格预处理程序,计算。方法应用。机械。工程,290(2015),第496-523页·兹比尔1423.76259
[31] Y.Ricard,《地幔对流物理学》,《地球物理学论著》,7(2007),第31-81页。
[32] U.Ruíde、C.Waluga和B.Wohlmuth,并置网格上流动和传输保守耦合的质量修正,J.Compute。物理。,305(2016),第319-332页·Zbl 1349.76279号
[33] J.Rudi、G.Stadler和O.Ghattas,《针对高非均相粘度Stokes流问题的加权BFBT预处理器》,SIAM J.Sci。计算。,39(2017),第S272-S297页,https://doi.org/10.1137/16M108450X。 ·Zbl 1392.65039号
[34] H.Stengel、J.Treibig、G.Hager和G.Wellein,《使用执行-检查-记忆模型量化模板计算的性能瓶颈》,载于《第29届ACM超级计算国际会议论文集》,ACM,2015年,第207-216页。
[35] B.van Rietbergen、H.Weinans、R.Huiskes和B.Polman,《使用体素数据的大型有限元应用程序迭代解的计算策略》,国际数值杂志。方法工程,39(1996),第2743-2767页·Zbl 0883.73079号
[36] S.Williams、A.Waterman和D.Patterson,《Roofline:多核架构的一个有洞察力的视觉性能模型》,Commun。ACM,52(2009),第65-76页。
[37] Y.Zhang、D.Rodrigue和A.Ait-Kadi,《高密度聚乙烯泡沫》。二、。弹性模量,J.Appl。聚合物科学。,90(2003),第2120-2129页。
[38] O.C.Zienkiewicz和J.Z.Zhu,超收敛补丁恢复和后验误差估计:第1部分:恢复技术,国际数值杂志。方法工程,33(1992),第1331-1364页·Zbl 0769.73084号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。