×

Stokes系统分层混合多重网格求解器的性能和可扩展性。 (英语) Zbl 1320.65188号

摘要:在涉及不可压缩流体流动的许多应用中,斯托克斯系统起着重要作用。复杂的流动问题可能需要非常精细的解决方案,很容易导致未知量超过一万亿(10^{12})的鞍点问题。即使在最先进的超级计算机上,快速求解此类方程组也是一项非常重要且具有挑战性的任务。在这项工作中,我们考虑了一个迭代鞍点求解器的实现,该求解器在数学上基于压力的Schur-complement公式,在算法上基于分层混合网格的抽象概念。我们的快速多重网格解算器的设计由计算内核的创新性能分析以及通信开销的量化指导。在现代超级计算机的不同特征类型上,展示了卓越的节点性能和对近百万个并行线程的良好可扩展性。

MSC公司:

65牛顿50 涉及偏微分方程的边值问题的网格生成、细化和自适应方法
65N30型 含偏微分方程边值问题的有限元、Rayleigh-Ritz和Galerkin方法
第65年 并行数值计算
76M10个 有限元方法在流体力学问题中的应用
第76天07 斯托克斯和相关(Oseen等)流
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] W.Bangerth、C.Burstede、T.Heister和M.Kronbichler,{大规模并行通用自适应有限元代码的算法和数据结构},ACM Trans。数学。《软件》,38(2011),第14条·Zbl 1365.65247号
[2] P.Bastian、M.Blatt、A.Dedner、C.Engwer、R.Klo¨fkorn、M.Ohlberger和O.Sander,{it并行和自适应科学计算的通用网格接口。I:抽象框架},《计算》,82(2008),第103-119页·Zbl 1151.65089号
[3] J.R.Baumgardner和P.O.Frederickson,{\it两个球体的二十面体离散化},SIAM J.Numer。分析。,22(1985年),第1107-1115页·Zbl 0601.65084号
[4] M.Bercovier和O.Pironneau,{原始变量中Stokes问题有限元方法解的误差估计},Numer。数学。,33(1979年),第211-224页·Zbl 0423.65058号
[5] B.Bergen,T.Gradl,U.Ru¨de,and F.Hu¨lsemann,《有限元大规模并行多重网格法》,计算。科学。《工程》,第8期(2006年),第56-62页。
[6] B.Bergen和F.Huílsemann,《分层混合网格:多重网格的数据结构和核心算法》,Numer。线性代数应用。,11(2004年),第279-291页·Zbl 1164.65517号
[7] F.Brezzi、D.Boffi、L.Demkowicz、R.G.Duran、R.S.Falk和M.Fortin,{混合有限元、相容条件和应用},Springer-Verlag,柏林,2008年。
[8] A.N.Brooks和T.J.R.Hughes,{对流主导流动的流线迎风/Petrov-Galerkin公式,特别强调不可压缩Navier-Stokes方程},计算。方法应用。机械。工程,32(1982),第199-259页·Zbl 0497.76041号
[9] H.P.Bunge和J.R.Baumgardner,{并行虚拟机上的地幔对流建模},计算。物理。,9(1995),第207-215页。
[10] C.Burstede、G.Stadler、L.Alisic、L.C.Wilcox、E.Tan、M.Gurnis和O.Ghattas,{大尺度自适应地幔对流模拟},地球物理学。《国际期刊》,192(2013),第889-906页。
[11] C.Burstede、L.C.Wilcox和O.Ghattas,{\it\textttp\(4)est:八叉树林上并行自适应网格细化的可缩放算法},SIAM J.Sci。计算。,33(2011年),第1103-1133页·Zbl 1230.65106号
[12] B.Chapman、G.Jost和R.Van Der Pas,{使用OpenMP:可移植共享内存并行编程},科学。工程计算。10,麻省理工学院出版社,马萨诸塞州剑桥,2008年。
[13] D.Chen,N.Eisley,P.Heidelberger,S.Kumar,A.Mamidala,F.Petrini,R.Senger,Y.Sugawara,R.Walkup,B.Steinmacher-Burow等,{\it Looking under the hood of the IBM Blue Gene/Q network},《高性能计算、网络、存储和分析国际会议论文集》,IEEE计算机社会出版社,皮斯卡塔韦,新泽西州,2012年,第69条。
[14] D.Chen、N.A.Eisley、P.Heidelberger、R.M.Senger、Y.Sugawara、S.Kumar、V.Salapura、D.L.Satterfield、B.Steinmacher-Brow和J.J.Parker,《2011年高性能计算、网络、存储和分析国际会议论文集》,IEEE,新泽西州皮斯卡塔韦,2011年,第1-10页。
[15] E.Chow、R.D.Falgout、J.J.Hu、R.S.Tuminaro和U.Meier-Yang,《多重网格求解器的并行化技术概览》,载于《科学计算的并行处理》,M.A.Heroux、P.Raghavan和H.D.Simon编辑,《软件、环境和工具20》,SIAM,费城,2006年,第179-201页。
[16] T.Dickopf、D.Krause、R.Krause和M.Potse,《求解单域方程的轻量级并行自适应方案的分析》,技术报告,瑞士卢加诺大学计算科学研究所,2013年·Zbl 1323.92055号
[17] H.C.Elman、D.J.Silvester和A.J.Wathern,《有限元与快速迭代求解器:在不可压缩流体动力学中的应用》,牛津大学出版社,纽约,2005年·Zbl 1083.76001号
[18] R.D.Falgout、J.E.Jones和U.Meier-Yang,{《并行计算机上偏微分方程数值解中并行高性能预处理器库hypre的设计与实现》,Lect。注释计算。科学。Eng.51,Springer,柏林,2006年,第267-294页·Zbl 1097.65059号
[19] C.Flaig和P.Arbenz,{基于CT图像的微单元分析的可扩展内存高效多重网格解算器},并行计算。,37(2011),第846-854页。
[20] J.Gaidamour、J.Hu、C.Siefert和R.Tuminaro,《柔性多网格预处理库的设计考虑》,科学编程,20(2012),第223-239页。
[21] T.Geenen、M.ur Rehman、S.P.MacLachlan、G.Segal、C.Vuik、A.P.van den Berg和W.Spakman,《非结构化有限元地球动力学建模应用的可伸缩稳健解算器:求解具有较大局部粘度对比的模型的Stokes方程》,Geochem。地球物理学。地质系统。,10(2009),Q09002。
[22] M.Geimer、F.Wolf、B.J.N.Wylie、E.AábrahaíM、D.Becker和B.Mohr,{it The Scalasca performance toolset architecture},《并发与计算:实践与经验》,22(2010),第702-719页。
[23] C.Geuzaine和J.-F.Remacle,{it GMSH:A(3)-d有限元网格生成器,内置预处理和后处理设施},国际。J.数字。方法工程,79(2009),第1309-1331页·Zbl 1176.74181号
[24] P.Ghysels和W.Vanrose,《多核计算机体系结构上几何多重网格的性能建模》,SIAM J.Sci。计算。,出现。
[25] B.Gmeiner,T.Gradl,F.Gaspar,和U.Ruíde,{通过局部傅里叶分析优化半结构网格上的多重网格收敛速度},计算。数学。申请。,65(2013),第694-711页·Zbl 1319.65118号
[26] B.Gmeiner、H.Ko¨stler、M.Sturmer和U.Ru¨de,《分层混合网格上的并行多重网格:当前高性能计算集群的性能研究》,并发与计算:实践与经验,26(2014),第217-240页。
[27] B.Gmeiner、M.Mohr和U.Ruíde,《地幔对流的分层混合网格:首次研究》,摘自《第十一届并行与分布式计算国际研讨会论文集》,IEEE,新泽西州皮斯卡塔韦,2012年,第309-314页。
[28] P.P.Grinevich和M.A.Olshanskii,{变粘度Stokes型问题的迭代方法},SIAM J.Sci。计算。,31(2009年),第3959-3978页·Zbl 1410.76290号
[29] W.Gropp、E.Lusk和A.Skjellum,《使用MPI:使用消息传递接口的可移植并行编程》,科学。工程计算。麻省理工学院出版社,马萨诸塞州剑桥,1999年·Zbl 0875.68206号
[30] G.Hager、J.Treibig、J.Habich和G.Wellein,《通过简单机器模型探索现代多核芯片的性能和功率特性》,《并发与计算:实践与经验》,2014年12月12日在线出版。
[31] G.Hager和G.Wellein,《科学家和工程师高性能计算导论》,CRC出版社,佛罗里达州博卡拉顿,2010年。
[32] V.Heuveline、D Lukarski、N.Trost和J.-P.Weiss,{使用多核CPU和GPU局部细化网格上基于矩阵的几何多重网格方法的并行平滑器},《面对多核挑战II》,《计算讲义》。科学。7174,Springer-Verlag,柏林,海德堡,2012年,第158-171页。
[33] T.J.R.Hughes、L.P.Franca和M.Balestra,{it计算流体动力学的一种新的有限元公式:V.避开Babuška-Brezzi条件:Stokes问题的稳定Petrov-Galerkin公式,适应等阶插值},计算。方法应用。机械。工程,59(1986),第85-99页·Zbl 0622.76077号
[34] F.Huílsemann,M.Kowarschik,M.Mohr,and U.Ruíde,{\it Parallel geometry multigrid},《并行计算机上偏微分方程数值解》,A.M.Bruaset and A.Tveito,eds.,Lect。注释计算。科学。Eng.51,Springer,柏林,2005年,第165-208页·Zbl 1097.65123号
[35] M.Kowarschik、U.Ruïde、C.Weiss和W.Karl,{\it缓存感知多重网格方法用于求解二维泊松方程},计算,64(2000),第381-399页·Zbl 0957.68002号
[36] M.Kronbichler、T.Heister和W.Bangerth,{通过现代数值方法进行高精度地幔对流模拟},《地球物理杂志》,191(2012),第12-29页。
[37] S.Kumar,A.R.Mamidala,D.A.Faraj,B.Smith,M.Blocksome,B.Cernohous,D.Miller,J.Parker,J.Ratterman,P.Heidelberger等人,{it PAMI:Blue Gene/Q超级计算机的并行活动消息接口},第26届国际并行与分布式处理研讨会(IPDPS)论文集,IEEE,新泽西州皮斯卡塔韦,2012,第763-773页。
[38] A.Logg、K.B.Ølgaard、M.E.Rognes和G.N.Wells,《有限元法自动求解微分方程》,Lect。注释计算。科学。Eng.84,A.Logg,K.-A.Mardal和G.N.Wells编辑,柏林施普林格出版社,2012年,第11章·Zbl 1247.65105号
[39] C.Lomont,《INTEL高级矢量扩展简介》,英特尔白皮书,2011年。
[40] J.D.McCalpin,{当前高性能计算机中的内存带宽和机器平衡},IEEE计算机学会计算机体系结构技术委员会(TCCA)通讯,1995年,第19-25页。
[41] E.H.Mueller和R.Scheichl,《数值天气和气候预测中椭圆偏微分方程的大规模并行解算器》,预印本,ArXiv:1307.2036[CS.DC],2013年。
[42] A.Neic、M.Liebmann、G.Haase和G.Plank,CPU和GPU集群上的代数多重网格解算器},《应用并行和科学计算》,《计算讲义》。科学。7134,Springer-Verlag,柏林,海德堡,2012年,第389-398页。
[43] G.Romanazzi和P.K.Jimack,{分布式内存体系结构上多重网格代码的并行性能预测},《高性能计算与通信》,《计算讲义》。科学。4782,Springer-Verlag,柏林,海德堡,2007年,第647-658页。
[44] H.Sundar、G.Biros、C.Burstedde、J.Rudi、O.Ghattas和G.Stadler,《八叉树非结构化森林上的并行几何代数多重网格》,《高性能计算、网络、存储和分析国际会议论文集》,IEEE,新泽西州皮斯卡塔韦,2012年,第43条。
[45] J.Treibig和G.Hager,《介绍带宽限制的循环内核的性能模型》,《并行处理和应用数学》,R.Wyrzykowski、J.Dongarra、K.Karczewski和J.Wasniewski编辑,《计算讲义》。科学。6067,Springer-Verlag,柏林,海德堡,2010年,第615-624页。
[46] R.Verfuörth,{一种求解Stokes问题数值解的组合共轭梯度多重网格算法},IMA J.Numer。分析。,4(1984),第441-455页·Zbl 0563.76028号
[47] M.Wang和L.Chen,{使用基于最小二乘交换子的分布高斯-赛德尔松弛求解Stokes方程的多重网格方法},J.Sci。计算。,56(2013),第409-431页·Zbl 1426.76316号
[48] C.Wieners,{\it并行有限元的几何数据结构及其在块平滑多重网格方法中的应用},计算。视觉。科学。,13(2010年),第161-175页·Zbl 1216.65164号
[49] S.Webb Williams、A.Waterman和D.A.Patterson,{it Roofline:浮点程序和多核架构的有见地的可视化性能模型},UCB/EECS-2008-134技术报告,加州大学伯克利分校EECS系,2008年。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。