×

CFD积木算子的高效高阶谱元离散。 (英语) Zbl 1519.76229号

摘要:高阶方法在计算流体力学中得到了越来越多的关注。其中,谱元方法和间断Galerkin方法通过多项式基引入了元素线性近似。这导致少数操作员占用了CFD应用程序运行时的大部分时间。本文讨论了这些应用中最常见的张量积基。开发了各种实现方法,并对插值算子、亥姆霍兹算子和快速对角化算子进行了性能测试。对于每种情况,都可以获得高达50%的峰值性能,对于与仿真相关的每个多项式次数,都可以进行矩阵-矩阵乘法运算。然后,在一个具有(1.72)个网格点的燃烧问题上证明了所开发方法的极高效率。

MSC公司:

76平方米 谱方法在流体力学问题中的应用
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Abbud马德里,A。;Ronney,P.D.,光学厚气体中预混合火焰传播,AIAA J,31,11,2179-2181(1993)
[2] 阿塔克,M。;贝克,A。;Bolemann,T。;弗拉德·D。;弗兰克·H。;Munz,C.-D.,使用高阶非连续Galerkin谱元方法的高保真尺度重解计算流体动力学,科学与工程中的高性能计算'15,511-530(2016),Springer
[3] 贝克,AD;Bolemann,T。;弗拉德,D。;弗兰克·H。;GJ加斯纳;Hindenlang,F.,用于过渡流和湍流模拟的高阶非连续galerkin谱元方法,国际数值方法流体,76,8,522-548(2014)
[4] 博克霍恩,H。;弗罗里奇,J。;Schneider,K.,用于计算火焰球的自适应二维小波-小波算法,Combust-Teor模型,3,1,177-198(1999)·Zbl 0991.80514号
[5] Brown,J.,《三维节点高阶有限元的高效非线性求解器》,《科学计算杂志》,45,1-3,48-63(2010)·Zbl 1203.65245号
[6] Buis、PE;Dyksen,WR,张量积的有效向量和并行处理,ACM Trans Math Softw(TOMS),22,1,18-23(1996)·Zbl 0884.65037号
[7] 坎特韦尔,C。;Sherwin,S。;Kirby,R。;Kelly,P.,《从h到P高效:六面体和四面体元素上操作员评估的策略选择》,计算流体,43,1,23-28(2011)·Zbl 1452.76168号
[8] 德维尔,M。;菲舍尔,P。;Mund,E.,《不可压缩流体流动的高阶方法》(2002),剑桥大学出版社·Zbl 1007.76001号
[9] 弗罗里奇,J。;Lang,J.,燃烧问题的二维级联有限元计算,计算方法应用机械工程,158,3-4,255-267(1998)·Zbl 0954.76044号
[10] Gerlinger,W。;施耐德,K。;弗罗里奇,J。;Bockhorn,H.,球形火焰结构稳定性的数值模拟,Combust flame,132,1,247-271(2003)
[11] 后藤,K。;Van De Geijn,R.,《三级BLAS的高性能实现》,ACM Trans Math Softw,35,1(2008)
[12] 哈肯伯格博士。;Schöne,R。;Ilsche,T。;Molka,D。;Schuchart,J。;Geyer,R.,Intel Haswell处理器能效特性调查,并行分布式处理研讨会(IPDPSW),2015 IEEE国际(2015)
[13] 国际标准书号143981192X,9781439811924,doi:10.10201/ebk1439811924
[14] Haupt,L。;斯蒂勒,J。;Nagel,WE,结合静态凝聚和多重网格技术的快速谱元解算器,《计算物理杂志》,255384-395(2013)·Zbl 1349.65645号
[15] 海涅克,A。;Pabst,H。;Henry,G.,Libxsmm:一个用于小矩阵乘法的高性能库,《海报扩展摘要》,SC(2015)
[16] 赫斯特内斯,MR;Stiefel,E.,求解线性系统的共轭梯度方法,J Res Natl Bur Stand(1934),49,6,409-436(1952)·Zbl 0048.09901号
[17] 赫塞文,J.S。;Warburton,T.,Nodal非连续Galerkin方法:算法、分析和应用(2007),Springer Science&Business Media
[18] Hirata,S.,张量收缩引擎:组态相互作用、耦合簇和多体微扰理论的抽象和自动并行实现,J Phys Chem A,107,46/9887-9897(2003)
[19] 提交。
[20] 惠斯曼,I。;M.利伯。;斯蒂勒,J。;Fröhlich,J.,《计算流体动力学中CPU-GPU耦合的负载平衡》,(Wyrzykowski,R.;Dongarra,J.;Deelman,E.;Karczewski,K.,《并行处理与应用数学》(2018),斯普林格国际出版:斯普林格国际出版总社),337-347
[21] 惠斯曼,I。;斯蒂勒,J。;Fröhlich,J.,《缩放到恒星——p-多重网格的线性缩放椭圆解算器》,《计算物理杂志》,398108868(2019)·Zbl 1453.76152号
[22] Hutchinson,M。;海涅克,A。;Pabst,H。;亨利·G。;帕萨尼,M。;Keyes,D.,高阶谱元方法在PB级架构上的效率,高性能计算国际会议,449-466(2016),Springer
[23] Jin,H。;Jespersen,D。;梅赫罗特拉,P。;比斯瓦斯,R。;黄,L。;Chapman,B.,《在多核并行系统上使用MPI和OpenMP进行高性能计算》,《并行计算》,第37期,第562-575页(2011年)
[24] 卡尼亚达基斯,G。;Sherwin,S.,《CFD的光谱/hp元素方法》(1999),牛津大学出版社·Zbl 0954.76001号
[25] Koschichow,D。;弗罗里奇,J。;Ciorciari,R。;Niehuis,R.,使用DNS和U-RANS分析周期性通过尾迹对线性LPT叶栅端壁附近二次流的影响,ETC2015-151,第十一届欧洲涡轮机械流体动力学和热力学会议论文集(2015)
[26] Kronbichler,M。;Kormann,K.,基于并行单元的有限元算子应用的通用接口,计算流体,63,135-147(2012)·Zbl 1365.76121号
[27] Kronbichler,M。;Kormann,K.,不连续伽辽金有限元算子的快速无矩阵评估,ACM Trans-Math-Softw(TOMS),45,3,29(2019)·Zbl 1486.65253号
[28] Kronbichler,M。;Wall,WA,连续和非连续Galerkin方法与快速多重网格求解器的性能比较,SIAM J Scientif Compute,40,5,A3423-A3448(2018)·Zbl 1402.65163号
[29] Kwan,Y-Y;沈,J.,可分离椭圆问题的高效直接并行谱元求解器,计算物理杂志,225,2,1721-1735(2007)·Zbl 1123.65116号
[30] Lemaitre,F。;Lacassagne,L.,《小矩阵的批量Cholesky因子分解》,信号和图像处理(DASIP)设计与架构,2016年会议,130-137(2016),IEEE
[31] 伦巴第,J-EW;莫西·D·。;SJ Sherwin;JFA霍斯勒;丹达帕尼,S。;Taylor,MJ,翼尖涡的隐式大涡模拟,AIAA J,1-13(2015)
[32] 洛特斯,JW;Fischer,PF,用于光谱元素方法的混合多重网格/Swartz算法,J Sci-Comput,24,1,45-78(2005)·Zbl 1078.65570号
[33] 林奇(Lynch,R.)。;赖斯,J。;Thomas,D.,用张量积方法直接求解偏微分方程,数值数学,6,1,185-199(1964)·Zbl 0126.12703号
[34] 马萨利亚,I。;阿卜杜勒法塔赫,A。;海达尔,A。;托莫夫,S。;巴伯林,M。;Falcou,J.,《超小矩阵的高性能矩阵-矩阵乘法》,欧洲并行处理会议,659-671(2016),Springer·Zbl 1439.65061号
[35] Merzari,E。;指针,W。;Fischer,P.,逆流t型接头中流动的数值模拟和适当正交分解,J Fluids Eng,135,9,91304(2013)
[36] 莫西·D·。;坎特韦尔,C。;Kirby,R。;Sherwin,S.,用集体线性代数运算优化谱/hp元方法的性能,计算方法应用机械工程,310,628-645(2016)·Zbl 1439.65206号
[37] arXiv:171110885。
[38] OPENACC标准。ORG.OpenACC应用程序编程接口2.0a版。2012年发布:在线可用规范;统一资源定位地址http://www.openacc.org/sites/default/files/openacc.20a_1.pdf。
[39] OpenMP体系结构审查委员会。OpenMP应用程序接口版本4.0。2013年发布:在线可用规范;统一资源定位地址http://www.openmp.org/mp-documents/OpenMP4.0.0.pdf。
[40] Patera,AT,《流体动力学的谱元方法:通道扩张中的层流》,《计算物理杂志》,54,3468-488(1984)·Zbl 0535.76035号
[41] Poinsot,T。;Veynante,D.,《理论与数值燃烧》(2005),爱德华兹
[42] Rink,北美;惠斯曼,I。;Susungi,A。;Castrillon,J。;斯蒂勒,J。;Fröhlich,J.,CFDlang:流体动力学中高阶方法的高级代码生成,《真实世界领域特定语言研讨会论文集》2018,5:1-5:10(2018),ACM:ACM纽约,纽约,美国
[43] arXiv:190512468。
[44] Shewchuk,J.R.,《无痛苦共轭梯度法简介》,技术代表。;匹兹堡,宾夕法尼亚州,美国(1994年)
[45] 施普林格,P。;Bientinesi,P.,高性能类GEMM张量传感器乘法的设计,ACM Trans Math Softw(TOMS),44,3,28(2018)·Zbl 1484.65092号
[46] Stiller,J.,《高阶间断Galerkin方法的稳健多重网格:适用于高纵横比笛卡尔网格的快速泊松解算器》,《计算物理杂志》,327317-336(2016)·Zbl 1422.65412号
[47] Stiller,J.,谱元多重网格的非均匀加权Schwarz平滑器,科学计算杂志,72,1,81-96(2017)·Zbl 1371.65122号
[48] Susungi,A。;Rink,N.A。;Castrillón,J。;惠斯曼,I。;科恩,A。;Tadonki,C.,朝向合成和生成张量优化,Conf.生成编程:概念与经验(GPCE’17),169-175(2017)
[49] MPI论坛。MPI:消息传递接口版本3.0。2012
[50] 威廉姆斯,S。;沃特曼,A。;Patterson,D.,《Roofline:多核架构的一种有洞察力的视觉性能模型》,Commun ACM,52,4,65-76(2009)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。