×

GPU加速的线性弹性杂交间断Galerkin方法。 (英语) Zbl 1474.74100号

小结:我们设计并分析了一种高效的GPU加速的线性弹性杂交间断Galerkin方法。该方法的性能分析是使用最先进的时间精度大小(TAS)谱进行的。TAS是一种新的性能衡量标准,它考虑了解决方案的准确性。标准性能度量,如浮点运算或运行时,并不完全适合测量连续介质力学问题近似值的性能,因为它们忽略了解的准确性。标准屋顶线模型表明,我们的方法有效地利用了计算资源,因此,与串行实现相比,速度大大提高。通过将传统性能度量与新的时间精度度量相结合[J.Chang先生等,SIAM J.Sci。计算。40,第6号,C779–C802(2018;Zbl 1417.65224号)]在我们的性能模型中,我们能够得出关于哪些离散化最适合应用程序的更完整的结论。几个数值实验验证了我们的数值方案。

MSC公司:

74S05号 有限元方法在固体力学问题中的应用
2005年5月 并行数值计算
65N30型 含偏微分方程边值问题的有限元、Rayleigh-Ritz和Galerkin方法
65纳米55 多重网格方法;偏微分方程边值问题的域分解
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] M.ADAMS、M.BREZINA、J.HU和R.TUMINARO,《并行多重网格平滑:多项式与高斯赛德尔》,《计算物理杂志》,188(2003),第593-610页·Zbl 1022.65030号
[2] E.ANDERSON、Z.BAI、C.BISCHOF、L.S.BLACKFORD、J.DEMMEL、J.DONGARRA、J.DU CROZ、A.GREENBAUM、S.HAMMARLING、A.MCKENNEY等,《LAPACK用户指南》,暹罗,1999年·Zbl 0934.65030号
[3] H.ANZT、S.TOMOV、M.GATES、J.DONGARRA和V.HEUVELINE,GPU加速系统的块同步多重网格平滑器,《Procedia计算机科学》,9(2012),第7-16页。
[4] N.BELL、S.DALTON和L.N.OLSON,《揭示代数多网格方法中的细粒度并行性》,SIAM科学计算杂志,34(2012),第C123-C152页·Zbl 1253.65041号
[5] N.BELL和M.GARLAND,《Cusp:稀疏矩阵和图变换的通用并行算法》,0.3版。0, 35 (2012).
[6] C.坎特威尔、S.SHERWIN、R.KIRBY和P.KELLY,《从h到P高效:六面体和四面体元素操作员评估的策略选择》,《计算机与流体》,43(2011),第23-28页·Zbl 1452.76168号
[7] J.CHANG、M.S.FABIEN、M.G.KNEPLEY和R.T.MILLS,《使用时间-精度-尺寸(TAS)谱分析的有限元方法比较研究》,ArXiv电子版,(2018年)·Zbl 1417.65224号
[8] J.CHANG、K.B.NAKSHATRALA、M.G.KNEPLEY和L.JOHNSSON,解决PDE的并行计算框架的性能规范,并发与计算:实践与经验,30(2018),第4401页。
[9] G.CHEN和X.XIE,强对称应力线性弹性的稳健弱Galerkin有限元方法,应用数学计算方法,16(2016),第389-408页·兹比尔1360.74134
[10] J.CHENG,X.LIU,T.LIU,AND H.LUO,三维混合网格上Navier-Stokes方程的并行、高阶直接间断Galerkin方法,计算物理通信,21(2017),第1231-1257页·Zbl 1488.65410号
[11] P.CIARLET,椭圆问题的有限元方法,数学及其应用研究,爱思唯尔科学,1978年·Zbl 0383.65058号
[12] B.COCKBURN,对流占优问题的间断Galerkin方法简介,非线性双曲方程的高级数值逼近,Springer,1998年,第150-268页·Zbl 0927.65120号
[13] 《静态凝聚、杂交和HDG方法的设计》,载于《建筑桥梁:数值偏微分方程现代方法的联系和挑战》,Springer,2016年,第129-177页·Zbl 1357.65256号
[14] B.COCKBURN,D.A.DI PIETRO,AND A.ERN,桥接混合高阶和可杂交的不连续伽辽金方法,ESAIM:数学建模和数值分析,50(2016),第635-650页·Zbl 1341.65045号
[15] B.COCKBURN和G.FU,通过M分解设计线弹性对称近似应力的超收敛HDG方法,IMA数值分析杂志,38(2017),第566-604页·Zbl 1477.65205号
[16] B.COCKBURN、N.NGUYEN和J.PERAIRE,双曲线问题的HDG方法,《数值分析手册》,第17卷,Elsevier,2016年,第173-197页。
[17] B.COCKBURN和K.SHI,弱对称应力线性弹性的超收敛HDG方法,IMA数值分析杂志,33(2012),第747-770页·Zbl 1441.74235号
[18] D.COPPERSMITH和S.WINOGRAD,《通过算术级数进行矩阵乘法》,第十九届年度ACM计算理论研讨会的成果,(1987年),第1-6页。
[19] B.DALLY,《多核时代的计算机体系结构》,载于《计算机设计》,2006年。ICCD 2006。国际会议,IEEE,2007年,第1-1页。
[20] D.A.DI PIETRO和A.ERN,普通网格上线性弹性的混合高阶无锁方法,《应用力学与工程中的计算机方法》,283(2015),第1-21页·Zbl 1423.74876号
[21] M.DUBINER,三角形和其他域上的谱方法,《科学计算杂志》,6(1991),第345-390页·Zbl 0742.76059号
[22] M.S.FABIEN、M.G.KNEPLEY和B.RIVIERE,混合间断Galerkin几何多重网格方法的异构计算,arXiv预印本arXiv:1705.09907,(2017)。
[23] K.J.FIDKOWSKI、T.A.OLIVER、J.LU和D.L.DARMOFAL,可压缩navier-stokes方程的高阶不连续Galerkin离散化的p-多重网格解,计算物理学杂志,207(2005),第92-113页·Zbl 1177.76194号
[24] D.FORTUNATO、C.H.RYCROFT和R.SAYE,局部不连续Galerkin方法的高效算子约束多重网格方案,ArXiv电子版,(2018)。
[25] G.FU、B.COCKBURN和H.STOLARSKI,线性弹性HDG方法分析,《国际工程数值方法杂志》,102(2015),第551-575页·Zbl 1352.74037号
[26] A.GRUNDMANN和H.-M.MęLLER,用共同方法求解n单纯形的不变量积分公式,SIAM数值分析杂志,15(1978),第282-290页·Zbl 0376.65013号
[27] H.HAKULA、Y.LEINO和J.PITKáRANTA,壳体的尺度分辨率、锁定和高阶有限元建模,应用力学和工程中的计算机方法,133(1996),第157-182页·Zbl 0918.73111号
[28] A.HEINECKE、H.PABST和G.HENRY,Libxsmm:小矩阵乘法的高性能库,技术报告,(2015)。
[29] B.HELENBROOK、D.MAVRIPLIS和H.ATKINS,连续和不连续有限元离散的“p”多重网格分析,第16届AIAA计算流体动力学会议,2003年,第3989页。
[30] P.HEMKER,《关于多重网格程序中的延长和限制顺序》,《计算与应用数学杂志》,32(1990),第423-429页·Zbl 0717.65098号
[31] P.W.HEMKER,《关于多重网格程序中的延长和限制顺序》,《计算与应用数学杂志》,32(1990),第423-429页·Zbl 0717.65098号
[32] J.HUANG、T.M.SMITH、G.M.HENRY和R.A.VAN DE GEIJN,Strassen算法重新加载,《高性能计算、网络、存储和分析国际会议论文集》(2016),第59页。
[33] A.HUERTA、A.ANGELOSKI、X.ROCA和J.PERAIRE,连续和非连续Galerkin方法的高阶元素效率,《国际工程数值方法杂志》,96(2013),第529-560页·Zbl 1352.65512号
[34] A.HUNGRIA、D.PRADA和F.-J.SAYAS,《弹性动力学HDG方法、计算机和数学及其应用》,74(2017),第2671-2690页·Zbl 1395.74085号
[35] H.KABARIA、A.J.LEW和B.COCKBURN,非线性弹性的可杂交非连续Galerkin公式,应用力学与工程中的计算机方法,283(2015),第303-329页·Zbl 1423.74895号
[36] D.E.KEYES,L.C.MCINNES,C.WOODWARD,W.GROPP,E.MYRA,M.PERNICE,J.BELL,J.BROWN,A.CLO,J.CONNORS,ET AL.,《多物理模拟:挑战与机遇》,《国际高性能计算应用杂志》,27(2013),第4-83页。
[37] J.KING、S.YAKOVLEV、Z.FU、R.M.KIRBY和S.J.SHERWIN,利用流结构上的批处理解决二维椭圆有限元问题:混合非连续Galerkin(HDG)案例研究,科学计算杂志,60(2014),第457-482页·兹比尔1304.65250
[38] M.G.KNEPLEY、K.RUPP和A.R.TERREL,GPU上带求积的有限元积分,arXiv预印本arXiv:1607.04245,(2016)。
[39] T.KOORNWINDER,经典正交多项式的双变量类似物,《特殊函数的理论和应用》(Proc.Advanced Sem.,Math.Res.Center,Univ.Wisconsin,Madison,Wis.,1975),纽约学术出版社,1975年,第435-495页·Zbl 0326.33002号
[40] M.LARSON和F.BENGZON,《有限元方法:理论、实现和应用》,《计算科学与工程文本》,施普林格-柏林-海德堡出版社,2013年·Zbl 1263.65116号
[41] C.L.LAWSON、R.J.HANSON、D.R.KINCAID和F.T.KROGH,fortran使用的基本线性代数子程序,ACM数学软件交易(TOMS),5(1979),第308-323页·Zbl 0412.65022号
[42] I.MASLIAH、A.ABDELFATTAH、A.HAIDAR、S.TOMOV、M.BABOULIN、J.FALCOU和J.DONGARRA,超小矩阵的高性能矩阵-矩阵乘法,欧洲并行处理会议,(2016),第659-671页·Zbl 1439.65061号
[43] N.C.NGUYEN和J.PERAIRE,连续体力学中偏微分方程的可混合不连续伽辽金方法,计算物理学杂志,231(2012),第5955-5988页·Zbl 1277.65082号
[44] N.C.NGUYEN、J.PERAIRE和B.COCKBURN,斯托克斯流的混合间断Galerkin方法,应用力学和工程中的计算机方法,199(2010),第582-597页·Zbl 1227.76036号
[45] J.NICKOLLS和W.J.DALLY,《GPU计算时代》,IEEE micro,30(2010)。
[46] NVIDIA,cuBLAS图书馆,NVIDIA Corporation,加利福尼亚州圣克拉拉,15(2008),第31页。[47],库达。https://developer.nvidia.com/cuda-zone网站, 2008. 访问时间:2017-05-30。
[47] M.A.OLSHANSKII和E.E.TYRTSHNIKOV,线性系统的迭代方法:理论和应用,第138卷,SIAM,2014年·Zbl 1320.65050号
[48] L.N.OLSON、J.SCHRODER和R.S.TUMINARO,《代数多重网格中强度度量的新观点》,《数值线性代数及其应用》,17(2010),第713-733页·Zbl 1240.65360号
[49] R.G.OWENS,三角形上的谱近似,《伦敦皇家学会学报A:数学、物理和工程科学》,454(1998),第857-872页·Zbl 0915.35077号
[50] J.PRORIOL,Sur une famille de polynomesádeux variables orthonaux dans un triangle,《科学院学报》,245(1957),第2459-2461页·Zbl 0080.05204号
[51] H.QI,L.-H.WANG,AND W.-Y.ZHENG,关于三维弹性的无锁有限元格式,计算数学杂志,(2005),第101-112页·Zbl 1101.74056号
[52] W.QIU,J.SHEN,AND K.SHI,强对称应力线性弹性的HDG方法,arXiv预印本arXiv:1312.1407,(2013)。
[53] X.ROCA、N.C.NGUYEN和J.PERAIRE,可杂交非连续Galerkin方法的GPU加速稀疏矩阵向量积,载于第49届AIAA航空航天科学会议,包括新视野论坛和航空航天博览会,2011年,第687页。
[54] Y.SAAD,稀疏线性系统的迭代方法,第82卷,siam,2003年·Zbl 1002.65042号
[55] R.SEVILLA、M.GIACOMINI和A.HUERTA,线性弹性的无锁定面心有限体积(FCFV)方法,arXiv预印本arXiv:1806.07500,(2018)。
[56] R.SEVILLA、M.GIACOMINI、A.KARKOULIAS和A.HUERTA,线性弹性的超收敛hy-Bridable间断Galerkin方法,arXiv预印本arXiv:1802.02123,(2018)。
[57] S.-C.SOON、B.COCKBURN和H.K.STOLARSKI,线性弹性的杂交间断Galerkin方法,国际工程数值方法杂志,80(2009),第1058-1092页·Zbl 1176.74196号
[58] C.W.O.U.TROTTENBERG和A.SCHüLLER,多重网格,学术出版社,2001年·Zbl 0976.65106号
[59] W.L.WAN、T.F.CHAN和B.SMITH,稳健多网格方法的能量最小化插值,SIAM科学计算杂志,21(1999),第1632-1649页·Zbl 0966.65098号
[60] S.WANDZURAT和H.XIAO,三角形上的对称求积规则,计算机与数学应用,45(2003),第1829-1840页·Zbl 1050.65022号
[61] R.WANG和R.ZHANG,混合形式线性弹性问题的弱Galerkin有限元方法,计算数学杂志,36(2018),第469-491页·Zbl 1424.74046号
[62] P.WESSELING,《多重网格方法简介》,《纯数学和应用数学》,John Wiley&Sons Australia,Limited,1992年·Zbl 0760.65092号
[63] S.WILLIAMS、A.WATERMAN和D.PATTERSON,《Roofline:多核架构的一种有洞察力的视觉性能模型》,《ACM通信》,52(2009),第65-76页。
[64] V.V.WILLIAMS,《o(n2.373)时间矩阵乘法》,技术报告,(2014)。
[65] Q.ZHANG、C.ZHU和M.ZHU,基于GPU-CUDA加速算法的格子Boltzmann方法对液滴蒸发时间的三维数值模拟,《计算物理学报》,23(2018),第1150-1166页·Zbl 1474.76064号
[66] J.ZHAO AND H.TANG,《特殊相对论流体力学的龙格-库塔中心不连续伽辽金方法》,《计算物理学通讯》,22(2017),第643-682页·Zbl 1488.76090号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。