×

利用MPI在大型GPU集群上进行高阶有限元地震波传播建模。 (英语) Zbl 1194.86019号

小结:我们实现了一个高阶有限元应用程序,该应用程序对地震波传播进行数值模拟,例如由大陆规模的地震或石油工业中的主动地震采集实验引起的地震波传播,使用CUDA编程环境和基于MPI的非阻塞消息传递在NVIDIA Tesla图形卡的大型集群上。与许多有限元实现相反,我们的实现以单精度成功实现,最大限度地提高了当前一代GPU的性能。我们讨论了代码的实现和优化,并将其与现有的C语言和MPI在经典CPU节点集群上的优化实现进行了比较。我们使用网格着色来有效地处理非结构化网格上自由度的求和操作,以及非阻塞MPI消息,以重叠网络上的通信以及通过PCIe与GPU上的计算进行设备之间的数据传输。我们进行了一些数值测试,以验证单精度CUDA和MPI实现并评估其准确性。然后,我们分析性能度量,根据问题如何映射到参考CPU集群,我们可以获得20倍或12倍的加速。

MSC公司:

第86页第17页 全球动力学、地震问题(MSC2010)
74S05号 有限元方法在固体力学问题中的应用
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] J.D.欧文斯。;马萨诸塞州休斯顿。;Luebke,D.P。;格林,S。;斯通,J.E。;Phillips,J.C.,GPU计算,Proc。IEEE,96,5,879-899(2008)
[2] 加兰,M。;格兰德,S.L。;Nickolls,J。;安德森,J.A。;哈德威克,J。;莫顿,S。;菲利普斯·E·H。;Zhang,Y。;Volkov,V.,CUDA并行计算经验,IEEE Micro,28,4,13-27(2008)
[3] Che,S。;博伊尔,M。;孟,J。;Tarjan,D。;Sheaffer,J.W。;Skadron,K.,《使用CUDA的图形处理器上通用应用程序的性能研究》,J.并行分布计算。,68, 10, 1370-1380 (2008)
[4] 柯克,D.B。;Hwu,W.-M.W.,《大规模并行处理器编程:一种实践方法》(2010),摩根·考夫曼:摩根·考夫曼波士顿,美国马萨诸塞州
[5] NVIDIA公司,NVIDIA的下一代CUDA计算架构:FERMI,技术代表,NVIDIA,美国加利福尼亚州圣克拉拉,第22页,2009a,URL<http://www.nvidia.com/object/fermi_architecture.html>; NVIDIA Corporation,NVIDIA's Next Generation CUDA Compute Architecture:FERMI,技术代表,美国加利福尼亚州圣克拉拉市NVIDIA,22p.,2009a,URL<http://www.nvidia.com/object/fermi_architecture.html>
[6] D.Göddeke,《GPU集群上PDE仿真的快速准确有限元多重网格解算器》,博士论文,多特蒙德理工大学,法库特富尔数学研究所,2010年<http://hdl.handle.net/2003/27243>; D.Göddeke,《GPU集群上PDE仿真的快速准确有限元多重网格解算器》,博士论文,多特蒙德理工大学,法库特富尔数学研究所,2010年<http://hdl.handle.net/2003/27243>
[7] J.D.欧文斯。;Luebke,D.P。;Govindaraju,N.K。;哈里斯,M.J。;Krüger,J。;Lefohn,A.E。;Purcell,T.J.,《图形硬件通用计算概览》,《计算》。图表。论坛,26,1,80-113(2007)
[8] NVIDIA Corporation,NVIDIA-CUDA编程指南2.3版,美国加利福尼亚州圣克拉拉,URL,139 p.,2009b<http://www.nvidia.com/cuda>; NVIDIA Corporation,NVIDIA-CUDA编程指南2.3版,美国加利福尼亚州圣克拉拉,URL,139 p.,2009b<http://www.nvidia.com/cuda>
[9] Lindholm,E。;Nickolls,J。;Oberman,S。;Montrym,J.,《NVIDIA tesla:统一图形和计算架构》,IEEE Micro,28,2,39-55(2008)
[10] Nickolls,J。;巴克,I。;加兰德,M。;Skadron,K.,使用CUDA的可扩展并行编程,ACM队列,6,2,40-53(2008)
[11] Khronos OpenCL工作组,OpenCL规范,1.0版,2008年<http://www.khronos.org/opencl>; Khronos OpenCL工作组,OpenCL规范,1.0版,2008年<http://www.khronos.org/opencl>
[12] Fatahalian,K。;休斯顿,M.,《GPU,Commun》。ACM,51、10、50-57(2008年)
[13] D.Komatitsch,S.Tsuboi,C.Ji,J.Tromp,地球模拟器上146亿自由度,5万亿次浮点,2.5万亿字节地震模拟,收录于:ACM/IEEE超级计算SC’2003年会议论文集,2003年,第4-11页,doi:10.1109/SC.2003.10023;D.Komatitsch、S.Tsuboi、C.Ji、J.Tromp,地球模拟器上146亿自由度、5万亿次浮点、2.5万亿字节的地震模拟,收录于:ACM/IEEE超级计算SC’2003会议论文集,2003年,第4-11页,doi:10.1109/SC.2003.10023
[14] 刘,Q。;Polet,J。;Komatitsch博士。;Tromp,J.,《南加州地震的谱元矩张量反演》,布尔。地震波。《美国社会》,94,5,1748-1761(2004)
[15] 查尔朱布,E。;Komatitsch,D。;维洛特,J.P。;卡普德维尔,Y。;瓦莱特,B。;Festa,G.,地震学中的谱元素分析,(Wu,R.-S.;Maupin,V.,《非均匀介质中的波传播进展》。非均匀介质中波传播的进展,地球物理学进展,第48卷(2007),爱思唯尔学术出版社:爱思唯尔学术出版社,英国伦敦),365-419
[16] Tromp,J。;Komatitsch,D。;刘强,地震谱元和伴随方法,通讯社。计算。物理。,3, 1, 1-32 (2008) ·Zbl 1183.74320号
[17] 科恩,G。;Joly,P。;Tordjman,N.,《波动方程质量集中高阶有限元的构造与分析》,(Kleinman,R.,《第二届波传播数学和数值方面国际会议论文集》(1993),SIAM:SIAM Philadelphia,Pennsylvania,USA),152-160·Zbl 0814.65096号
[18] Priolo,E。;Carcione,J.M。;Seriani,G.,用高阶谱建模技术对界面波进行数值模拟,J.Acoust。《美国社会》,95,2,681-693(1994)
[19] Faccioli,E。;马吉奥,F。;Paolucci,R。;Quarteroni,A.,《伪谱区域分解法的二维和三维弹性波传播》,J.Seismol。,1, 237-251 (1997)
[20] Deville,M.O。;菲舍尔,P.F。;Mund,E.H.,《不可压缩流体流动的高阶方法》(2002),剑桥大学出版社:剑桥大学出版社,英国剑桥·Zbl 1007.76001号
[21] 查尔朱布,E。;卡普德维尔,Y。;Vilotte,J.P.,《求解流体-固体非均匀球体中的弹性动力学:非协调网格上的平行谱元近似》,J.Compute。物理。,187, 2, 457-491 (2003) ·Zbl 1060.86003号
[22] De Basabe,J.D。;Sen,M.K.,声波和弹性波方程常用有限元方法的网格离散和稳定性准则,地球物理学,72,6,T81-T95(2007)
[23] 塞里亚尼,G。;Oliveira,S.P.,弹性波传播谱元方法的色散分析,《波动》,45,729-744(2008)·Zbl 1231.74185号
[24] 沃斯,P.E.J。;Sherwin,S.J。;Kirby,R.M.,《从h到p的有效性:实现有限元和谱/hp元方法,以实现低阶和高阶离散化的最佳性能》,J.Comput。物理。,229, 5161-5181 (2010) ·Zbl 1194.65138号
[25] L.Carrington,D.Komatitsch,M.Laurenzano,M.Tikir,D.Michéa,N.Le Goff,a.Snavely,J.Tromp,使用SPECFEM3D_GLOBE在62000处理器核上对全球地震波传播进行高频模拟,收录于:ACM/IEEE超级计算SC’2008年会议论文集,2008年,第1-11页doi:10.1145/1413370.1413432;L.Carrington,D.Komatitsch,M.Laurenzano,M.Tikir,D.Michéa,N.Le Goff,a.Snavely,J.Tromp,使用SPECFEM3D_GLOBE在62000处理器核上对全球地震波传播进行高频模拟,收录于:ACM/IEEE超级计算SC’2008年会议论文集,2008年,第1-11页doi:10.1145/1413370.1413432
[26] 马丁·R。;Komatitsch,D。;布利茨,C。;Le Goff,N.,基于非结构化MPI光谱元素方法的小行星地震波传播模拟:阻塞和非阻塞通信策略,Lect。注释计算。科学。,5336, 350-363 (2008)
[27] Sherwin,S.J。;Karniadakis,G.E.,三角形谱元方法:不可压缩Navier-Stokes方程的应用,计算。方法应用。机械。工程,123,189-229(1995)·Zbl 1075.76621号
[28] Taylor,医学硕士。;Wingate,B.A.,非四边形单元的广义对角质量矩阵谱元法,应用。数字。数学。,33, 259-265 (2000) ·兹比尔0964.65107
[29] Komatitsch,D。;马丁·R。;Tromp,J。;Taylor,医学硕士。;Wingate,B.A.,《使用三角形和四边形谱元法在二维弹性介质中的波传播》,J.Compute。灰尘。,9, 2, 703-718 (2001)
[30] Mercerat,E.D。;维洛特,J.P。;Sánchez-Sesma,F.J.,使用非结构化三角形网格对二维弹性波传播进行三角谱元模拟,Geophys。《国际期刊》,166,2679-698(2006)
[31] 福尔克,R.S。;Richter,G.R.,对称双曲方程的显式有限元方法,SIAM J.Numer。分析。,36, 3, 935-952 (1999) ·Zbl 0923.65065号
[32] 胡富强。;侯赛尼,M.Y。;Rasetarinera,P.,波传播问题的非连续Galerkin方法分析,J.计算。物理。,151, 2, 921-946 (1999) ·Zbl 0933.65113号
[33] 里维埃,B。;Wheeler,M.F.,声波和弹性波问题的间断有限元方法,Contemp。数学。,329, 271-282 (2003) ·Zbl 1080.76039号
[34] Monk,P。;Richter,G.R.,非均匀介质中线性对称双曲方程组的间断Galerkin方法,科学杂志。计算。,22-23, 1-3, 443-477 (2005) ·Zbl 1082.65099号
[35] 格罗特,M.J。;Schneebeli,A。;Schötzau,D.,波动方程的间断Galerkin有限元法,SIAM J.Numer。分析。,44, 6, 2408-2431 (2006) ·Zbl 1129.65065号
[36] Bernacki,M。;Lanteri,S。;Piperno,S.,使用显式、非扩散、间断Galerkin方法对非结构网格上非均匀波传播的时域并行模拟,J.Compute。蝗虫。,14, 1, 57-81 (2006) ·Zbl 1198.76081号
[37] Dumbser,M。;Käser,M。;Toro,E.,非结构网格上弹性波的任意高阶间断Galerkin方法。第五部分:局部时间步进和p-自适应性,地球物理。《国际期刊》,171,2695-717(2007)
[38] Komatitsch,D。;拉巴塔,J。;Michéa,D.,在Lect MareNostrum的2166个处理器上模拟地球内核中高分辨率地震波传播。注释计算。科学。,5336, 364-377 (2008)
[39] V.Volkov,J.W.Demmel,调整稠密线性代数的基准GPU,收录于:SC'08:2008 ACM/IEEE超级计算会议记录,第1-11页,doi:10.1145/1413370.1413402;V.Volkov,J.W.Demmel,《调整稠密线性代数的基准GPU》,收录于:SC'08:2008 ACM/IEEE超级计算会议记录,第1-11页,doi:10.1145/1413370.1413402
[40] 阿古洛,E。;德梅尔,J。;Dongarra,J。;哈德里,B。;Kurzak,J。;Langou,J。;Ltaief,H。;Luszczek,P。;Tomov,S.,《新兴体系结构上的数值线性代数:等离子和MAGMA项目》,J.Phys.:Conf.序列号。,180, 012037 (2009)
[41] P.Micikevicius,《使用CUDA对GPU进行三维有限差分计算》,载于:GPGPU-2:第二届图形处理单元通用处理研讨会论文集,美国华盛顿特区,2009年,第79-84页,doi:10.1145/1513895.1513905;P.Micikevicius,使用CUDA对GPU进行三维有限差分计算,收录于:GPGPU-2:图形处理单元通用处理第二次研讨会论文集,华盛顿特区,美国,2009年,第79-84页,doi:10.1145/1513895.1513905
[42] N.Bell,M.Garland,在面向吞吐量的处理器上实现稀疏矩阵向量乘法,收录于:SC'09:2009年ACM/IEEE超级计算会议论文集,ACM,美国纽约,2009年,第1-11页,doi:10.1145/1654059.1654078;N.Bell,M.Garland,在面向吞吐量的处理器上实现稀疏矩阵向量乘法,收录于:SC'09:2009年ACM/IEEE超级计算会议论文集,美国纽约ACM,2009年,第1-11页,doi:10.1145/1654059.1654078
[43] A.Corrigan,F.Camelli,R.Löhner,J.Wallin,在现代图形硬件上运行基于非结构化网格的CFD解算器,载于:第19届AIAA计算流体动力学会议,2009年,第1-11页,AIAA 2009-4001。;A.Corrigan,F.Camelli,R.Löhner,J.Wallin,在现代图形硬件上运行基于非结构化网格的CFD解算器,载于:第19届AIAA计算流体动力学会议,2009年,第1-11页,AIAA 2009-4001·Zbl 1394.76084号
[44] R.Abdelkhalek,Es valuation des accélérateurs de calcul GPGPU pour la modélisation sismique,硕士论文,ENSEIRB学校,法国波尔多,2007年。;R.Abdelkhalek,Es valuation des accélérateurs de calcul GPGPU pour la modélisation sismique,硕士论文,ENSEIRB学校,法国波尔多,2007年。
[45] R.Abdelkhalek,H.Calandra,O.Coulaud,J.Roman,G.Latu,《GPU集群上的快速地震建模和逆时偏移》,收录于:W.W.Smari,J.P.McIntire(编辑),《高性能计算与模拟》,2009年,德国莱比锡,2009,第36-44页<http://hal.inria.fr/docs/00/40/39/33/PDF/hpcs.PDF>; R.Abdelkhalek,H.Calandra,O.Coulaud,J.Roman,G.Latu,《GPU集群上的快速地震建模和逆时偏移》,收录于:W.W.Smari,J.P.McIntire(编辑),《高性能计算与模拟》,2009年,德国莱比锡,2009,第36-44页<http://hal.inria.fr/docs/00/40/39/33/PDF/hpcs.PDF>
[46] Michéa,D。;Komatitsch,D.,使用GPU图形卡加速三维有限差分波传播代码,Geophys。《国际期刊》,182,1,389-402(2010)
[47] 科克纳,A。;沃伯顿,T。;布里奇,J。;Hesthaven,J.S.,图形处理器上的Nodal间断Galerkin方法,J.Compute。物理。,228, 7863-7882 (2009) ·兹比尔1175.65111
[48] Chaillat,S.公司。;阀盖,M。;Semblat,J.-F.,频域三维弹性动力学的多层快速多极边界元法,计算。方法应用。机械。工程,197,49-50,4233-4249(2008)·Zbl 1194.74109号
[49] Gumerov,N.A。;Duraiswami,R.,图形处理器上的快速多极方法,J.Compute。物理。,227, 8290-8313 (2008) ·兹比尔1147.65012
[50] Raghuvanshi,N。;Narain,R。;Lin,M.C.,《使用自适应矩形分解实现高效准确的声音传播》,IEEE Trans。目视检查。计算。图表。,15, 5, 789-801 (2009)
[51] Wu,W。;Heng,P.A.,交互式三维软组织切割的GPU加速混合压缩有限元模型:研究文章,Comput。动画虚拟世界架构。,15, 3-4, 219-227 (2004)
[52] Wu,W。;Heng,P.A.,三维软组织切割和变形交互式有限元模型的改进方案,可视化计算。,21, 8-10, 707-717 (2005)
[53] K.Liu,X.B.Wang,Y.Zhang,C.Liao,使用图形处理器(GPU)加速时域有限元法(TD-FEM),载于:第七届天线、传播和电磁理论国际研讨会论文集,中国桂林,2006年,第1-4页,doi:10.1109/ISAPE.2006.353223;K.Liu,X.B.Wang,Y.Zhang,C.Liao,使用图形处理器单元(GPU)加速时域有限元法(TD-FEM),摘自:第七届天线、传播和电磁理论国际研讨会论文集,中国桂林,2006年,第1-4页,doi:10.1109/ISAPE.2006.353223
[54] Z.A.泰勒。;Cheng,M。;Ourselin,S.,《使用图形处理单元进行手术模拟的高速非线性有限元分析》,IEEE Trans。医学成像,27,5,650-663(2008)
[55] Z.Fan,F.Qiu,A.E.Kaufman,S.Yoakum-Stover,高性能计算的GPU集群,收录于:SC'04:2004 ACM/IEEE超级计算会议论文集,2004,第47页,doi:10.1109/SC.2004.26;Z.Fan,F.Qiu,A.E.Kaufman,S.Yoakum-Stover,高性能计算的GPU集群,收录于:SC'04:2004 ACM/IEEE超级计算会议论文集,2004,第47页,doi:10.1109/SC.2004.26
[56] Göddeke,D。;斯特佐德卡,R。;Mohd-Yusof,J。;McCormick,P。;Buijssen,S.H.M。;Grajewski,M。;Turek,S.,探索GPU增强集群上FEM计算的弱可扩展性,并行计算。,33, 10-11, 685-699 (2007)
[57] Göddeke,D。;Wobker,H。;斯特佐德卡,R。;Mohd-Yusof,J。;McCormick,P.S。;Turek,S.,使用FEASTGPU对未修改的并行固体力学代码进行联合处理器加速,Int.J.Comput。科学。工程师,4254-269(2009)
[58] D.Göddeke,S.H.Buijssen,H.Wobker,S.Turek,未修改并行有限元Navier-Stokes解算器的GPU加速,收录于:W.W.Smari,J.P.McIntire(编辑),《高性能计算与仿真》,2009年,德国莱比锡,2009b,第12-21页。;D.Göddeke,S.H.Buijssen,H.Wobker,S.Turek,未修改并行有限元Navier-Stokes解算器的GPU加速,收录于:W.W.Smari,J.P.McIntire(编辑),《高性能计算与仿真》,2009年,德国莱比锡,2009b,第12-21页。
[59] M.Fatica,用CUDA加速异质集群上的linpack,见:D.Kaeli,M.Leeser(编辑),GPGPU-2:图形处理单元通用处理第二次研讨会论文集,ACM国际会议论文集,第383卷,2009年,第46-51页,doi:10.1145/1513895.1513901;M.Fatica,用CUDA加速异质集群上的linpack,见:D.Kaeli,M.Leeser(编辑),GPGPU-2:图形处理单元通用处理第二次研讨会论文集,ACM国际会议论文集,第383卷,2009年,第46-51页,doi:10.1145/1513895.1513901
[60] J.C.Phillips,J.E.Stone,K.Schulten,《将消息驱动的并行应用程序应用于GPU加速集群》,载于:SC’08:2008年ACM/IEEE超级计算会议论文集,2008年,第1-9页,doi:10.1145/1413370.1413379;J.C.Phillips,J.E.Stone,K.Schulten,将消息驱动的并行应用程序应用于GPU加速集群,收录于:SC’08:2008 ACM/IEEE超级计算会议论文集,2008年,第1-9页,doi:10.1145/1413370.1413379
[61] 安德森,J.A。;Lorenz,C.D。;Travesset,A.,在图形处理单元上完全实现的通用分子动力学模拟,J.Compute。物理。,227, 10, 5342-5359 (2008) ·兹比尔1148.81301
[62] J.C.Thibault,I.Senocak,多GPU桌面平台上Navier-Stokes解算器在不可压缩流中的CUDA实现,载于:第47届AIAA航空航天科学会议论文集,1999年,第1-15页。;J.C.Thibault,I.Senocak,多GPU桌面平台上Navier-Stokes解算器在不可压缩流中的CUDA实现,载于:第47届AIAA航空航天科学会议论文集,1999年,第1-15页。
[63] E.H.Phillips,Y.Zhang,R.L.Davis,J.D.Owens,图形处理单元集群的快速空气动力学性能预测,载于:第47届AIAA航空航天科学会议论文集,2009年,第1-11页。;E.H.Phillips,Y.Zhang,R.L.Davis,J.D.Owens,《图形处理单元集群的快速空气动力学性能预测》,载《第47届美国航空航天协会航空科学会议论文集》,2009年,第1-11页。
[64] J.A.Stuart,J.D.Owens,《数据并行架构上的消息传递》,载于:第23届IEEE国际并行和分布式处理研讨会论文集,2009年,第1-12页,doi:10.1109/IPDPS.2009.5161065;J.A.Stuart,J.D.Owens,数据并行架构上的消息传递,摘自:第23届IEEE国际并行和分布式处理研讨会论文集,2009年,第1-12页,doi:10.1109/IPDPS.2009.5161065
[65] V.V.Kindratenko,J.J.Enos,G.Shi,M.T.Showerman,G.W.Arnold,J.E.Stone,J.C.Phillips,W.Hwu,高性能计算的GPU集群,收录于:IEEE集群2009年加速器集群并行编程研讨会论文集(PPAC’09),美国路易斯安那州新奥尔良,2009年,第1-8页。;V.V.Kindratenko,J.J.Enos,G.Shi,M.T.Showerman,G.W.Arnold,J.E.Stone,J.C.Phillips,W.Hwu,高性能计算的GPU集群,收录于:IEEE集群2009年加速器集群并行编程研讨会论文集(PPAC’09),美国路易斯安那州新奥尔良,2009年,第1-8页。
[66] Z.Fan,F.Qiu,A.E.Kaufman,Zippy:GPU集群上的计算和可视化框架,收录于:G.Drettakis,R.Scopigno(编辑),《2008年欧洲制图学会并行图形和可视化研讨会论文集》(EGPGV’08),希腊克里特岛赫索尼索斯,第27卷(2),2008年,第341-350页。;Z.Fan,F.Qiu,A.E.Kaufman,《Zippy:GPU集群上的计算和可视化框架》,载于:G.Drettakis,R.Scopigno(编辑),《2008年欧洲图形学会并行图形和可视化研讨会论文集》(EGPGV’08),希腊克里特岛赫索尼索斯,第27(2)卷,2008年,第341-350页。
[67] M.Strengert,C.Müller,C.Dachsbacher,T.Ertl,CUDASA:计算统一设备和系统架构,摘自:J.Favre,K.L.Ma,D.Weiskopf(编辑),《2008年欧洲图形学会并行图形和可视化研讨会论文集》(EGPGV’08),希腊克里特岛Hersonissos,2008年,第49-56页。;M.Strengert,C.Müller,C.Dachsbacher,T.Ertl,CUDASA:计算统一设备和系统架构,摘自:J.Favre,K.L.Ma,D.Weiskopf(编辑),《2008年欧洲图形学会并行图形和可视化研讨会论文集》(EGPGV’08),希腊克里特岛Hersonissos,2008年,第49-56页。
[68] Göddeke,D。;斯特佐德卡,R。;Turek,S.,《有限元模拟中面向硬件的本机、仿真和混合精度求解器的性能和准确性》,国际期刊《并行紧急分布系统》。,22, 4, 221-256 (2007) ·Zbl 1188.68084号
[69] Komatitsch,D。;Tromp,J.,三维地震波传播谱元方法简介,地球物理。《国际期刊》,139,3806-822(1999)
[70] Komatitsch,D。;Tromp,J.,全球地震波传播的谱元模拟-I.验证,地球物理。《国际期刊》,149,2390-412(2002)
[71] Komatitsch,D。;Michéa,D。;Erlebacher,G.,使用CUDA将高阶有限元地震建模应用程序移植到NVIDIA图形卡,J.Parallel Distrib.Comput。,69, 5, 451-460 (2009)
[72] van Wijk,K。;Komatitsch,D。;Scales,J.A。;Tromp,J.,《微观尺度下的强散射分析》,J.Acoust。《美国社会杂志》,115,3,1006-1011(2004)
[73] 塞里亚尼,G。;Priolo,E.,非均匀介质中声波模拟的谱元方法,有限元。分析。设计。,16, 337-348 (1994) ·Zbl 0810.73079号
[74] 卡努托,C。;侯赛尼,M.Y。;Quarteroni,A。;Zang,T.A.,《流体动力学中的光谱方法》(1988),Springer-Verlag:Springer-Verlag New-York,USA·Zbl 0658.76001号
[75] Hughes,T.J.R.,《有限元方法、线性静态和动态有限元分析》(1987),普伦蒂斯·霍尔国际:普伦蒂斯霍尔国际恩格尔伍德悬崖,美国新泽西州·Zbl 0634.73056号
[76] Nissen-Meyer,T。;Fournier,A。;Dahlen,F.A.,计算球形地球地震图的二维谱元方法——Ⅱ。固体流体介质中的波,地球物理学。《国际期刊》,174873-888(2008)
[77] De Basabe,J.D。;Sen,M.K.,高阶时间步进声波或弹性波传播的高阶有限元稳定性,地球物理。《国际期刊》,181,1577-590(2010)
[78] Danielson,K.T。;Namburu,R.R.,《使用Fortran90和MPI在并行计算机上进行非线性动态有限元分析》,高级工程软件。,29, 3-6, 179-186 (1998)
[79] P.Berger,P.Brouaye,J.C.Syre,有限元问题中高效MIMD处理的网格着色方法,摘自:并行处理国际会议论文集,ICPP'82,1982年8月24-27日,IEEE计算机学会,美国密歇根州贝拉雷,1982年,第41-46页。;P.Berger,P.Brouaye,J.C.Syre,有限元问题中高效MIMD处理的网格着色方法,摘自:并行处理国际会议论文集,ICPP'82,1982年8月24-27日,IEEE计算机学会,美国密歇根州贝拉雷,1982年,第41-46页。
[80] 休斯·T·J·R。;费伦茨,R.M。;Hallquist,J.O.,《利用EBE预处理共轭梯度在Cray X-MP/48上进行固体力学大尺度矢量化隐式计算》,计算。方法应用。机械。工程师,61,2,215-248(1987)·Zbl 0606.73096号
[81] Farhat,C。;Crivelli,L.,共享内存多处理器上非线性有限元计算的一般方法,计算。方法应用。机械。工程师,72,2,153-171(1989)·Zbl 0677.68031号
[82] Droux,J.-J.,一种优化网格着色的算法,计算。方法应用。机械。工程,104,2,249-260(1993),93)90199-8·Zbl 0775.76146号
[83] 杰温斯基,上午。;Anderson,D.L.,初步参考地球模型,Phys。地球行星。年,25,297-356(1981)
[84] 焦,W。;华莱士,T.C。;Beck,S.L.,1994年6月9日玻利维亚深层地震静态位移的证据,地球物理。雷斯莱特。,22, 16, 2285-2288 (1995)
[85] Ekström,G.,通过地球正常模式的总和计算玻利维亚地震后的静态变形,地球物理学。雷斯莱特。,22, 16, 2289-2292 (1995)
[86] G.Jost,H.Jin,J.Labarta,J.Giménez,J.Caubet,共享内存体系结构上多级并行应用程序的性能分析,摘自:2003年IPDPS国际并行和分布式处理研讨会论文集,法国尼斯,80.2,2003,doi:10.1109/IPDPS.2003.1213183<www.cepba.upc.es/paraver>;G.Jost,H.Jin,J.Labarta,J.Giménez,J.Caubet,共享内存体系结构上多级并行应用程序的性能分析,摘自:2003年IPDPS国际并行和分布式处理研讨会论文集,法国尼斯,80.2,2003,doi:10.1109/IPDPS.2003.1213183<www.cepba.upc.es/paraver>
[87] 佩莱格里尼,F。;Roman,J.,SCOTCH:通过过程和架构图的双重递归二分划分进行静态映射的软件包,Lect。注释计算。科学。,1067, 493-498 (1996)
[88] Karypis,G。;Kumar,V.,《划分不规则图的快速高质量多级方案》,SIAM J.Sci。计算。,20, 1, 359-392 (1998) ·Zbl 0915.68129号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。