×

使用GPU加速有限元弹性动力学模拟。 (英语) Zbl 1349.74324号

总结:使用Nvidia的CUDA,开发了一种在图形处理单元上对弹性动力学问题进行显式时域有限元模拟的方法。对于这个问题至关重要的是内存中节点的排列,这样可以有效地加载数据,并将独立执行的线程块之间的通信降至最低。内存安排的初始阶段是划分网格;本文研究了一个成熟的贪婪分区器和一个新的、更有效的对齐分区器。然后开发了一种方法来有效地将存储器布置在每个分区内。该软件应用于无损检测、振动和地球物理领域的三个模型,显示内存带宽非常接近卡的最大带宽,反映了算法的带宽限制性质。与广泛使用的商用CPU等效物Abaqus进行比较,验证了结果的准确性,并证明速度提高了约两个数量级。包含这些开发的软件包Pogo是开源的,可从以下网站下载网址:http://www.Pogo-fea.com/造福社区。

MSC公司:

74S05号 有限元方法在固体力学问题中的应用
65M60毫米 偏微分方程初值和初边值问题的有限元、Rayleigh-Riz和Galerkin方法
65日元10 特定类别建筑的数值算法
PDF格式BibTeX公司 XML格式引用
全文: 内政部 链接

参考文献:

[1] CUDA C编程指南
[2] 安德森,J.A。;Lorenz,C.D。;Traveset,A.,在图形处理单元上完全实现的通用分子动力学模拟,J.Comput。物理。,227, 10, 5342-5359 (2008) ·Zbl 1148.81301号
[3] Joldes,G.R。;Wittek,A。;Miller,K.,GPU上的实时非线性有限元计算-在神经外科模拟中的应用,计算。方法应用。机械。工程,199,49,3305-3314(2010)·Zbl 1225.92021号
[4] 塞卡,C。;Lew,A.J。;Darve,E.,《有限元方法在图形处理器上的组装》,国际期刊Numer。方法工程,85,5,640-669(2011)·Zbl 1217.80146号
[5] Lengyel,J。;Reichert,M。;B.R.唐纳德。;Greenberg,D.P.,使用光栅化计算机图形硬件的实时机器人运动规划,SIGGRAPH Compute。图表。,24, 4, 327-335 (1990)
[6] 霍夫,K.E。;Keyser,J。;林,M。;Manocha,D。;Culver,T.,使用图形硬件快速计算广义Voronoi图,(第26届计算机图形学和交互技术年会论文集,第26届电脑图形学与交互技术年会刊,SIGGRAPH’99(1999),ACM出版社/艾迪森·韦斯利出版公司:ACM出版社/Addison-Wesley出版公司(美国纽约州纽约市),277-286
[7] 吴先生。;奈德,J。;Davis,T。;Shreiner,D.,《OpenGL编程指南:学习OpenGL的官方指南》(1999),Addison-Wesley Longman Publishing Co.,Inc.,1.2版
[8] 特伦达尔,C。;Stewart,J.,《使用图形硬件的一般计算,以及交互式焦散的应用》(Peroche,B.;Rushmeier,H.,《渲染技术》,欧洲制图(2000),Springer-Verlag:Springer-Verlag-Wien,纽约,Brno,Tchèque République)
[9] 哈里斯,M.J。;库姆贝,G。;Scheuermann,T。;Lastra,A.,基于物理的图形硬件可视化仿真,(ACM SIGGRAPH/EUROGRAPHICS图形硬件会议论文集。ACM SIG GRAPH/EUROGRAPHICS图形硬件会议文献集,HWWS’02(2002),欧洲图形协会:欧洲图形协会,瑞士Aire-la-Ville),109-118
[10] 马其顿,M.,GPU进入计算的主流,计算机,36,10,106-108(2003)
[11] Krüger,J。;Westermann,R.,用于GPU实现数值算法的线性代数算子,ACM Trans。图表。,22, 3, 908-916 (2003)
[12] Bolz,J。;农民,I。;Grinsun,E.公司。;Schröder,P.,《GPU上的稀疏矩阵解算器:共轭梯度和多重网格》,ACM Trans。图表。,917-924年3月22日(2003年)
[13] 汤普森,C.J。;哈恩,S。;Oskin,M.,《将现代图形体系结构用于通用计算:框架和分析》,(第35届ACM/IEEE国际微体系结构研讨会论文集。第35届AMC/IEEE国际微体系结构会议论文集,MICRO 35(2002),IEEE计算机学会出版社:IEEE计算机协会出版社,美国加利福尼亚州洛斯阿拉米托斯),306-317
[14] 巴克,I。;福利,T。;霍恩,D。;苏格曼,J。;Fatahalian,K。;马萨诸塞州休斯顿。;Hanrahan,P.,Brook for GPU:图形硬件上的流计算,ACM Trans。图表。,23, 3, 777-786 (2004)
[15] Bayoumi,A.M。;朱,M。;哈纳菲,Y.Y。;哈雷尔,P。;Refai-Ahmed,G.,使用ATI流技术的科学和工程计算,Compute。科学。工程,11,6,92-97(2009)
[16] Munshi,A.,《OpenCL规范v1.2》(2012年11月)
[17] Balevic,A。;洛克斯特罗。;Tausendfreund,A。;Patzelt,S。;戈奇,G。;Simon,S.,《利用通用GPU基于时域有限差分法加速光散射模拟》(第11届IEEE国际计算科学与工程会议(2008),IEEE),327-334
[18] De Donno,D。;埃斯波西托,A。;Tarricone,L。;Catarinucci,L.,GPU计算和CUDA编程简介:FDTD(EM程序员笔记本)、IEEE天线传播的案例研究。Mag.,52,3,116-122(2010)
[19] Michéa,D。;Komatitsch,D.,使用GPU图形卡加速三维有限差分波传播代码,Geophys。《国际期刊》,182,1,389-402(2010)
[20] Cangellaris,A.C。;Wright,D.B.,电磁现象FDTD模拟中导电边界阶梯近似引起的数值误差分析,IEEE Trans。天线传播。,39, 10, 1518-1525 (1991)
[21] Drozdz,M.,弹性介质中超声波的高效有限元建模(2008),伦敦帝国理工学院博士论文
[22] Huthwaite,P。;西蒙内蒂,F。;Lowe,M.J.S.,《有限元散射模拟的收敛性》(AIP会议论文集,第1211卷(2010)),65
[23] 风扇,Z。;邱,F。;考夫曼,A。;Yoakum-Stover,S.,用于高性能计算的GPU集群,(2004年ACM/IEEE超级计算会议论文集(2004),IEEE计算机学会:IEEE计算机协会,华盛顿特区,美国),47
[24] 刘凯。;王X.-B。;Zhang,Y。;Liao,C.,使用图形处理器单元(GPU)加速时域有限元方法(TD-FEM),(第七届天线国际研讨会,传播电磁理论(2006)),1-4
[25] Göddeke,D。;斯特佐德卡,R。;Turek,S.,用GPU加速双精度FEM模拟,(ASIM会议记录-第18届模拟技术研讨会(2005))
[26] Göddeke,D。;斯特佐德卡,R。;Mohd-Yusof,J。;McCormick,P。;Buijssen,S.H.M。;Grajewski,M。;Turek,S.,探索GPU增强集群上FEM计算的弱可扩展性,并行计算。,33, 10-11, 685-699 (2007)
[27] Göddeke,D。;斯特佐德卡,R。;Turek,S.,《有限元模拟中面向硬件的本机、仿真和混合精度求解器的性能和准确性》,国际期刊《并行应急分布系统》。,22, 4, 221-256 (2007) ·Zbl 1188.68084号
[28] Göddeke,D.,用于GPU集群PDE模拟的快速准确有限元多重网格解算器(2010年5月),多特蒙德理工大学,Fakultät für Mathematik,博士论文
[29] Turek,S。;Göddeke博士。;Buijssen,S.H.M。;Wobker,H.,GPU加速集群上面向硬件的多重网格有限元求解器,(Kurzak,J.;Bader,D.A.;Dongarra,J.J.,《使用多核和加速器的科学计算》(2010),CRC出版社),第6章
[30] Geveler,M。;里布洛克,D。;Göddeke,D。;Zajac,P。;Turek,S.,《面向GPU上基于FEM的完整仿真工具包:基于稀疏近似逆的强平滑器的非结构化网格有限元几何多重网格解算器》,计算。流体,80,327-332(2013)·Zbl 1284.76249号
[31] Göddeke,D。;贝克尔,C。;Turek,S.,《将GPU作为快速协处理器集成到并行FE包FEAST中》,(Becker,M.;Szczerbicka,H.,第19届仿真技术研讨会(ASIM’06),仿真前沿(2006)),277-282
[32] 科马斯,O。;Z.A.泰勒。;Allard,J。;Ourselin,S.公司。;科廷,S。;Passenger,J.,用于软组织建模的高效非线性FEM及其在开源框架SOFA中的GPU实现,(Bello,F.;Edwards,P.,生物医学模拟。生物医学模拟,计算机科学讲义,第5104卷(2008),施普林格:施普林格-柏林,海德堡),28-39
[33] 迪克,C。;Georgii,J。;Westermann,R.,使用CUDA进行弹性模拟的实时多重网格有限六面体方法,Simul。模型。实际。理论,19,2,801-816(2011)
[34] Komatitsch,D。;Michéa,D。;Erlebacher,G.,使用CUDA将高阶有限元地震建模应用程序移植到NVIDIA图形卡,J.Parallel Distrib.Comput。,69, 5, 451-460 (2009)
[35] 科克纳,A。;沃伯顿,T。;布里奇,J。;Hesthaven,J.S.,图形处理器上的Nodal间断Galerkin方法,J.Compute。物理。,228, 21, 7863-7882 (2009) ·Zbl 1175.65111号
[36] 谢世华。;Paulino,G.H。;Abel,J.F.,《并行有限元分析的自动区域划分算法评估》,国际数值杂志。方法工程,40,6,1025-1051(1997)·Zbl 0889.73067号
[37] Lord,W。;路德维希,R。;You,Z.,《超声波建模与有限元分析的发展》,J.Nondestrust。评估。,9, 2, 129-143 (1990)
[38] Lin,Y。;Sansalone,M。;Carino,N.J.,含有薄层和空隙的板的冲击回波响应的有限元研究,J.无损。评估。,9, 1, 27-47 (1990)
[39] 莫瑟,F。;雅各布斯,L.J。;Qu,J.,用有限元法模拟弹性波在波导中的传播,无损。测试。评估。国际,32,4,225-234(1999)
[40] Baskaran,G。;Rao,C.L。;Balasubramaniam,K.,使用有限元方法模拟TOFD技术,Insight,49,11,641-646(2007)
[41] 莫佐,P。;Kristek,J。;加利斯,M。;帕扎克,P。;Balazovjech,M.,《地震波传播和地震运动的有限差分和有限元建模》,《物理学学报》。斯洛伐克,57,2,177-406(2007)
[42] Cook,R.,有限元分析的概念和应用(2007),John Wiley&Sons
[43] 巴瑟·K·J。;Wilson,E.L.,有限元分析中的数值方法(1976),Prentice Hall:Prentice Hall Englewood Cliffs,NJ·Zbl 0387.65069号
[44] 卡特希尔,E。;McKee,J.,减少稀疏对称矩阵的带宽,(1969年第24届全国会议论文集(1969),ACM),157-172
[45] 卡恩迪什,J.C。;菲尔德博士。;Frey,W.H.,《三维有限元网格自动生成方法》,《国际数值》。方法工程,21,2,329-347(1985)·Zbl 0573.65090号
[46] Jin,H。;Wiberg,N.E.,《二维网格生成,自适应重网格和细化》,国际期刊Numer。方法工程,29,7,1501-1526(1990)
[47] 乔治·P·L。;Seveno,E.,《重新审视先进的前网格生成方法》,国际期刊Numer。方法工程,37,21,3605-3619(1994)·Zbl 0816.76045号
[48] Dassault Systèmes Simulia Corp.,Abaqus 6.11文件
[49] Rajagopal,P。;Drozdz,M。;斯克尔顿,E。;Lowe,M.J.S。;Craster,R.,《关于使用吸收层模拟无限各向同性介质中弹性波的传播,使用商用有限元软件包》,NDT&E International
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。