×

关于FEAP中循环元素的并行化。 (英语) 兹比尔1329.65337

小结:在本文中,我们考虑在FEAP中使用OpenMP并行化循环元素,FEAP是一种在大学非常流行的研究FE代码。即使对于FEAP的串行版本(也存在集群版本),由于此代码的现有体系结构,这种并行化也不是一项简单的任务,这使高效的并行化变得复杂。首先,考虑到时间和内存的使用,我们将FEAP的串行版本与并行代码Warp3D进行了比较。正如我们发现的那样,Warp3D速度快得多,但使用的内存比FEAP多。对Warp3D的分析有助于我们设计元素循环的并行化方法。接下来,我们描述了FEAP中的几个更改,这些更改是使用OpenMP并行化元素上的循环所必需的。特别是,组装元素矩阵的子程序被认为是获得良好性能的关键,并且实现并测试了OpenMP互斥同步的几个指令。最后,我们在涉及FEAP的三维和壳元素以及用户元素的数值示例上演示了并行FEAP(称为ompFEAP)的性能。我们得出结论,ompFEAP使用指令原子对于装配的同步,提供了很好的加速和效率。

MSC公司:

65日元 数值算法的封装方法
2005年5月 并行数值计算
65N30型 含偏微分方程边值问题的有限元、Rayleigh-Ritz和Galerkin方法
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Amdahl GM(1967)单处理器方法实现大规模计算能力的有效性。摘自:AFIPS会议记录,第30卷。第483-485页·Zbl 1195.65135号
[2] Benkner S,Brandes T(2000)共享内存并行体系结构上非结构化简化的高效并行化。In:并行和分布式处理。计算机科学课堂讲稿,第1800卷。施普林格,第435-442页
[3] Cecka C、Lew AJ、Darve E(2011)《有限元方法在图形处理器上的组装》。国际J数字方法工程5:640-669·Zbl 1217.80146号 ·doi:10.1002/nme.2989
[4] Chandra R、Dagum L、Kohr D、Maydan D、McDonald J、Menon R(2001)OpenMP中的并行编程。Waltham学术出版社
[5] Dodds R等人(2014)Warp3D。版本17.5.3
[6] Fialko S(2010)PARFES:在多核计算机上求解有限元线性方程的方法。高级工程软件41:1256-1265·Zbl 1205.65139号 ·doi:10.1016/j.advengsoft.2010.09.002
[7] Guo X,Gorman G,Sunderland A,Ashworth M(2012)为流动性ICOM开发混合OpenMP MPI并行性下一代地球物理流体建模技术。2012年4月29日至5月3日,德国斯图加特,Cray用户组:绿色工程未来(CUG2012)
[8] 格雷芬。http://info.grafen.ippt.pan.pl/ ·Zbl 0077.36704号
[9] Gruttmann F,Wagner W(2013)耦合双尺度壳模型及其在层状结构中的应用。国际J数字方法工程94:1233-1254·Zbl 1352.74173号 ·doi:10.1002/nme.4496
[10] Ikuno S、Takayama T、Kamitani A(2007)《并行处理技术在高温超导薄膜屏蔽电流分析中的应用》。物理C超导体463:1013-1016
[11] Intel Inspector 2015更新1·Zbl 1352.74173号
[12] Jarzebski P,Wisniewski K(2014)《复合壳体计算中循环元素的并行化》。收录:Kowalewski ZL(ed)第39届固体力学会议(SOLMECH 2014),萨科帕内,2014年9月1日至5日,摘要集,第153-154页
[13] Lo SH(2012)平行Delaunay三角剖分-二维应用。有限元分析62:37-48·Zbl 1205.65139号
[14] Markall GR、Slemmer A、Ham DA、Kelly PHJ、Cantwell CD、Sherwin SJ(2013)多核和多核架构的有限元组装策略。国际数字方法杂志流体71:80-97·Zbl 1431.65217号 ·doi:10.1002/fld.3648
[15] Moto Mpong S,de Montleau P,Godinas A,Habraken AM(2002)通过并行处理加速有限元分析。摘自:第五届国际ESAFORM材料成型会议记录。第47-50页
[16] 英特尔MKL。http://software.intel.com/en-us/intel-mkl
[17] 磁粉探伤。http://www.mpi-forum.org ·Zbl 1099.68566号
[18] OpenMP。http://openmp.org ·Zbl 1148.68338号
[19] Pantale O(2005)面向对象FEM动力学代码的并行化:策略对加速的影响。高级工程软件36:361-373·doi:10.1016/j.advengsoft.2005.01.003
[20] Paris J、Colominas I、Navarrina F、Casteleiro M(2013)《应力约束结构拓扑优化中的并行计算》。Compu结构125:62-73·doi:10.1016/j.com.pstruc.2013.04.016
[21] Petra CG,Schenk O,Lubin M,Gaertner K(2014)计算随机优化中Schur补码的一种增广不完全因式分解方法。SIAM科学计算杂志36(2):C139-C162·Zbl 1296.65091号 ·数字对象标识代码:10.1137/130908737
[22] Savic SV,Ilic AZ,Notaros BM,Ilic MM(2012)通过体积积分的OpenMP并行化加速高阶FEM矩阵填充。2012年第20届电信论坛,第370-384页
[23] Simo JC,Tarnow N(1992),关于应力合成几何精确壳模型。第六部分5/6道夫处理。国际J数字方法工程34:117-164·Zbl 0760.73045号 ·doi:10.1002/nme.1620340108
[24] RL泰勒;Whiteman,JR(编辑),线性壳问题的有限元分析(1988年),伦敦·Zbl 0682.73048号
[25] Taylor RL(2014)有限元分析。8.4版
[26] Tang G、D'Azevedo EF、Zhang F、Parker JC、Watson DB、Jardine PM(2010)混合MPI OpenMP方法在使用多核计算机进行并行地下水模型校准中的应用。计算地质学36:1451-1460·doi:10.1016/j.cageo.2010.04.013
[27] Terboven C,Spiegel A,an Mey D,Gross S,Reichelt V(2008)用C++编写的Navier-Stokes解算器DROPS的OpenMP并行化经验。In:OpenMP共享内存并行编程。计算机科学课堂讲稿,第4315卷。第95-106页
[28] Voigt A,Witkowski T(2010)自适应有限元代码的混合并行化。凯贝内提卡46(2):316-327·Zbl 1195.65135号
[29] Wisniewski K(2010)有限旋转壳。柏林施普林格·Zbl 1201.74004号 ·doi:10.1007/978-90-481-8761-4
[30] Wisniewski K,Turska E(2012)带钻井旋转的四节点混合Hu-Washizu壳单元。国际J数字方法工程90:506-536·Zbl 1242.74173号 ·doi:10.1002/nme.3335
[31] Zienkiewicz OC、Taylor RL、Fox DD(2013)《固体和结构力学的有限元方法》,第7版。巴特沃斯·海尼曼,牛津
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。