×

面向基于FEM的GPU完整仿真工具包:非结构化网格有限元几何多重网格解算器,基于稀疏近似逆运算具有强平滑器。 (英语) 兹比尔1284.76249

摘要:我们描述了我们的FE-gMG求解器,这是一种用于解决依赖非结构化网格的问题的有限元几何多重网格方法。我们通过应用强平滑器,增强了基于稀疏矩阵向量乘法级联的面向GPU和多核的实现技术。特别是,我们采用了稀疏近似逆(SPAI)和稳定近似逆(SAINV)技术。我们重点介绍了结合低阶和高阶有限元空间的平滑器的数值效率以及FE-gMG的硬件效率。对于二维和三维的典型问题和计算网格,在我们的基准测试中,在单个GPU上,相对于多线程CPU代码,我们实现了平均5的加速。此外,与简单的雅可比平滑相比,我们的强平滑器可以根据元素空间提供3.5的加速比。当将近似逆平滑器的使用与自由度的巧妙排序相结合时,这甚至可以提高到7倍。总的来说,FE-gMG解算器的性能优于基于简单(多核)CPU的多重网格,总因子超过40。

MSC公司:

76M10个 有限元方法在流体力学问题中的应用
65日元10 特定类别建筑的数值算法
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Turek,S.,《不可压缩流问题的高效求解器:算法和计算方法》(1999),Springer:Springer Berlin,ISBN 3-540-65433-X·Zbl 0930.76002号
[2] 科斯特,M。;Turek,S.,《高阶有限元离散化对多重网格收敛的影响》,应用数学中的计算方法,6,2,221-232(2006)·Zbl 1095.65111号
[3] 加兰,M。;Kirk,D.B.,《通过面向对象的架构理解》,《ACM的通信》,第53、11、58-66页(2010年)
[4] Bolz,J。;农民,I。;格林斯彭,E。;Schröder,P.,《GPU上的稀疏矩阵求解器:共轭梯度和多重网格》,《ACM图形汇刊》,22,3,917-924(2003)
[6] Elsen,E。;LeGresley,P。;Darve,E.,使用GPU对高超声速飞行器绕流的大型计算,计算物理杂志,227,24,10148-10161(2008)·Zbl 1218.76035号
[9] Kazhdan,M。;Hoppe,H.,《大图像梯度域操作的流式多重网格》,《ACM图形事务》,27,3,1-10(2008)
[10] Grossauer,H。;Thoman,P.,《基于GPU的多重网格:高分辨率非线性图像处理的实时性能》,(Gasteratos,A.;Vinceze,M.;Tsotsos,J.K.,《计算机视觉系统》,《计算机科学讲义》,第5008卷(2008),Springer),141-150
[12] Haase,G。;利伯曼,M。;道格拉斯,C.C。;Plank,G.,图形处理单元上的并行代数多重网格求解器,(Zhang,W.;Chen,Z.;Douglas,C.C.;Tong,W.,高性能计算与应用。高性能计算与应用,计算机科学讲义,第5938卷(2010),Springer),38-47
[17] 格罗特,M.J。;Huckle,T.,稀疏近似逆的并行预处理,SIAM科学计算杂志,18838-853(1996)·兹伯利0872.65031
[18] O·布洛克。;Grote,M.J.,几何和代数多重网格的稀疏近似逆平滑器,应用数值数学,41,1,61-80(2002)·Zbl 0995.65129号
[19] Benzi,M。;库卢姆,J.K。;Tuma,M.,共轭梯度法的稳健近似逆预处理,SIAM科学计算杂志,22,4,1318-1332(2000)·Zbl 0985.65035号
[20] Benzi,M。;Tuma,M.,用两个近似逆预条件的数值实验,BIT,38,234-241(1998)·Zbl 0909.65027号
[21] Benzi,M。;Tuma,M.,稀疏近似逆预条件的比较研究,应用数值数学,30305-340(1999)·Zbl 0949.65043号
[23] Geveler,M。;里布洛克,D。;Mallach,S。;Göddeke,D。;Turek,S.,基于lattice-boltzmann的实时CFD应用模拟套件,在现代多核和多核架构上利用多级并行,计算科学杂志,2113-123(2011)
[24] 塞卡,C。;Lew,A.J。;Darve,E.,《有限元方法在图形处理器上的组装》,《国际工程数值方法杂志》,85,5,640-669(2011)·Zbl 1217.80146号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。