×

基于非结构化四边形网格的GPU加速单元自适应网格细化。 (英语) Zbl 1380.65235号

摘要:本文在非结构化四边形网格上开发了GPU加速无粘流求解器。首次在GPU上对非结构化四边形网格实现了基于单元的自适应网格细化(AMR),大大降低了GPU和CPU之间的数据交换频率。具体而言,通过原子操作处理AMR以并行化列表操作,并实现空内存回收以提高内存利用效率。结果表明,GPU得到的结果与文献中的精确结果或实验结果非常吻合。在旧GPU GT9800上运行的并行代码和在E3-1230 V2上运行的串行代码之间的加速比为4。通过优化配置更大的一级缓存,并在较新的GPU C2050上采用基于共享内存的原子操作,实现了20的加速比。基于单元的并行AMR过程在GT9800上实现了2倍的加速,在特斯拉C2050上实现了18x的加速,这表明基于单元的AMR方法在GPU上并行运行是可行和高效的。我们的结果还表明,GPU体系结构的新发展对流体动力学计算有显著的好处。

MSC公司:

65M50型 涉及偏微分方程初值和初边值问题数值解的网格生成、细化和自适应方法
76个M12 有限体积法在流体力学问题中的应用
6500万08 含偏微分方程初值和初边值问题的有限体积法
2005年5月 并行数值计算
65日元10 特定类别建筑的数值算法

软件:

CUDA公司
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 李伟(Li,W.)。;魏,X。;考夫曼,A.,维斯。计算。,19,7-8,444-456(2003年)
[3] 杨,J。;Wang,Y。;Chen,Y.,J.计算。物理。,221, 2, 799-804 (2007)
[5] 贝利,P。;Myre,J。;沃尔什,S.D。;Lilja,D.J。;Saar,M.O.(并行处理,2009年)。2009年国际比较项目。国际会议(2009年),IEEE,550-557
[6] Frezzotti,A。;Ghiroldi,G.P。;Gibelli,L.,计算。物理学。Comm.,182,12,2445-2453(2011)
[7] Ran,W。;Cheng,W。;秦,F。;Luo,X.,J.计算。物理。,230, 24, 8797-8812 (2011)
[8] Brodtkorb,A.R。;S/tra,M.L。;Altinakar,M.,计算与流体,55,1-12(2012)
[9] Lutsyshyn,Y.,计算。物理学。Comm.,187,162-174(2015)
[10] 科里根,A。;卡梅利,F。;罗纳。;Wallin,J.(第19届AIAA计算流体动力学(2009),美国航空航天研究所:美国航空航天学会,美国德克萨斯州圣安东尼奥)
[11] 伊利诺伊州坎波利斯。;Trompoukis,X。;Asouti,V。;Giannakoglou,K.,计算。方法应用。机械。工程师,199,9-12,712-722(2010)
[12] J.Waltz,国际。J.数字。《液体方法》,72,2,259-268(2013)
[13] 拉尼,A。;Yalim,M.S。;Poedts,S.,《计算》。物理学。Comm.,185,10,2538-2557(2014)
[14] Löhner,R.,《应用计算流体动力学技术:基于有限元方法的导论》(2008),Wiley·Zbl 1151.76002号
[15] 王,P。;Abel,T。;Kaehler,R.,《新天文》。,15, 7, 581-589 (2010)
[16] 希夫,H.Y。;蔡永川。;Chiueh,T.,天体物理学。补充期刊。,186, 2, 457 (2010)
[17] Sun,M.,《冲击波与物体相互作用的数值和实验研究》(1998年),东北大学(博士论文)
[18] Sun,M。;Takayama,K.,J.计算。物理。,150, 1, 143-180 (1999)
[19] Knight,Doyle D.,《可压缩流动的数值方法要素》(2006),剑桥大学出版社:剑桥大学出版社,纽约·Zbl 1103.76003号
[20] Sun,M。;Takayama,K.,J.计算。物理。,189, 1, 305-329 (2003)
[22] Skews,B.W.,J.流体力学。,29, 705-719 (1967)
[23] Sun,M。;Takayama,K.,J.流体力学。,478, 237-256 (2003)
[24] Nivarti,G.V。;Salehi,M.M。;Bushe,W.K.,J.计算。物理。,281, 352-364 (2015)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。