×

GPU加速三维有限体积粒子法。 (英语) Zbl 1410.65337号

摘要:在[“三维流体流动模拟有限体积粒子方法的开发”中,计算方法应用机械工程298,80–107(2016;doi:10.1016/j.cma.2015.09.013); “具有球形支撑核的精确有限体积粒子法”,同上317、102–127(2017;doi:10.1016/j.cma.2016.12.015)]第二位作者等介绍了SPHEROS,这是一种基于有限体积粒子方法(FVPM)的三维粒子求解器,具有球形顶帽核。在本研究中,作者提出了一些算法和优化程序,这些算法和优化过程可以通过利用图形处理单元(GPU)的计算能力来显著加速计算。新的加速求解器GPU-SPHEROS是在CUDA中开发的,完全在GPU上运行。所有并行算法和数据结构都是专门为GPU多核体系结构设计的。使用屋顶线模型评估内核的性能并应用适当的优化策略。特别是,邻域搜索算法几乎占总计算时间的三分之一,具有高效的填充曲线(SFC)和优化的八叉树构造过程。内存绑定交互向量计算几乎占总计算时间的三分之二,其特点是固定大小的内存预分配和有效的数据排序,以减少内存事务和动态内存操作(即分配和释放)的成本。作为算例,给出了水斗式水轮机旋转水斗时水射流偏差的数值模拟结果,并与现有的实验数据进行了比较。在这种情况下,与配备两个Broadwell Intel(^{circledR})Xeon(^{circledR{)E5-2690 v4 CPU(共28个物理核)的双CPU节点相比,在单个NVIDIA(^{\circledR})Tesla(^{\text{TM})P100-SXM2-16 GB GPU(GP100 Pascal体系结构)上实现了近六倍的加速。

MSC公司:

6500万08 含偏微分方程初值和初边值问题的有限体积法
65亿75 涉及偏微分方程的初值和初边值问题的概率方法、粒子方法等
65日元10 特定类别建筑的数值算法
76个M12 有限体积法在流体力学问题中的应用
76米28 粒子法和晶格气体法
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Jahanbakhsh,E。;维萨兹,C。;Maertens,A。;Avellan,F.,三维流体流动有限体积粒子法的发展,计算方法应用机械工程,298,80-107,(2016)·Zbl 1423.76299号
[2] Jahanbakhsh,E。;Maertens,A。;新泽西州昆兰。;维萨兹,C。;Avellan,F.,带球形支撑核的精确有限体积粒子方法,计算方法应用机械工程,317102-127,(2017)·Zbl 1439.76110号
[3] Gingold,R.A。;Monaghan,J.J.,平滑粒子流体动力学理论及其在非球形恒星中的应用,Mon Not R Astron Soc,181,375-389,(1977)·Zbl 0421.76032号
[4] LeVeque,R.J.,双曲问题的有限体积法,31,(2002),剑桥大学出版社·Zbl 1010.65040号
[5] 新泽西州昆兰。;洛博夫斯基,L。;Nestor,R.M.,《发展无网格有限体积粒子法,精确高效地计算粒子间面积》,《计算物理通讯》,185,1554-1563,(2014)·Zbl 1348.76103号
[6] Jahanbakhsh,E.,《使用基于颗粒的方法模拟泥沙侵蚀》(2014),《洛桑高等技术学院(EPFL)》,博士论文N 6284
[7] Vessaz,C.,旋转水斗自由射流偏差的有限颗粒流模拟,(2015),埃科尔理工大学洛桑分校(EPFL),博士论文N 6470
[8] 维萨兹,C。;Jahanbakhsh,E。;Avellan,F.,使用有限体积粒子法对旋转水斗式水斗的射流偏差进行流动模拟,J Fluids Eng,137,7,(2015)
[9] 维萨兹,C。;Andolfatto,L.公司。;阿维兰,F。;Tournier,C.,《冲击式水轮机转轮的设计优化》,Struct Multidiscip Optim,55,1,37-51,(2017)
[10] Volkov,Vasily,理解gpus上隐藏的延迟,(2016),加州大学伯克利分校,博士论文
[11] Cheng,J。;格罗斯曼,M。;McKercher,T.,专业CUDA^{®}c编程,(2014),John Wiley&Sons Inc
[12] 李,D。;迪诺夫,I。;Dong,B。;古特曼,B。;亚诺夫斯基,I。;Toga,A.W.,《计算和记忆结合神经成像算法的CUDA优化策略》,《生物医学中的计算方法程序》,106,75-187,(2012)
[13] Amorim R,Liebmann M,Haase G,dos Santos RW。比较Jacobi迭代的CUDA和OpenGL实现,HPCS’09 2009;第22-32页,DOI:10.1109/HPCSIM.2009.5192847;Amorim R,Liebmann M,Haase G,dos Santos RW。Jacobi迭代中CUDA和OpenGL实现的比较,HPCS’09 2009;第22-32页,DOI:10.1109/HPCSIM.2009.5192847
[14] 波特鲁里,S。;罗塞蒂,D。;贝克尔,D。;普尔,D。;文卡塔,M.G。;俄勒冈州埃尔南德斯。;沙米斯,P。;Lopez,M.G。;贝克,M。;Poole,W.,《探索开放式模型以编程基于GPU的极端尺度系统》,openshmem,18-35,(2015),LNCS 9397
[15] Hérault,A。;比洛塔,G。;Dalrymple,R.A.,《GPU上的SPH与CUDA》,《水利研究杂志》,48,sup1,74-79,(2010)
[16] 瓦尔迪兹-巴尔德拉斯,D。;多明格斯,J.M。;罗杰斯,B.D.,《多GPU集群上自由表面流动的加速平滑粒子流体动力学模拟》,J Parallel Distrib Compute,73,11,1483-1493,(2013)
[17] Hori,C。;H.Gotoh。;Ikari,H。;Khayyer,A.,移动粒子半隐式方法的GPU加速度,计算流体,51,174-183,(2011)·Zbl 1271.76264号
[18] 克雷斯波,A.J.C。;Domínguez,J.M。;罗杰斯,B.D。;戈麦斯·格斯泰拉,M。;Longshaw,S。;坎内拉斯,R。;瓦康迪奥,R。;巴雷罗,A。;García-Feal,O.,《双重物理:基于平滑粒子流体动力学(SPH)的开源并行CFD求解器》,《计算物理通讯》,187204-216,(2015),ISSN 0010-4655·Zbl 1348.76005号
[19] Cercos-Pita,J.L.,Aquagpusph,使用opencl加速的新免费3D SPH解算器,Compute Phys Commun,192,295-312,(2015)·Zbl 1380.65467号
[20] 沙德鲁,M.S。;奥格,G。;Le Touzé,D.,流体流动的平滑粒子流体动力学方法,走向工业应用:动机、现状和挑战,计算流体,136,34,(2016),11·兹比尔1390.76764
[21] 巴切勒,G.K.,《流体动力学导论》(1974),英国剑桥大学出版社·Zbl 0152.44402号
[22] Monaghan,J.,《用SPH模拟自由表面流》,《计算物理杂志》,110,2,399-406,(1994),http://dx.doi.org/10.1006/jcph.1994.1034 ·Zbl 0794.76073号
[23] Junk,M.,有限体积方法需要网格吗?,(Griebel,M.;Schweitzer,M.,计算科学与工程讲稿26,(2003),施普林格-柏林-海德堡),223-238,http://dx.doi.org/10.1007/978-3-642-56103-0 15 ·Zbl 1015.65040号
[24] Fatehi,R。;Manzari,M.T.,《具有新壁边界条件的一致快速弱可压缩光滑粒子流体力学》,《国际数值方法流体》,68,7,905-921,(2012)·Zbl 1237.76136号
[25] Ofenbeck,G。;斯坦曼,R。;卡帕罗斯,V。;斯帕帕尼亚托,D.G。;Püschel,M.,应用屋顶线模型,(IEEE系统和软件性能分析国际研讨会(ISPASS),(2014年),76-85
[26] Lo,Y.J。;威廉姆斯。;斯特拉伦,B.V。;Ligocki,T.J。;Cordery,M.J。;新泽西州赖特。;霍尔,M.W。;Oliker,L.,《Roofline模型工具包:架构和程序分析的实用工具》(高性能计算机系统性能建模、基准测试和仿真国际研讨会,(2014年))
[27] 温克勒,D。;梅斯特,M。;Rezavand,M。;Rauch,W.,Gpusphase——使用CUDA实现2D SPH的共享内存缓存,计算物理通讯,213165-180,(2017)·兹比尔1376.76054
[28] Malheiros,M.G。;Walter,M.,《空间排序:一种有效的近似最近邻搜索策略》,计算图,57112-126,(2016)
[29] 贝多夫,J。;Gaburov,E。;Zwart,S.P.,完全在GPU处理器上运行的稀疏八叉树引力N体代码,《计算物理杂志》,231,72825-2839,(2012)·Zbl 1321.70003号
[30] CUDA C编程指南,PG-02829-001_v9.1,NVIDIA | 2018年3月。;CUDA C编程指南,PG-02829-001_v9.1,NVIDIA | 2018年3月。
[31] https://thrust.github.io/doc/group_gathering.html; https://throst.github.io/doc/group__gathering.html
[32] \(NVIDIA^®^™^®)\(NVIDIA^®^™^®\)
[33] Perrig,A.,水斗式水轮机叶片中自由表面流动的流体动力学,(2007),埃科尔理工大学洛桑分校(EPFL),博士论文编号3715
[34] 佩里格,A。;阿维兰,F。;Kueny,J.L。;法哈特,M。;Parkinson,E.,《水斗式涡轮机水斗中的流动:数值和实验研究》,美国机械工程师学会,J Fluids Eng,128,2,350-358,(2006)
[35] 乔治·奥德里厄斯·伊多尼斯;Aggidis,A,水斗式水轮机数值建模的最新技术,《可再生能源评论》,45,135-144,(2015)
[36] 科维琴斯基,S。;Kueny,J.L。;阿维兰,F。;帕金森;,E.,旋转水桶内自由表面流动的实验和数值分析,(第21届IAHR水力机械和系统研讨会论文集,瑞士洛桑,(2002)),359-364
[37] 古普塔,V。;普拉萨德,V。;Khare,R.,六喷嘴水斗式水轮机模型的数值模拟,能源,104,24-32,(2016)
[38] Jeon,H。;Hoon Park,J。;Shin,Y。;Choi,M.,不同矛位水斗式水轮机的摩擦损失和能量回收,可再生能源,123,273-280,(2018)
[39] Marongiu,J.C。;Leboeuf,F。;Caro,J。;Parkinson,E.,使用混合SPH-ALE方法模拟水斗式水轮机的自由表面流动,《水利研究杂志》,48,40-49,(2010)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。