×

用于移动粒子的GPU加速半隐式方法。 (英语) Zbl 1271.76264号

小结:MPS(移动粒子半隐式)方法已被证明在计算自由表面水动力流动中很有用。尽管它具有适用性,但在实际应用中它的缺点之一是计算量大。另一方面,图形处理单元(GPU)最初是为了加速计算机图形而开发的,现在它为科学计算提供了前所未有的能力。
本研究的主要目标是使用CUDA(计算统一设备体系结构)语言开发GPU加速的MPS代码。已经证明了几种技术可以优化CUDA中的计算。为了提高GPU的加速度,特别注意了泊松压力方程中相邻粒子的搜索和联立线性方程组的迭代求解。
本文采用GPU加速的MPS方法对椭圆跌落演变和溃坝水流进行了二维计算,并将计算结果与CPU计算结果进行了比较,研究了基于GPU的程序的精度和性能。结果表明,基于GPU的计算结果可以更快地获得与基于CPU的计算结果相同的可靠性。

理学硕士:

76米28 粒子法和晶格气体法
2005年5月 并行数值计算

软件:

CUDA公司
PDF格式BibTeX公司 XML格式引用
全文: 内政部 链接 链接

参考文献:

[1] Bell N,Garland M.CUDA上的高效稀疏矩阵向量乘法。NVIDIA技术报告NVR-2008-004;2008年,第32页。;Bell N,Garland M.CUDA上的高效稀疏矩阵向量乘法。NVIDIA技术报告NVR-2008-004;2008年,第32页。
[2] Fixstars公司。NVIDIA CUDA信息网站<http://gpu.fixstars.com/; Fixstars公司。NVIDIA CUDA信息网站<网址:http://gpu.fixstars.com/
[3] Gingold,R.A。;Monaghan,J.J.,Kernel估计作为流体动力学中一般粒子方法的基础,《计算机物理杂志》,46,429-453(1982)·Zbl 0487.76010号
[4] Gotoh,H.,拉格朗日粒子法作为数值波浪水槽的先进技术,《国际近海极地工程杂志》,19,3,161-167(2009)
[5] H.Gotoh。;Sakai,T.,《计算波浪破碎的粒子法的关键问题》,海岸工程,53,171-179(2006)
[6] H.Gotoh。;Ikari,H。;Memita,T。;Sakai,T.,用于模拟垂直海堤上波浪漫顶的拉格朗日粒子法,海岸工程杂志,47,2-3,157-181(2005)
[7] Harada T,Masaie I,Koshizuka S,Kawaguchi Y。利用GPU上的空间局部性加速基于粒子的模拟。JSCES学报,论文编号:20080016;2008年[日语]。;Harada T、Masaie I、Koshizuka S、Kawaguchi Y。利用GPU上的空间局部性加速基于粒子的模拟。JSCES学报,论文编号:20080016;2008年[日语]。
[8] Harish P,Nrayan PJ(恩拉亚南省)。使用CUDA在GPU上加速大图形算法,HiPC 2007。LNCS 2007;4873:197-208.; Harish P,Nrayan PJ(恩拉亚南省)。使用CUDA在GPU上加速大图形算法,HiPC 2007。LNCS 2007;4873:197-208.
[9] Harris M.优化CUDA中的并行约简。NVIDIA CUDA SDK 2.0;2008.; Harris M.优化CUDA中的并行约简。NVIDIA CUDA SDK 2.0;2008
[10] 胡,C.H。;Kashiwagi,M.,用于剧烈自由表面流动数值模拟的CIP方法,《海洋科学技术杂志》,9,4,143-157(2004)
[11] Ikari H,Gotoh H。三维波分析MPS方法的并行化。《水科学与工程进展》,第八届国际水科学与工程学会议(ICHE)。日本名古屋;2008.; Ikari H,Gotoh H。三维波分析MPS方法的并行化。《水利科学与工程进展》,第八届国际水利科学与工程会议(ICHE)。日本名古屋;2008
[12] Khayyer,A。;Gotoh,H.,在破碎波中准确跟踪水面的CMPS方法的发展,海岸工程杂志,20,2,179-207(2008)
[13] Khayyer,A。;Gotoh,H.,《预测二维波浪冲击压力的修正移动粒子半隐式方法》,海岸工程,56,4,419-440(2009)
[14] Khayyer,A。;Gotoh,H.,通过MPS方法增强和稳定压力计算的高阶拉普拉斯模型,Appl Ocean Res,32,1,124-131(2010)
[15] Khayyer,A。;Gotoh,H.,《增强运动粒子半隐式方法的稳定性和准确性》,《计算机物理杂志》,230,8,3093-3118(2011)·Zbl 1316.76084号
[16] 哈耶,A。;H.Gotoh。;Shao,S.D.,修正的不可压缩SPH方法在破碎波中精确跟踪水面,海岸工程,55,3,236-250(2008)
[17] Koshizuka,S。;Oka,Y.,《不可压缩流体破碎的移动粒子半隐式方法》,《科学与工程》,123,421-434(1996)
[18] 刘伟。;施密特,B。;沃斯,G。;Muller-Wittig,W.,使用CUDA图形处理单元加速分子动力学模拟,计算物理通讯,179,634-641(2008)
[19] Maruyama N、Nukada A、Matsuoka S.用于GPU的基于软件的ECC。在高性能计算应用加速器研讨会上发表。美国伊利诺伊州乌尔班纳;2009年7月27日至31日。;Maruyama N、Nukada A、Matsuoka S.用于GPU的基于软件的ECC。在高性能计算应用加速器研讨会上发表。美国伊利诺伊州乌尔班纳;2009年7月27日至31日。
[20] McCabe C、Causon DM、Mingham CG。图形处理单元使用平滑粒子流体力学加速了自由表面流的计算。地点:第四届国际SPHERIC研讨会。法国南特,2009年5月27日至29日,第384-91页。;McCabe C、Causon DM、Mingham CG。图形处理单元使用平滑粒子流体力学加速了自由表面流的计算。在:第四届国际SPHERIC研讨会。法国南特,2009年5月27日至29日,第384-91页。
[21] Monaghan,J.J.,用SPH模拟自由表面流动,计算物理杂志,110,399-406(1994)·Zbl 0794.76073号
[22] 英伟达。NVIDIA CUDA计算统一设备架构编程指南。2.0版;2008.; NVIDIA公司。NVIDIA CUDA计算统一设备架构编程指南。2.0版;2008
[23] 英伟达。计算统一的设备架构<http://www.nvidia.com/object/cuda_home.html; 英伟达。计算统一的设备架构<http://www.nvidia.com/object/cuda_home.html
[24] Ogawa S,Aoki T.基于多重网格法的二维不可压缩流动模拟的GPU计算。JSCES学报,论文编号:20090021;2009年【日语】。;Ogawa S,Aoki T.基于多重网格法的二维不可压缩流动模拟的GPU计算。JSCES学报,论文编号:20090021;2009年[日语]。
[25] Rossinelli,D。;Koumoutsakos,P.,GPU上不可压缩流动模拟的涡方法,可视化计算,24,699-708(2008)
[26] Rossinelli,D。;伯格多夫,M。;科特特,G.-H。;Koumoutsakos,P.,GPU使用涡旋粒子方法加速模拟钝体流动,《计算机物理杂志》,229,3316-3333(2010)·Zbl 1307.76066号
[27] 邵,S.D。;Gotoh,H.,《追踪自由表面的湍流粒子模型》,《水利研究杂志》,43,3,276-289(2005)
[28] 邵,S.D。;Lo,E.Y.M.,用不可压缩SPH方法模拟具有自由表面的牛顿和非牛顿流动,Adv Water Resour,26,7,787-800(2003)
[29] Takai Y,Nagai G.用GPU快速计算共轭梯度法。摘自:《计算工程与科学会议论文集》,第14卷。日本东京,2009年5月12日至18日,283-284[日语]。;Takai Y,Nagai G.用GPU快速计算共轭梯度法。摘自:《计算工程与科学会议论文集》,第14卷。2009年5月12日至18日,日本东京,283-284[日语]。
[30] Vazques F、Garzon EM、Martinez JA、Fernandez JJ。GPU上的稀疏矩阵向量积<http://www.ace.ual.es/TR/SpMV.GPU.pdf; Vazques F、Garzon EM、Martinez JA、Fernandez JJ。GPU上的稀疏矩阵向量积<http://www.ace.ual.es/TR/SpMV.GPU.pdf
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。