×

在现代图形硬件上运行基于非结构化网格的CFD解算器。 (英语) Zbl 1394.76084号

概述:描述了在现代图形硬件上实现非结构化网格解算器的技术。考虑无粘、可压缩流动的三维欧拉方程。通过减少总的全局内存访问和重叠的冗余计算,以及使用适当的编号方案和数据布局,可以提高有效的内存带宽。还考虑了每块共享内存的适用性。求解器的性能在两个基准案例上进行了演示:NACA0012机翼和导弹。对于不同的网格大小,在四核CPU上运行的等效并行OpenMP代码上观察到的平均加速因子约为\(9.5\次\),在串行运行的等效代码上观察得到的平均加速因数约为\。

理学硕士:

76米25 其他数值方法(流体力学)(MSC2010)
65日元10 特定类别建筑的数值算法
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] NVIDIA公司2008http://developer.nvidia.com/cuda(网址:http://developer.nvidia.com/cuda)
[2] Brandvik,使用商品图形硬件加速二维欧拉流求解器,机械工程师学会会刊,C部分:机械工程科学杂志221第1745页–(2007)·doi:10.1243/09544062JMES813FT
[3] Brandvik T Pullan G使用商品图形硬件加速3D Euler解算器
[4] Elsen,使用GPU对高超声速飞行器绕流的大型计算,计算物理杂志227 pp 10148–(2008)·Zbl 1218.76035号 ·doi:10.1016/j.jcp.2008.08.023
[5] Tölke,使用nVIDIA开发的计算统一设备架构实现Lattice Boltzmann内核,《科学中的计算与可视化》(2008)
[6] Phillips E Zhang Y Davis R Owens J Cuda在多gpu桌面平台上实现不可压缩流的Navier-stokes解算器
[7] 用于不可压缩流的多gpu桌面平台上Navier-Stokes解算器的Thibault J Senocak I Cuda实现
[8] 2009年图形处理器上的Klockner A Warburton T Bridge J Hesthaven JS Nodal间断伽辽金方法
[9] 晚安,CUDA/OpenGL流体模拟(2007)
[10] 欧文斯,图形硬件通用计算调查,计算机图形论坛26(1),第80页–(2007)·文件编号:10.1111/j.1467-8659.2007.01012.x
[11] Harris,GPU Gems(2004)
[12] Scheidegger,使用SMAC对GPU进行实际CFD模拟,计算机图形论坛24页715–(2005)·数字对象标识代码:10.1111/j.1467-8659.2005.00897.x
[13] Hagen,《计算机科学讲稿》,载于:第六届国际计算科学会议论文集,pp 220–(2006)·Zbl 1157.76358号 ·doi:10.1007/11758549_34
[14] Löhner,《应用CFD技术:基于有限元方法的简介》(2008)
[15] Khronos OpenCL工作组2008
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。