安德鲁·科里根;费尔南多·卡梅利。;雷纳德·Löhner;约翰·沃林 在现代图形硬件上运行基于非结构化网格的CFD解算器。 (英语) Zbl 1394.76084号 国际期刊数字。方法流体 66,第2期,221-229(2011). 概述:描述了在现代图形硬件上实现非结构化网格解算器的技术。考虑无粘、可压缩流动的三维欧拉方程。通过减少总的全局内存访问和重叠的冗余计算,以及使用适当的编号方案和数据布局,可以提高有效的内存带宽。还考虑了每块共享内存的适用性。求解器的性能在两个基准案例上进行了演示:NACA0012机翼和导弹。对于不同的网格大小,在四核CPU上运行的等效并行OpenMP代码上观察到的平均加速因子约为\(9.5\次\),在串行运行的等效代码上观察得到的平均加速因数约为\。 引用于30文件 理学硕士: 76米25 其他数值方法(流体力学)(MSC2010) 65日元10 特定类别建筑的数值算法 关键词:非结构网格;图形硬件 软件:开放运算语言;CUDA公司 PDF格式BibTeX公司 XML格式引用 \textit{A.Corrigan}等人,《国际数学家杂志》。方法液体66,No.2,221--229(2011;Zbl 1394.76084) 全文: 内政部 参考文献: [1] NVIDIA公司2008http://developer.nvidia.com/cuda(网址:http://developer.nvidia.com/cuda) [2] Brandvik,使用商品图形硬件加速二维欧拉流求解器,机械工程师学会会刊,C部分:机械工程科学杂志221第1745页–(2007)·doi:10.1243/09544062JMES813FT [3] Brandvik T Pullan G使用商品图形硬件加速3D Euler解算器 [4] Elsen,使用GPU对高超声速飞行器绕流的大型计算,计算物理杂志227 pp 10148–(2008)·Zbl 1218.76035号 ·doi:10.1016/j.jcp.2008.08.023 [5] Tölke,使用nVIDIA开发的计算统一设备架构实现Lattice Boltzmann内核,《科学中的计算与可视化》(2008) [6] Phillips E Zhang Y Davis R Owens J Cuda在多gpu桌面平台上实现不可压缩流的Navier-stokes解算器 [7] 用于不可压缩流的多gpu桌面平台上Navier-Stokes解算器的Thibault J Senocak I Cuda实现 [8] 2009年图形处理器上的Klockner A Warburton T Bridge J Hesthaven JS Nodal间断伽辽金方法 [9] 晚安,CUDA/OpenGL流体模拟(2007) [10] 欧文斯,图形硬件通用计算调查,计算机图形论坛26(1),第80页–(2007)·文件编号:10.1111/j.1467-8659.2007.01012.x [11] Harris,GPU Gems(2004) [12] Scheidegger,使用SMAC对GPU进行实际CFD模拟,计算机图形论坛24页715–(2005)·数字对象标识代码:10.1111/j.1467-8659.2005.00897.x [13] Hagen,《计算机科学讲稿》,载于:第六届国际计算科学会议论文集,pp 220–(2006)·Zbl 1157.76358号 ·doi:10.1007/11758549_34 [14] Löhner,《应用CFD技术:基于有限元方法的简介》(2008) [15] Khronos OpenCL工作组2008 此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。