×

浅水方程自适应网格细化的高效GPU实现。 (英语) Zbl 1330.76088号

小结:对于垂直和水平长度尺度之比很小且用于描述湖泊、河流、海洋和大气中的波浪的情况,浅水方程对自由表面以下的静水流进行了建模。方程允许不连续解,数值解通常使用高分辨率格式计算。对于许多实际问题,需要局部提高网格分辨率,以捕获解中的复杂结构或陡峭梯度。为此,一种有效的方法是自适应网格细化(AMR),它递归地细化域中的部分网格,并随着模拟的进行自适应地更新细化。几位作者已经证明,高分辨率方案的显式模板计算与硬件加速器(如图形处理单元(GPU))中的许多核心架构特别吻合。在此,我们为二阶Kurganov-Petrova中心方案首次提出了基于块的AMR方法的完整GPU实现。我们将讨论实现细节、潜在陷阱和关键见解,并提供一系列性能和准确性测试。虽然它只是针对本文中的一个特殊情况提出的,但我们认为我们的GPU实现AMR的方法可以转移到其他双曲守恒律、数值格式和类似于GPU的体系结构。

MSC公司:

76个M12 有限体积法在流体力学问题中的应用
6500万08 含偏微分方程初值和初边值问题的有限体积法
76B15号机组 水波、重力波;色散和散射,非线性相互作用
35升65 双曲守恒律
65M50型 涉及偏微分方程初值和初边值问题数值解的网格生成、细化和自适应方法
65日元10 特定类别建筑的数值算法
68甲19 其他编程范式(面向对象、顺序、并发、自动等)
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Berger,M.,LeVeque,R.:二维双曲线系统和AMRCLAW软件的自适应网格细化。SIAM J.数字。分析。35, 2298-2316 (1998) ·Zbl 0921.65070号 ·doi:10.1137/S0036142997315974
[2] Berger,M.J.,Colella,P.:冲击流体动力学的局部自适应网格细化。J.计算。物理学。第82、64-84页(1989年)。doi:10.1016/0021-9991(89)90035-1·Zbl 0665.76070号 ·doi:10.1016/0021-9991(89)90035-1
[3] Berger,M.J.,Oliger,J.:双曲型偏微分方程的自适应网格加密。J.计算。物理学。53(3), 484-512 (1984). doi:10.1016/0021-991(84)90073-1·Zbl 0536.65071号 ·doi:10.1016/0021-9991(84)90073-1
[4] Brodtkorb,A.,Dyken,C.,Hagen,T.,Hjelmervik,J.,Storaasli,O.:异构计算的最新发展。科学杂志。程序。18(1), 1-33 (2010)
[5] Brodtkorb,A.R.,Hagen,T.R.,Lie,K.A.,Natvig,J.R.:使用GPU模拟和可视化圣维南系统。计算。视觉。科学。13(7),341-353(2010)·Zbl 1273.76338号 ·数字对象标识代码:10.1007/s00791-010-0149-x
[6] Brodtkorb,A.R.,Hagen,T.R.,Stra,M.L.:图形处理单元(GPU)编程策略和GPU计算趋势。J.平行分布计算。73(1), 4-13 (2013). doi:10.1016/j.jpdc.2012.04.003·doi:10.1016/j.jpdc.2012.04.003
[7] Brodtkorb,A.R.,Stra,M.L.:GPU上的显式浅水模拟:指南和最佳实践。摘自:第十九届国际水资源会议,CMWR 2012,2012年6月17日至22日。伊利诺伊大学香槟分校(2012)·Zbl 1365.76249号
[8] Brodtkorb,A.R.,Stra,M.L.,Altinakar,M.:GPU上的高效浅水模拟:实现、可视化、验证和验证。计算。《流体》55,1-12(2012)。doi:10.1016/j.compfluid.2011.10.012·Zbl 1291.76254号 ·doi:10.1016/j.compfluid.2011.10.012
[9] Burstedde,C.、Ghattas,O.、Gurnis,M.、Isaac,T.、Stadler,G.、Warburton,T.和Wilcox,L.:极端规模AMR。摘自:2010年ACM/IEEE高性能计算、网络、存储和分析国际会议记录,第1-12页。IEEE计算机学会(2010)·Zbl 1275.65049号
[10] Colella,P.,Graves,D.T.,Johnson,J.N.,Johansen,H.S.,Keen,N.D.,Ligocki,T.J.,Martin,D.F.,McCorquodale,P.W.,Modiano,D.,Schwartz,P.O.,Sternberg,T.D.,Van Straalen,B.:AMR应用程序设计文件的Chombo软件包。技术报告,劳伦斯伯克利国家实验室(2012)·Zbl 0921.65070号
[11] Delestre,O.、Lucas,C.、Ksinant,P.A.、Darboux,F.、Laguerre,C.、Vo,T.N.T.、James,F.和Cordier,S.:SWASHES:水力和环境研究的浅水分析解决方案汇编。国际期刊数字。方法液体72(3),269-300(2013)。doi:10.1002/fld.3741·Zbl 1455.76005号 ·doi:10.1002/fld.3741
[12] Goutal,N.,Maurel,F.:溃坝波浪模拟第二次研讨会论文集。技术报告,Fluviale水力发电集团,法国国家水力发电研究所(1997年)·Zbl 1426.76394号
[13] Harris,M.:NVIDIA GPU计算SDK 4.1:优化CUDA中的并行缩减(2011)
[14] Holdahl,R.,Holden,H.,Lie,K.A.:浅水方程的无条件稳定分裂方法。BIT编号。数学。39(3), 451-472 (1999). doi:10.1023/A:1022366502335·Zbl 0945.76059号 ·doi:10.1023/A:1022366502335
[15] Hornung,R.D.,Kohn,S.R.:在SAMRAI面向对象框架中管理应用程序复杂性。计算。实际。实验14(5),347-368(2002)。doi:10.1002/cpe.652·Zbl 1008.68527号 ·doi:10.1002/cpe.652
[16] Jones,S.:动态并行简介。In:GPU技术会议演示文稿S0338(2012)
[17] Khronos集团:OpenCL。http://www.khronos.org/opencl/ ·Zbl 1008.68527号
[18] Kurganov,A.,Petrova,G.:圣维南体系的二阶平衡正守恒中心迎风格式。Commun公司。数学。科学。5, 133-160 (2007) ·Zbl 1226.76008号 ·doi:10.4310/CMS.2007.v5.n1.a6
[19] 劳伦斯伯克利国家实验室,计算科学与工程中心:BoxLib。https://ccse.lbl.gov/BoxLib/index.html ·Zbl 0697.65068号
[20] LeVeque,R.J.、George,D.L.、Berger,M.J.:采用自适应优化有限体积方法进行海啸建模。Acta Numer公司。20, 211-289 (2011). 网址:10.1017/S0962492911000043·Zbl 1426.76394号 ·网址:10.1017/S0962492911000043
[21] Li,R.,Wu,S.:双曲守恒律的具有双重容差自适应策略的H自适应网格方法。科学杂志。计算。56(3), 616-636 (2013). doi:10.1007/s10915-013-9692-1·Zbl 1275.65049号 ·doi:10.1007/s10915-013-9692-1
[22] Lie,K.A.,Noelle,S.:关于守恒定律系统二阶非振荡中心差分格式的人工压缩方法。SIAM J.科学。计算。24(4), 1157-1174 (2003) ·Zbl 1038.65078号 ·doi:10.1137/S1064827501392880
[23] MacNeice,P.,Olson,K.M.,Mobarry,C.,de Fainchtein,R.,Packer,C.:PARAMESH:并行自适应网格优化社区工具包。计算。物理学。Commun公司。126(3), 330-354 (2000). doi:10.1016/S0010-4655(99)00501-9·Zbl 0953.65088号 ·doi:10.1016/S0010-4655(99)00501-9
[24] Meuer,H.、Strohmaier,E.、Dongarra,J.、Simon,H.:超级计算机站点500强(2013年)。http://www.top500.org/
[25] Nessyahu,H.,Tadmor,E.:双曲守恒律的非振荡中心差分。J.计算。物理学。87(2), 408-463 (1990) ·Zbl 0697.65068号 ·doi:10.1016/0021-991(90)90260-8
[26] Nicholaeff,D.、Davis,N.、Trujillo,D.、Robey,R.W.:使用通用图形处理单元实现基于细胞的自适应网格细化。洛斯阿拉莫斯国家实验室技术报告(2012年)·Zbl 0665.76070号
[27] NVIDIA:NVIDIA CUDA编程指南5.0(2012)·Zbl 1364.65223号
[28] NVIDIA:NVIDIA GeForce GTX 680。技术报告,NVIDIA Corporation(2012)
[29] NVIDIA:CUDA社区展示(2013年)。http://www.nvidia.com/object/cuda_showcase_html.html
[30] Owens,J.、Houston,M.、Luebke,D.、Green,S.、Stone,J.和Phillips,J.:GPU计算。程序。IEEE 96(5),879-899(2008)。doi:10.1109/JPROC.2008.917757·doi:10.1109/JPROC.2008.917757
[31] Stra,M.L.:稀疏域GPU上的浅水模拟。收录于:A.Cangiani、R.L.Davidchack、E.Georgoulis、A.N.Gorban、J.Levesley、M.V.Tretyakov(编辑)《2011年数值数学与高级应用》,第673-680页。施普林格,柏林(2013)。doi:10.1007/978-3-642-33134-371·Zbl 1311.76110号
[32] Stra,M.L.,Brodtkorb,A.R.:多个GPU上的浅水模拟。收录于:K.Jónasson(编辑)《应用并行和科学计算》,《计算机科学讲义》,第7134卷,第56-66页。施普林格,柏林(2012)。doi:10.1007/978-3642-28145-76·Zbl 1365.76249号
[33] Schive,H.Y.,Tsai,Y.C.,Chiueh,T.:GAMER:一种图形处理单元,用于天体物理学加速自适应修正码。天体物理学。补充期刊。186(2), 457-484 (2010). doi:10.1088/0067-0049/186/2/457·doi:10.1088/0067-0049/186/2/457
[34] Sweby,P.K.:双曲守恒定律中使用通量限制器的高分辨率方案。SIAM J.数字。分析。21(5), 995-1011 (1984) ·Zbl 0565.65048号 ·doi:10.1137/0721062
[35] 恩佐项目:恩佐。http://enzo-project.org/
[36] van Leer,B.:走向最终保守差分格式。五、戈杜诺夫方法的二阶续集。J.计算。物理学。32(1), 101-136 (1979). doi:10.1016/0021-9991(79)90145-1·Zbl 1364.65223号 ·doi:10.1016/0021-9991(79)90145-1
[37] Wang,P.,Abel,T.,Kaehler,R.:GPU上的自适应网格流体模拟。新阿童木。15(7),581-589(2010)。doi:10.1016/j.newast.2009.10.002·doi:10.1016/j.newast.2009.10.002
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。