×

面向通用GPU/CPU浅流建模工具。 (英语) 兹比尔1391.76115

摘要:与传统的中央处理器(CPU)方法相比,本文提出了一种新的软件,它利用现代图形处理单元(GPU)显著加快二维浅流模拟。二阶精度的Godunov-type MUSCL-Hancock格式与HLLC-Riemann解算器一起使用,以创建适用于不同类型洪水模拟的鲁棒框架。使用三家主流供应商提供的CPU和GPU硬件,使用180万个单元域模拟了真实的溃坝事件。结果显示与事后调查结果吻合良好。对程序结构和数据缓存的不同配置进行了评估,结果表明新软件适用于不同类型的现代处理设备。性能缩放与供应商提供的报价峰值性能数据的差异类似。我们还比较了32位和64位浮点计算的结果,发现32位精度引入了显著的局部错误。

MSC公司:

76D05型 不可压缩粘性流体的Navier-Stokes方程
65日元10 特定类别建筑的数值算法
76M20码 有限差分方法在流体力学问题中的应用
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] French,J.R.,支持地貌和水力建模的机载激光雷达,地球表面过程陆地,28,321-335,(2003)
[2] Haile AT,Rientjes THM公司。LiDAR DEM分辨率对洪水建模的影响:洪都拉斯特古西加尔巴市模型敏感性研究。参考:ISPRS WG III/3、III/4、V/3车间激光扫描2005。荷兰恩舍德:国际摄影测量和遥感学会;2005年,第168-73页。
[3] 马克,K。;Bates,P.,《高分辨率地形数据与漫滩水流模型的集成》,《水文过程》,第14期,第2109-2122页,(2000年)
[4] 环境署]。在洪水和海岸侵蚀风险管理中加强与自然过程的合作——对《皮特评论》建议27的回应。技术代表。;环境署;2012
[5] 威尔金森,M.E。;奎因,P.F。;Welton,P.,2008年9月贝尔福德集水区诺森伯兰洪水期间的径流管理,《洪水风险管理杂志》,3,4,285-295,(2010)
[6] Pender G,Néelz S.二维水力建模包的基准测试。技术代表SC080035/SR2。环境机构;2010
[7] 辛格,V.P。;Aravamuthan,V.,稳态陆上水流的运动波和扩散波近似误差,CATENA,27,3-4,209-227,(1996)
[8] Néelz S,Pender G.2D水力建模包的桌面审查。技术代表SC080035。环境机构;2009
[9] 梁,Q。;Borthwick,A.G.L。;Stelling,G.,动态自适应四叉树网格上溃坝和溃堤流体动力学模拟,Int J Numer Methods Fluids,46,2127-162,(2004)·Zbl 1060.76590号
[10] Pau,J.C。;Sanders,B.F.,显式有限体积浅水模型的并行实现性能,ASCE J Compute Civ Eng,20,2,99-110,(2006)
[11] 德里斯,A.I。;Mathioudakis,E.N.,自由表面浅水流动模拟的有限体积法并行化,数学计算模拟,79,11,3339-3359,(2009)·Zbl 1168.76030号
[12] J.D.欧文斯。;Luebke,D。;Godindaraju,N。;哈里斯,M。;Krüger,J。;Lefohn,A.,图形硬件通用计算调查,Comp Graph Forum,26,1,80-113,(2007)
[13] Nickolls,J。;Dally,W.,《GPU计算时代》,IEEE Micro,30,2,56-69,(2010)
[14] 比森,M。;伯纳西,M。;Melchionna,S。;Succi,S。;Kaxiras,E.,使用GPU集群的多尺度血液动力学,Commun Compute Phys,11,48-64,(2012)
[15] 英特尔公司]。Intel Xeon处理器E5-2600系列;2012年[访问日期:2013年5月20日]http://download.intel.com/support/processors/xeon/sb/xeonE5-2600.pdf。
[16] NVIDIA公司]。特斯拉M级GPU计算模块;2011年【访问日期:2013年5月20日】http://www.nvidia.com/docs/IO/105880/DS-Tesla-M-Class-Aug11.pdf。
[17] Kuo,F。;M.R.史密斯。;谢长廷。;周,C。;Wu,J.,通用守恒方程的GPU加速及其在几个工程问题中的应用,计算流体,45,147-154,(2011)·Zbl 1430.76017号
[18] Saetra,M.L。;Brodtkorb,A.R.,多gpu上的浅水模拟,Lect Notes Compute Sci,7134,55-66,(2012)
[19] Horvath Z,Liebmann M.CPU/GPU集群上CFD代码的性能。在:Simos TE,Psihoyios G,Tsioturas C,编辑。ICNAAM数值分析和应用数学,2010年国际会议,第3卷。希腊:罗德;2010
[20] 王,P。;Abel,T。;Kaehler,R.,GPU上的自适应网格流体模拟,New Astron,15,7,581-589,(2010)
[21] Rossinelli,D。;Hejazialhoseini,B。;斯帕帕尼亚托,D.G。;Koumoutsakos,P.,使用小波自适应网格对多相可压缩流进行多核/多GPU加速模拟,SIAM科学计算杂志,33,2,512-540,(2011)·Zbl 1368.76051号
[22] 希夫,H。;张,U。;Chiueh,T.,AMR中采用MPI/openmp/GPU混合并行的定向非分裂水动力方案,国际J高性能计算应用,1-16,(2011)
[23] 克雷斯波。;多明格斯,J.M。;巴雷罗,A。;戈梅斯·盖斯特拉,M。;罗杰斯,B.D.,《计算流体力学中一种新的加速工具GPU:平滑粒子流体动力学方法的效率和可靠性》,《公共科学图书馆·综合》,6,6,(2011)
[24] Brodtkorb,A.R.,异构体系结构科学计算博士(2010),奥斯陆大学
[25] Brodtkorb,A.R。;哈根,T.R。;Lie,K。;Natvig,J.R.,《使用gpus模拟和可视化圣维南系统》,《计算视觉科学》,13,7,341-353,(2010)·Zbl 1273.76338号
[26] Brodtkorb,A.R。;Saetra,M.L。;Altinakar,M.,《GPU上的高效浅水模拟:实现可视化验证》,计算流体,55,1-12,(2011)·Zbl 1291.76254号
[27] Xing,Y。;张,X。;Shu,C.,浅水方程的保正高阶平衡间断Galerkin方法,Adv water Resour,331476-1493,(2010)
[28] 穆里洛,J。;García-Navarro,P.,《含源项偏微分方程的弱解:浅水方程的应用》,《计算物理杂志》,229,11,4327-4368,(2010)·Zbl 1334.35014号
[29] 梁,Q。;Marche,F.,具有复杂源项的平衡浅水方程的数值解,Adv water Resour,32,6,873-884,(2009)
[30] Godunov,S.K.,《流体动力学方程间断解数值计算的差分方法(俄语)》,Metematicheskii Sbornik,47,3,271-306,(1959)·Zbl 0171.46204号
[31] 托罗,E.F。;云杉,M。;Spears,W.,HLL-Riemann解算器中接触面的恢复,冲击波,4,1,25-34,(1994)·Zbl 0811.76053号
[32] 埃尔杜兰,K.S。;库蒂亚,V。;Hewett,C.J.M.,浅水方程有限体积解与冲击捕获方案的性能,国际J数值方法流体,40,10,1237-1273,(2002)·Zbl 1047.76059号
[33] Zoppou,C。;Roberts,S.,溃坝模拟的显式方案,J Hydraul Eng,129,11,11-34,(2003)
[34] van Leer,B.,关于Godunov、engquist-osher和roe的迎风差分格式之间的关系,SIAM科学统计计算杂志,5,1,1-20,(1984)·Zbl 0547.65065号
[35] Roe,P.L.,欧拉方程基于特征的方案,流体力学年鉴,18,337-365,(1986)·Zbl 0624.76093号
[36] Toro,E.F.,自由表面浅流的冲击捕捉方法,(2001),John Wiley和Sons Hoboken·兹比尔0996.76003
[37] Suresh,A.,多维正性保持方案,SIAM科学计算杂志,22,4,1184-1198,(2000)·Zbl 0983.65102号
[38] Yee,H.C。;Sjogreen,B.,多尺度MHD流的高效低耗散高阶格式,II:数值误差最小化,科学计算杂志,29,1,115-164,(2006)·Zbl 1149.76648号
[39] Liang,Q.,《使用平衡良好的浅层水流模型进行洪水模拟》,J Hydraul Eng,136,9,669-675,(2010)
[40] 库兰特,R。;Friedrichs,F。;Lewy,H.,《关于数学物理的偏微分方程》,IBM J,11,2,215-234,(1967)·Zbl 0145.40402号
[41] Khronos OpenCL工作组。OpenCL规范v1.2;2012
[42] NVIDIA公司。OpenCL最佳实践指南v3.2;2010年a。
[43] Advanced micro devices Inc.AMD加速并行处理OpenCL:编程指南;2011
[44] Fang J,Varbanescu AL。Sips H。CUDA和OpenCL的综合性能比较。摘自:第40届并行处理国际会议(ICPP’11)。台湾台北;2011年,第216-25页。
[45] NVIDIA公司。CUDA体系结构的OpenCL编程指南;2010年b。
[46] Goutal N.马尔帕塞特水坝溃决——概述和测试用例定义。附:第四届CADAM会议记录。西班牙:萨拉戈萨;1999年,第1-8页。
[47] 高级微设备公司AMD FirePro专业图形;2012年。[访问日期:2013年5月21日]http://www.amd.com/uk/Documents/amd-FirePro-Catalogue.pdf。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。