×

描述均匀热粘性介质中非线性声波的高性能多GPU解算器。 (英语) Zbl 1410.76283号

摘要:提出了一种双精度数值解算器,用于描述在多处理器(GPU)中使用新型有限振幅可压缩声学模型的高强度超声波动的传播。本求解器基于可压缩Navier-Stokes方程的变分分析得出的保守双曲线公式,并使用显式高阶有限差分策略实现。在这项工作中,分别使用WENO-Z重建方案和高阶有限差分模板来近似对流和扩散空间算子的贡献。然后将空间算子与低存储Runge-Kutta方案相关联,以在时间上显式地集成系统。当前的多GPU实现旨在充分利用每个GPU,并在每个节点的基础上获得算法的最佳性能。为了评估当前解算器的性能,使用了一台带有4个特斯拉K80双GPU加速器的典型小型服务器计算机。结果表明,对于大区域问题,该公式具有线性伸缩性。此外,与运行i7处理器4.2的OpenMP实现相比GHz,这比我们的MPI-GPU实现要好99倍。在这项工作中,通过高强度聚焦超声传播的三维模拟,说明了当前的多GPU解算器。

MSC公司:

76M20码 有限差分方法在流体力学问题中的应用
6500万06 含偏微分方程初值和初边值问题的有限差分方法
65日元10 特定类别建筑的数值算法
2005年第76季度 水力和气动声学

软件:

CUDA公司
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 汉密尔顿,M.F。;Blackstock,D.T.,非线性声学,1,(1998),圣地亚哥学术出版社
[2] Solovchuk,M。;Sheu,T.W.-H。;Thiriet,M.,通过高强度聚焦超声消融肝脏肿瘤的多物理建模,Commun Comput Phys,18,04,1050-1071,(2015)·Zbl 1373.76193号
[3] 阿农森,S.I。;Barkve,T。;TjØtta,J.N.,有限振幅声束近场中的畸变和谐波产生,J Acoust Soc Am,75,3,749-768,(1984)·Zbl 0548.76061号
[4] 医学硕士迪亚兹。;Solovchuk,M.A。;Shue,T.W.H.,模拟热粘性均匀介质中非线性声传播的保守数值格式,J Compute Phys,(2018)·Zbl 1392.76042号
[5] 蒋国胜。;Shu,C.-W.,加权ENO方案的有效实施,计算物理杂志,126,1202-228,(1996)·Zbl 0877.65065号
[6] 威廉姆斯。;沃特曼,A。;Patterson,D.,《Roofline:多核架构的一种有洞察力的视觉性能模型》,Commun ACM,52,4,65-76,(2009)
[7] Berenger,J.-P.,《电磁波吸收的完美匹配层》,《计算物理杂志》,114,2,185-200,(1994)·Zbl 0814.65129号
[8] Nvidia,C.,《Cuda C编程指南v8.0》,(2017),恩维迪亚公司
[9] 博尔赫斯,R。;卡莫纳,M。;科斯塔,B。;Don,W.S.,双曲守恒律的改进加权本质非振荡格式,计算物理杂志,227,63191-3211,(2008)·Zbl 1136.65076号
[10] Haynes,W.M.,CRC化学和物理手册,(2014),CRC出版社
[11] Beyer,R.,《非线性声学:美国声学学会》(1997),纽约:美国物理研究所
[12] 福尔摩斯,M。;北卡罗来纳州帕克。;Povey,M.,《使用声学光谱学测定水中体积粘度的温度依赖性》,《物理学杂志:会议系列》,269,012011,(2011),IOP出版社
[13] Jakevicius,L。;Demcenko,A.,《密闭室中超声衰减对空气温度的依赖性》,Ultragarsas,63,1,18-22,(2003)
[14] Parker,K.J.,肝组织中的超声衰减和吸收,超声医学生物学,9,4,363-369,(1983)
[15] Williamson,J.,低存储Runge-Kutta方案,计算物理杂志,35,1,48-56,(1980)·Zbl 0425.65038号
[16] Henrick,A.K。;Aslam,T.D。;Powers,J.M.,映射加权基本非振荡格式:在临界点附近达到最优阶,计算物理杂志,207,2,542-567,(2005)·Zbl 1072.65114号
[17] 卡斯特罗,M。;科斯塔,B。;Don,W.S.,双曲守恒律的高阶加权本质非振荡weno-z格式,计算物理杂志,230,5,1766-1792,(2011)·Zbl 1211.65108号
[18] Brehm,C。;巴拉德,M.F。;霍斯曼,J.A。;Kiris,C.C.,高阶有限差分激波捕获方案的比较,计算流体,122,184-208,(2015)·Zbl 1390.76555号
[19] 苏鲁里,M。;Gillberg,T。;巴登,S.B。;Cai,X.,使用多个cuda流和线程的有效多gpu通信,2014年IEEE第20届并行和分布式系统国际会议(ICPADS),981-986,(2014),IEEE
[20] Wermelinger,F。;Hejazialhosseni,B。;Hadjidoukas,P。;Rossinelli,D。;Koumoutsakos,P.,异构cpu/gpu体系结构的高效可压缩多分量流求解器,高级科学计算会议平台会议论文集,8,(2016),ACM
[21] Micikevicius,P.,使用cuda在gpu上进行三维有限差分计算,图形处理单元通用处理第二次研讨会论文集,79-84,(2009),ACM
[22] Maruyama,N。;Aoki,T.,优化nvidia开普勒gpus的模板计算,第一届高性能模板计算国际研讨会论文集,维也纳,89-95,(2014)
[23] 孟,C。;王,L。;曹,Z。;叶,X。;Feng,L.-L.,在gpu上加速大规模宇宙学模拟的高阶有限差分weno方案,并行和分布式处理研讨会和博士论坛(IPDPSW),2013年IEEE第27届国际会议,2071-2078,(2013),IEEE
[24] 科利诺,F。;Tsogka,C.,完全匹配吸收层模型在各向异性非均匀介质线性弹性动力学问题中的应用,地球物理学,66,1,294-307,(2001)
[25] Solovchuk,M。;休·T·W。;Thiriet,M.,用于声流和非线性传播效应研究的非线性westervelt方程模拟,J Acoust Soc Am,134,5,3931-3942,(2013)
[26] Solovchuk,M.A。;三十,M。;Sheu,T.W.,声止血过程中声流和声加热的计算研究,应用治疗工程,1241112-1122,(2017)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。