×

使用SU2进行可伸缩隐式RANS计算的性能优化。 (英语) Zbl 1390.76425号

摘要:在本文中,我们介绍了SU2的单节点和多节点优化,SU2是一种广泛使用的开源计算流体动力学应用程序,旨在提高非结构化网格上隐式雷诺平均Navier-Stokes计算的性能和可扩展性。典型的行业标准实现目前受到非结构化访问、可变并行度以及传统使用的Krylov线性解算器固有的全局同步的限制。因此,我们依靠积极的单节点优化,如层次并行、动态线程、压缩内存布局和矢量化,以及一个通信友好的聚集(几何)线性多重网格解算器。基于著名的ONERA M6几何结构的结果,与具有14个MPI等级的基准SU2实现相比,我们的单核和共享内存优化在最新的14核Intel®Xeon(^{mathrm{TM}})E5-2697v3处理器上的速度提高了\(2.6倍\)。在多节点设置中,与传统的基于Krylov(GMRES)的方法相比,混合OpenMP+MPI多重网格实现在256个节点上实现了更高的并行效率(2倍)。

MSC公司:

76个M12 有限体积法在流体力学问题中的应用
76层65 湍流的直接数值模拟和大涡模拟
76牛顿 可压缩流体和气体动力学
2005年5月 并行数值计算
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Jameson,A.,计算流体动力学的现状、挑战和未来发展,(AGARD,CFD方法和算法的进展和挑战,(1995))
[2] Vassberg JC、DeHaan MA、Rivers SM、Wahls RA。为应用cfd验证研究开发通用研究模型。AIAA2008;(2008-6919).
[3] Gropp WD、Kaushik DK、Keyes DE、Smith BF。
[4] Aubry R、Houzeaux G、Vasquez M。共享内存机器上基于非结构化边的解算器的一些有用策略。AIAA论文2011-06142011。
[5] Mavrilis DJ,Mani K.使用NSU3D解算器的非结构化网格解算技术
[6] 达菲,A。;哈蒙德·D·。;Nielsen,E.,混合多核架构的生产级CFD代码加速,NASA/TM-2012-217770,(2012)
[7] Mudigere,D。;Sridharan,S。;Deshpande,A。;Park,J。;海涅克,A。;Smelyanskiy,M.,探索现代并行系统上非结构化网格cfd应用的共享内存优化,并行与分布式处理研讨会(IPDPS),(2015),IEEE
[8] Economon,T.D.(经济博士)。;帕拉西奥斯,F。;科普兰,S.R。;卢卡奇克,T.W。;Alonso,J.J.,Su2:一个用于多物理模拟和设计的开源套件,AIAA Journal,(2015)
[9] Hirsch,C.,内外流数值计算,(1984),威利纽约
[10] Wilcox,D.,CFD湍流建模,(1998),DCW Industries,Inc。
[11] White,F.,《粘性流体流动》(1974),纽约麦格劳希尔公司·Zbl 0356.76003号
[12] Spalart P,Allmaras S.气动流动的单方程湍流模型。AIAA论文1992-04391992。
[13] Barth,T.J.,Euler和Navier-Stokes方程的非结构化网格和有限体积解算器方面,VKI系列讲座上的讲稿。1994 - 05; 冯·卡曼流体动力学研究所,罗德圣约翰大学,(1995年)
[14] Quarteroni,A。;Valli,A.,偏微分方程的数值逼近,计算数学中的Springer级数,第23卷,(1997),Springer-Verlag Berlin Heidelberg New York
[15] Jameson,A.,《空气动力学分析和设计的计算算法透视》,Progr Aerosp Sci,37,197-243,(2001)
[16] LeVeque,R.,双曲问题的有限体积方法,(2002),剑桥大学出版社·Zbl 1010.65040号
[17] Wesseling,P.,《计算流体动力学原理》,Springer Series in Computation Mathematics,第29卷,(2000),Springer-Verlag Berlin Heidelberg New York·Zbl 0960.76002号
[18] Jameson,A.,《气体动力学数值方案的分析与设计》,1:人工扩散、迎风偏压、限制器及其对精度和多重网格收敛的影响,国际计算流体力学杂志,4,3-4,171-218,(1995)
[19] Jameson,A.,《气体动力学数值方案的分析和设计》,2:人工扩散和离散激波结构,国际计算流体力学杂志,5,1-2,1-38,(1995)
[20] Toro,E.F.,《流体动力学的黎曼解算器和数值方法:实用简介》(1999),Springer-Verlag·Zbl 0923.76004号
[21] Roe,P.L.,近似黎曼解算器,参数向量和差分格式,《计算物理杂志》,43,357-372,(1981)·Zbl 0474.65066号
[22] van Leer,B.,《走向最终保守差分格式V.戈杜诺夫方法的二阶续集》,《计算物理学杂志》,32,1,101-136,(1979)·Zbl 1364.65223号
[23] Venkatakrishnan V.关于限制器的精度和收敛到稳态解。AIAA论文1993-08801993;。
[24] Blazek,J.,《计算流体动力学:原理与应用》,(2005),爱思唯尔牛津·Zbl 0995.76001号
[25] Eliasson,P.,Edge,非结构化网格的Navier-Stokes解算器,技术代表,(2002),FOI-R-0298-SE FOI科学报告·Zbl 1177.76285号
[26] Economon TD、Palacios F、Alonso JJ、Bansal G、Mudigere D、Deshpande A.等人。非结构化开源su2套件的高性能优化。AIAA论文2015-1949。
[27] 萨阿德,Y。;Schultz,M.H.,GMRES:求解非对称线性系统的广义最小残差算法,SIAM科学统计计算杂志,7856-869,(1986)·兹伯利0599.65018
[28] 格罗普,W.D。;Kaushik博士。;Keyes,D.E。;Smith,B.F.,高性能并行隐式CFD,并行计算,27,4,337-362,(2001)·Zbl 0971.68191号
[29] 格罗普,W.D。;Kaushik,D.K。;Keyes,D.E。;Smith,B.F.,非结构化网格CFD应用程序的性能建模和调整,超级计算,ACM/IEEE 2000年会议,(2000年),IEEE
[30] 施密特,V。;Charpin,F.,《跨音速马赫数下ONERA-M6机翼上的压力分布》,技术代表,(1979年)
[31] Hammarlund,P。;库马尔,R。;奥斯本,R.B。;Rajwar,R。;Singhal,R。;D'Sa,R.,Haswell:第四代英特尔核心处理器,IEEE Micro,34,2,6-20,(2014)
[32] Karypis,G。;Kumar,V.,一种快速高质量的不规则图分割多级方案,SIAM科学计算杂志,20,1,359-392,(1998)·Zbl 0915.68129号
[33] 安德森,E。;Saad,Y.,在并行计算机上求解稀疏三角线性系统,国际J高速计算,1,01,73-95,(1989)·Zbl 0726.65026号
[34] Naumov,M.,GPU上预处理迭代法中稀疏三角线性系统的并行解,技术代表,(2011),NVIDIA技术报告,NVR-2011-001
[35] Park,J。;Smelyanskiy,M。;Dubey,P.,《高性能共享内存稀疏三角解算器的稀疏化同步》,国际超级计算会议(ISC),(2014)
[36] McCalpin J.流基准测试。www.cs.virginia.edu/Stream/ref.html#what 1995;。
[37] 周,E。;Saad,Y.,不定矩阵ILU预条件的实验研究,计算应用数学杂志,86,2,387-414,(1997)·Zbl 0891.65028号
[38] Mavrilis,D。;Mani,K.,《使用NSU3D解算器的非结构化网格解算技术》,AIAA论文2014-0081,发表于第52届AIAA航空航天科学会议,马里兰州国家港,(2014)
[39] 卡特希尔,E。;McKee,J.,减少稀疏对称矩阵的带宽,1969年第24届全国会议论文集,157-172,(1969),美国计算机学会
[40] Lohner,R.,用于矢量化的高速缓存有效重新编号,Int J Numer Method Biomed Eng,26,56228-636,(2010)·Zbl 1187.68042号
[41] 达夫,I.S。;埃里斯曼,A.M。;Reid,J.K.,稀疏矩阵的直接方法,数值分析专著,(1989),牛津大学出版社·Zbl 0666.65024号
[42] 英特尔®体系结构指令集扩展编程参考2014。
[43] Karypis,G。;Schloegel,K。;Kumar,V.,Parmetis:并行图划分和稀疏矩阵排序库,(1997),第10版,明尼苏达大学计算机科学系
[44] Palacios F、Economon TD、Aranake AC、Copeland SR、Lonkar AK、Lukaczyk TW.等人。斯坦福大学非结构化(SU^{2}):湍流的开源分析和设计技术。AIAA论文2014-02432014。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。