×

湍流通道流伪谱模拟的MPI并行实现。 (英语) Zbl 1500.76063号

摘要:本研究使用谱方法在大型计算域中对湍流通道流动进行直接数值模拟。由于在谱方法中应用了傅里叶离散化,该方法的并行化可能会带来很大的通信开销,从而导致可扩展性较差。我们通过探索并行技术来设计和改进谱码,包括区域分解和数据转置算法。我们特别关注2D域分解和数据转置算法,该算法采用非阻塞的集合操作,提高了并行性能,从而通过重叠计算和通信实现延迟缓解。最后,我们评估了KISTI超级计算中心Nurion超级计算机上的代码。基于非阻塞集合运算的转置算法显示出最佳性能,在L550(1536\times257\times1536)网格点情况下,使用16384 MPI秩在256个节点上的计算速度是非优化2D分解情况下的3.55倍。

MSC公司:

76平方米 谱方法在流体力学问题中的应用
76F10层 剪切流和湍流
76层65 湍流的直接数值模拟和大涡模拟
第65年 并行数值计算
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Abe,H。;Matsuo,Y。;Kawamura,H.,关于雷诺数依赖性的充分发展的湍流通道流动的直接数值模拟,流体工程杂志,123,2,382-393(2001)
[2] Adrian,R.J.,《壁湍流中的发夹涡组织》,流体物理学,19,4(2007)·兹比尔1146.76307
[3] Balakumar,B.J。;Adrian,R.J.,《河道和边界层流动中的大尺度和超大尺度运动》,《皇家学会哲学学报A》,365,1852,665-681(2007)·兹比尔1152.76369
[4] Balay,S.、Adams,M.F.和Abhyankar,S.,2015年。PETSc用户手册。技术报告,阿贡国家实验室,3.6版。http://www.mcs.anl.-gov/petsc。
[5] 布鲁尔,K.S。;Everson,R.M.,《关于使用切比雪夫多项式计算导数的错误》,《计算物理杂志》,99,56-67(1992)·Zbl 0747.65009号
[6] 卡努托,C。;夸特罗尼,A。;Hussaini,M.Y.,《流体动力学中的光谱方法》(1998),柏林:Springer-Verlag出版社,柏林
[7] 琴,C。;Ooi,A。;Monty,J.,《管道流动DNS中的雷诺数效应以及与通道和边界层的比较》,《国际热流和流体流动杂志》,45,33-40(2014)
[8] Choi,J.I。;Lee,C。;Yeo,K.,《湍流槽道流动的拉格朗日统计》,流体物理学,16,3,779-793(2004)·Zbl 1186.76106号
[9] Cifani,P。;Geurts,B.J。;Kuerten,J.G.M.,《湍流气泡-腺体通道流的高度可扩展DNS解算器》,计算机与流体,172,67-83(2014)·Zbl 1410.76082号
[10] 科尔特斯,T.A。;Balachandar,S.,具有分布式存储器的大规模并行机器中湍流的高性能谱模拟,高性能计算应用国际期刊,9,3,187-204(1995)
[11] Costa,P.,基于FFT的湍流、计算机和数学及其应用大规模并行直接数值模拟有限差分求解器,76,8,1853-1862(2018)·Zbl 1442.65156号
[12] 库比特。2015。CUBIT几何图形和网格生成工具包。https://cubit.sandia.gov。
[13] 达尔星。;Keyes,K.E。;Mortensen,M.,使用高级MPI的快速并行多维FFT,并行与分布式计算杂志,128,137-150(2019)
[14] del Alamo,J.C。;Jiménez,J.,湍流通道中超大各向异性尺度的光谱,流体物理,15,6,L41-L44(2003)·Zbl 1186.76136号
[15] del Alamo,J.C。;Zandonade,P。;Jiménez,J.,湍流通道能量谱的缩放,流体力学杂志,500135-144(2004)·Zbl 1059.76031号
[16] 弗里戈,M。;Johnson,S.G.,FFTW3的设计与实现,IEEE会议记录,93,2,216-231(2005)
[17] Fuka,V.,PoisFFT-一种自由并行快速泊松解算器,应用数学与计算,267356-364(2015)·Zbl 1410.65417号
[18] 霍曼,H。;格雷尔(R.Grauer)。;Dreher,J.,浮点精度和插值方案对伪谱码湍流DNS结果的影响,计算机物理通信,177,560-565(2007)·Zbl 1196.76052号
[19] 霍亚斯,南卡罗来纳州。;Jiménez,J.,湍流通道中速度波动的标度,流体物理学,18,1(2006)
[20] Hwang,Y.,湍流通道中自持附涡的统计结构,流体力学杂志,767,254-289(2015)
[21] Karypis,G.和Schloegel,K.,2013年。ParMETIS\(####\)并行图分区和稀疏矩阵排序库4.0版。明尼苏达大学。
[22] Kim,K.C。;Adrian,R.J.,《外层的大尺度运动》,流体物理学,11,2,417-422(1999)·兹比尔1147.76430
[23] Kim,J。;梅因,P。;Moser,R.D.,《低雷诺数下充分发展的河道水流中的湍流统计》,《流体力学杂志》,177133-166(1987)·Zbl 0616.76071号
[24] 孔,F。;Cai,X.C.,三维非结构网格上流固耦合问题隐式求解器的可伸缩性研究,高性能计算应用国际期刊,32,2,207-219(2018)
[25] Lee,J。;Choi,J.I。;Lee,J.H.,湍流道中大尺度和超大尺度运动的空间组织,流体力学杂志,749818-840(2014)
[26] Lee,C。;Choi,J.I。;Yeo,K.,《近壁湍流加速的间歇性本质》,《物理评论快报》,92,4(2004)
[27] 李,M。;马来亚州。;Ulerich,R.,《湍流模拟中领导计算的经验》,科学与工程计算,16,5,24-31(2014)
[28] 李,M。;Moser,R.D.,《高雷诺数下紊流通道流平衡方程的谱分析》,《流体力学杂志》,860886-938(2019)·Zbl 1415.76350号
[29] Li,Q.、Henningson,D.S.和Schlater,P.,2008年。大规模并行计算机上的壁面流谱模拟。技术报告,瑞典斯德哥尔摩:KTH Mech。
[30] Li,N.和Laizet,S.,2010年。“2DECOMP&FFT”,英国爱丁堡克雷用户组2010年会议。
[31] Lundbladh,A.,Berlin,S.,Skote,M.,Hildings,C.,Choi,J.,Kim,J.和Henningson,D.,1999年。模拟平板上不可压缩流动的有效谱方法。技术报告,KTH Mech。,瑞典斯德哥尔摩。
[32] 蒙蒂,J.P。;Ng、H.C.H。;Hutchins,N.,湍流管道、通道和边界层流动的比较,流体力学杂志,632431-442(2009)·Zbl 1183.76036号
[33] 莫瑟,R.D。;Mansour,N.N。;Kim,J.,湍流通道流动的直接数值模拟,流体物理,11,4,943-945(1999)·Zbl 1147.76463号
[34] Pekurovsky,D.,《P3DFFT:三维傅里叶变换并行计算框架》,SIAM科学计算杂志,34,4,192-209(2012)·Zbl 1253.65205号
[35] Pippig,M.,PFFT:FFTW到大规模并行架构的扩展,SIAM科学计算杂志,35,3,213-236(2013)·Zbl 1275.65098号
[36] Shi,L。;Hof,B。;Rampp,M.,《伪谱模拟的混合MPI-OpenMP并行实现及其在泰勒-库特流中的应用》,计算机与流体,106,1-11(2015)·Zbl 1390.76623号
[37] Song,S。;Hollingsworth,J.K.,《计算通信重叠的并行3-D FFT设计与自动调整》,ACM SIGPLAN通告,49,8,181-192(2014)
[38] 范德波尔,E.P。;Donners,J。;Ostilla-Mónico,R.,《强湍流壁面流的铅笔分布有限差分代码》,计算机与流体,116,10-16(2015)·Zbl 1390.76250号
[39] 周,J。;阿德里安·R·J。;巴拉昌达尔,S。;Kendall,T.M.,《河道水流中发夹涡相干包的生成机制》,《流体力学杂志》,387353-96(1999)·Zbl 0946.76030号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。