×

用于高Schmidt数湍流混合的PB级模拟的双通讯器和双网格重解算法。 (英语) Zbl 1411.76043号

摘要:发展了一种新的双通讯器算法,用于对流扩散方程控制的被动标量湍流混合的直接数值模拟(DNS)。我们关注高Schmidt数(S c)的区域,其中由于分子扩散率低,标量场的网格分辨率要求比速度场的网格精度要求严格一个因子(S c})。通过使用傅里叶伪谱(FPS)方法在由N_v^3点组成的粗网格上模拟速度场,提高了计算吞吐量,而被动标量则使用组合紧凑有限差分(CCD)在由N_θ^3点构成的细网格上模拟以八阶精度计算一阶和二阶导数的方案。采用静态三维区域分解和CCD方案的并行求解算法,避免了存储器转置的沉重通信成本。内核用于评估几种优化CCD例程性能的方法,这些例程占总仿真成本的60%。在伊利诺伊大学香槟分校(University of Illinois,Urbana-Champaign)的千兆级超级计算机Blue Waters上,MPI-OpenMP混合方法大大提高了可伸缩性,其中每个NUMA域的专用线程将通信调用与使用OpenMP嵌套并行生成的单独线程组执行的计算任务重叠。在262144个核上的目标生产问题大小为(8192^{3})(0.5万亿)网格点时,与纯MPI实现相比,CCD时间减少了34%。524288核上的(16384^{3})(4万亿)网格点的计时令人鼓舞地保持了大于90%的可伸缩性,尽管对于这种规模的生产运行来说,挂钟时间太长了。使用CrayPat对最大问题大小(4096^{3})的性能监控表明,CCD例程可以达到近6%的峰值触发器率。新的DNS代码基于两个现有的FPS和CCD代码。在网格比为(N_theta/N_v=8)的情况下,通过将全局通信器分解为速度场和标量场的不相交通信器,解决了速度和标量问题计算要求的差异。速度场从速度通信器到标量通信器的相互通信传输由离散发送和非阻塞接收调用处理,这些调用与标量通信器上的其他操作重叠。对于标量字段在262144核上的生产模拟,相对于65536核,DNS代码在\(N_theta=8192\)和\(N_v=1024\)下实现了94%的强扩展,相对于\(N_theta=1024\)和\在512核上实现了92%的弱扩展。

理学硕士:

76层65 湍流的直接数值模拟和大涡模拟
76层25 湍流输送、混合
76M20码 有限差分方法在流体力学问题中的应用

软件:

磁粉探伤
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Warhaft,Z.,年度。流体力学版次。,32, 203-240 (2000) ·Zbl 0988.76042号
[2] Gotoh,T。;Yeung,P.K.(Davidson,P.A.;Kaneda,Y.;Sreenivasan,K.R.,《湍流十章》(2013),剑桥大学出版社)·Zbl 1299.76089号
[3] Pope,S.B.,《湍流》(2000),剑桥大学出版社·Zbl 0966.76002号
[4] M.Yokokawa、K.Itakura、A.Uno、T.Ishihara、Y.Kaneda,《超级计算会议论文集》,巴尔的摩,2002年;M.Yokokawa、K.Itakura、A.Uno、T.Ishihara、Y.Kaneda,《超级计算会议论文集》,巴尔的摩,2002年·兹比尔1082.76560
[5] 梅因,P。;Mahesh,K.,阿努。流体力学版次。,30, 539-578 (1998) ·Zbl 1398.76073号
[6] 石原慎太郎。;Gotoh,T。;金田,Y.,Annual。流体力学版次。,41, 165-180 (2009) ·Zbl 1157.76017号
[7] Yeung,P.K。;翟晓明。;Sreenivasan,K.R.,程序。国家。阿卡德。科学。,112, 12633-12638 (2015)
[8] 石原慎太郎。;Morishita,K。;横川,M。;Uno,A。;Y.金田,Phys。流体版本,1082403(R)(2016)
[9] Donzis,D.A。;Yeung,P.K.,Physica D,2391278-1287(2010年)·Zbl 1193.37116号
[10] Batchelor,G.K.,J.流体力学。,5, 113-133 (1959)
[11] Mininni,P.D。;Rosenberg博士。;Reddy,R。;Pouquet,A.,平行计算。,37, 316-326 (2011)
[12] Mahesh,K.,J.计算。物理。,145, 332-358 (1998) ·Zbl 0926.76081号
[13] Nihei,T。;石井,K.,Theor。申请。机械。日本,52,71-81(2003)
[14] Lele,S.K.,《计算杂志》。物理。,103, 16-42 (1992) ·Zbl 0759.65006号
[15] Gotoh,T。;Hatanaka,S。;Miura,H.,J.计算。物理。,231, 7398-7414 (2012)
[16] Brethouwer,G。;亨特,J.C.R。;Nieuwstadt,F.T.M.,J.流体力学。,474, 193-225 (2003) ·兹比尔1065.76110
[17] Bode,B。;巴特勒,M。;邓宁,T。;Hoefler,T。;克莱默,W。;格罗普,W。;Hwu,W.(Vetter,J.S.,《当代高性能计算:从Petascale到Exascale》(2013),查普曼和霍尔出版社)
[18] 卡努托,C。;侯赛尼,M.Y。;Quarteroni,A。;Zang,T.A.,光谱方法。《单一领域基础》(2006),施普林格出版社·Zbl 1093.76002号
[19] R.S.Rogall,NASA技术备忘录。81315,NASA,1981年;R.S.Rogall,NASA技术备忘录。81315,NASA,1981年
[20] 弗里戈,M。;约翰逊,S.G.,Proc。IEEE,93,216-231(2005)
[21] Donzis,D.A。;杨,P.K。;Pekurovsky,D.,TeraGrid会议(2008年),拉斯维加斯:美国内华达州拉斯维加斯
[22] Durran,D.R.,流体动力学数值方法及其在地球物理中的应用(2010),Springer·Zbl 1214.76001号
[23] 马托,N。;威廉姆斯·T·J。;Hewett,D.W.,并行计算。,21, 1769-1782 (1995)
[24] Gotoh,T。;渡边,T。;Miura,H.,《血浆融合研究》,9,3401019(2014)
[25] J.Enos、G.Bauer、R.Brunner、S.Islam、R.Fiedler、M.Steed、D.Jackson,《Cray用户群会议记录》,瑞士卢加诺,2014年;J.Enos、G.Bauer、R.Brunner、S.Islam、R.Fiedler、M.Steed、D.Jackson,《Cray用户小组会议记录》,瑞士卢加诺,2014年
[26] S.Jagannathan,D.A.Donzis,《(1^{st})会议录》;S.Jagannathan,D.A.Donzis,《(1^{st})会议录》
[27] Rabenseifner,R。;Wellein,G.,Int.J.高性能计算。应用。,17, 49-62 (2003)
[28] G.Hager、G.Schubert、T.Schoenemeyer、G.Wellein,《克雷用户小组会议记录》,阿拉斯加费尔班克斯,2011年;G.Hager,G.Schubert,T.Schoenmeyer,G.Wellein,克雷用户小组会议记录,阿拉斯加州费尔班克斯,2011年
[29] R.Rabenseifner,G.Hager,G.Jost,《会议录》(17^{th});R.Rabenseifner,G.Hager,G.Jost,《会议录》
[30] J.P.Hoeflinger,B.R.de Supinski,第一届OpenMP国际研讨会,俄勒冈州尤金,美国,2005年;J.P.Hoeflinger,B.R.de Supinski,第一届OpenMP国际研讨会,尤金,俄勒冈州,美国
[31] 技术代表S-2376-63,Cray Inc.,2015年9月24-27日;技术代表S-2376-63,Cray Inc.,2015年9月24-27日
[32] G.H.Bauer、J.Brandt、A.Gentile、A.Kot、M.Showerman,《Cray用户群会议记录》,英国伦敦,2016年;G.H.Bauer、J.Brandt、A.Gentile、A.Kot、M.Showerman,《Cray用户群会议记录》,英国伦敦,2016年
[33] J.D.McCalpin,IEEE计算机学会计算机体系结构技术委员会(TCCA)通讯,1995年,第19-25页;J.D.McCalpin,IEEE计算机学会计算机体系结构技术委员会(TCCA)通讯,1995年,第19-25页
[34] Donzis,D.A。;Sreenivasan,K.R。;Yeung,P.K.,流量涡轮机。库布斯特。,85, 549-566 (2010) ·Zbl 1410.76085号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。