×

多维DFT的灵活框架。 (英语) Zbl 1451.65243号

摘要:多维离散傅里叶变换(DFT)通常分解为多个一维变换。因此,任何多维DFT的并行实现都侧重于在一维DFT内或跨一维DFT进行并行化。现有的DFT包利用了1D DFT之间固有的并行性,并提供了刚性框架,这些框架不能扩展为同时包含并行形式和各种数据布局来实现一些并行性。然而,在exascale时代,系统有数千个节点和复杂的网络拓扑,灵活性和并行效率是所有多维DFT框架都需要具备的关键方面,以便适当地映射和缩放计算。在这项工作中,我们通过(1)使用不同的数据布局在计算节点上分布数据,(2)在不同程度上利用两种不同的并行化方案,以及(3),展示了对通用并行框架的需求,该框架有助于开发一系列并行多维DFT算法将两种并行化方案统一在一个框架内。我们表明,在两台超级计算机,即RIKEN的K-Computer和Oakridge的Summit上,选择不同并行多维DFT算法的灵活性允许在问题大小为\(1024^3\)的情况下产生几乎线性的强缩放结果。

MSC公司:

65T50型 离散和快速傅里叶变换的数值方法
2005年5月 并行数值计算
65日元10 特定类别建筑的数值算法
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] 里肯AICS。https://www.r-ccs.riken.jp/en/。
[2] J.Bruck、C.-T.Ho、S.Kipnis、E.Upfal和D.Weathersby,《多端口消息传递系统中全对全通信的高效算法》,IEEE Trans。并行分配系统,8(1997),第1143-1156页。
[3] A.Canning、L.Wang、A.Williamson和A.Zunger,百万原子系统的平行经验赝势电子结构计算,J.Compute。物理。,160(2000),第29-41页·Zbl 0963.65110号
[4] J.Choi、J.J.Dongarra、R.Pozo和D.W.Walker,《ScaLAPACK:分布式内存并发计算机的可扩展线性代数库》,载于《大规模并行计算前沿第四次研讨会论文集》,IEEE计算机学会,加利福尼亚州洛斯阿拉米托斯,1992年,第120-127页。
[5] J.W.Cooley和J.W.Tukey,复数傅里叶级数的机器计算算法,数学。公司。,19(1965年),第297-301页·Zbl 0127.09002号
[6] I.T.Foster和P.H.Worley,光谱变换方法的并行算法,SIAM J.Sci。计算。,18(1997),第806-837页·Zbl 0872.65094号
[7] F.Franchetti、Y.Voronenko和M.Pu­schel,共享内存的FFT程序生成:SMP和多核,《2006年ACM/IEEE超级计算会议论文集》,ACM,纽约,2006年,第115-es页·Zbl 1177.94043号
[8] M.Frigo和S.G.Johnson,FFTW的设计和实现,Proc。IEEE,93(2005),第216-231页。
[9] M.Frigo和S.G.Johnson,《FFTW:西方最快的傅里叶变换》,天体物理源代码库(2012)。
[10] M.A.Inda和R.H.Bisseling,使用BSP模型的一种简单高效的并行FFT算法,并行计算。,27(2001),第1847-1878页·Zbl 0983.68248号
[11] J.Johnson和X.Xu,无量纲FFT的递归实现,《声学、语音和信号处理》,2003年,ICASSP’03,第2卷,IEEE,新泽西州皮斯卡塔韦,2003,第649-652页。
[12] J.Jung、C.Kobayashi、T.Imamura和Y.Sugita,高效分子动力学模拟的三维FFT并行实现,计算。物理学。社区。,200(2016),第57-65页·Zbl 1352.65660号
[13] R.A.Kendall、E.Aprà、D.E.Bernholdt、E.J.Bylaska、M.Dupuis、G.I.Fann、R.J.Harrison、J.Ju、J.A.Nichols、J.Nieplocha、T.P.Straatsma、T.L.Windus和A.T.Wong,《高性能计算化学:NWChem分布式并行应用概述》,计算。物理学。社区。,128(2000),第260-283页·Zbl 1002.81571号
[14] R.A.Lebensohn,使用快速傅立叶变换的三维粘塑性多晶体的N位建模,材料学报。,49(2001),第2723-2737页。
[15] R.A.Lebensohn、A.K.Kanjarla和P.Eisenlohr,基于快速傅里叶变换的预测多晶材料微观力学场的弹塑性公式,国际塑料杂志。,32(2012),第59-69页。
[16] S.-B.Lee、R.Lebensohn和A.D.Rollett,使用快速傅里叶变换模拟两相材料的粘塑性微观力学响应,国际塑料杂志。,27(2011),第707-727页·兹比尔1405.74012
[17] OpenMP体系结构审查委员会,OpenMP应用程序接口4.0版,2018年5月,https://www.openmp.org/。
[18] D.Pekurovsky,P3DFFT:三维傅里叶变换并行计算框架,SIAM J.Sci。计算。,34(2012),第C192-C209页,https://doi.org/10.1137/1082748X。 ·Zbl 1253.65205号
[19] S.Plimpton,R.Pollock,and M.Stevens,Particle-mesh Ewald and RRESPA for parallel molecular dynamics simulations,in Proceedings of the Eighth SIAM Conference on parallel Processing for Scientific Computing,SIAM,Philadelphia,1997年。
[20] S.J.Plimpton,《DOE exascale计算项目中(大多数)粒子代码的FFT》,技术报告,SAND2017-127D1PE,Sandia国家实验室,新墨西哥州阿尔伯克基,2017年。
[21] S.J.Plimpton和A.P.Thompson,《多体电位的计算方面》,MRS Bull。,37(2012),第513-521页。
[22] D.T.Popovici、F.Franchetti和T.M.Low,向量化复数算法的混合数据布局内核,2017年IEEE高性能极限计算会议,HPEC 2017,马萨诸塞州沃尔瑟姆,2017年,IEEE,新泽西州皮斯卡塔韦,2017,第1-7页。
[23] D.T.Popovici、T.-M.Low和F.Franchetti,《多核和多套系统上的大带宽高效FFT》,IEEE国际并行和分布式处理研讨会(IPDPS),IEEE,新泽西州皮斯卡塔韦,2018年。
[24] J.Poulson、B.Marker、R.A.Van de Geijn、J.R.Hammond和N.A.Romero,《元素:分布式内存密集矩阵计算的新框架》,ACM Trans。数学。软件,39(2013),13·Zbl 1295.65137号
[25] B.Prisacari、G.Rodriguez、C.Minkenberg和T.Hoefler,《胖树网络中的带宽优化全对全交换》,载于《第27届ACM超级计算国际会议论文集》,ACM,纽约,2013年,第139-148页。
[26] M.D.Schatz,《分布式张量计算:形式化分布、再分布和算法推导》,德克萨斯州奥斯汀市德克萨斯大学博士论文,2015年。
[27] M.Snir、S.W.Otto、S.Huss-Lederman、D.W.Walker和J.Dongarra,《MPI:The Complete Reference》,麻省理工学院出版社,马萨诸塞州剑桥,1996年。
[28] T.Straatsma、E.Bylaska、H.van Dam、N.Govind、W.de Jong、K.Kowalski和M.Valiev,《可扩展计算化学的进展:NWChem》,载于《计算化学年度报告》,第7卷,爱思唯尔,阿姆斯特丹,2011年,第151-177页。
[29] P.N.Swarztrauber,多处理器FFT,并行计算。,5(1987年),第197-210页·Zbl 0624.65146号
[30] R.A.Sweet、W.L.Briggs、S.Oliveira、J.L.Porsche和T.Turnbull,超立方体的FFT和三维泊松解算器,并行计算。,17(1991),第121-131页·Zbl 0742.65074号
[31] D.Takahashi,《并行处理与应用数学》,第八届国际会议,PPAM 2009,波兰弗罗茨瓦夫,《修订论文集》,第一部分,捷克科技大学,波兰,捷克,第606-614页。
[32] M.Valiev、E.J.Bylaska、N.Govind、K.Kowalski、T.P.Straatsma、H.J.Van Dam、D.Wang、J.Nieplocha、E.Apra、T.L.Windus和W.A.de Jong,NWChem:大型分子模拟的综合可扩展开源解决方案,计算。物理学。社区。,181(2010),第1477-1489页·Zbl 1216.81179号
[33] C.Van Loan,《快速傅里叶变换的计算框架》,SIAM,费城,1992年·Zbl 0757.65154号
[34] J.-L.Vay、A.Almgren、J.Bell、L.Ge、D.Grote、M.Hogan、O.Kononenko、R.Lehe、A.Myers、C.Ng、J.Park、R.Ryne、O.Shapoval、M.Thévenet和W.Zhang,Warp-X:一个新的用于束等离子体模拟的exascale计算平台,Nucl。仪器。方法物理学。研究部分。A、 909(2018),第476-479页。
[35] J.-L.Vay,I.Haber和B.B.Godfrey,等离子体伪光谱电磁模拟的域分解方法,J.Comput。物理。,243(2013),第260-268页·Zbl 1349.82126号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。