迈克尔·皮皮格 PFFT:FFTW到大规模并行体系结构的扩展。 (英语) Zbl 1275.65098号 SIAM J.科学。计算。 35,第3号,C213-C236(2013). 摘要:我们提出了一个基于MPI的软件库,用于在基于消息传递接口标准(MPI)的大规模并行分布式内存体系结构上计算快速傅里叶变换(FFT)。与已建立的转置FFT算法类似,我们提出了一个并行FFT框架,该框架基于局部FFT、局部数据置换和全局数据转置的组合。该框架可以推广到任意多维数据和进程网格。所有与性能相关的构建块都可以在FFTW软件库的帮助下实现。因此,我们的库提供了极大的灵活性和可移植性。与FFTW类似,我们能够计算复杂数据、真实数据和偶或奇对称真实数据的FFT。所有变换都可以完全就地执行。此外,我们还提出了一种算法来更有效地计算分布式存储体系结构上的剪枝FFT。例如,我们提供了大小介于\(512^3)和\(8192^3)之间的FFT的性能测量,BlueGene/P体系结构上的FFT高达262144个内核,BlueGene/Q体系结构上高达32768个内核,以及Julich Research on Petaflop Architectures(JuRoPA)上高达4096个内核。 引用于22文件 MSC公司: 65T50型 离散和快速傅里叶变换的数值方法 2005年5月 并行数值计算 65日元 数值算法的封装方法 65年20月 数值算法的复杂性和性能 关键词:并行快速傅里叶变换;数值示例;基于MPI的软件库;消息传递接口标准;算法;FFTW软件库;性能测量 软件:磁粉探伤;FFTW公司;PFFT公司;2DECOMP公司 PDF格式BibTeX公司 XML格式引用 \textit{M.Pippig},SIAM J.科学。计算。35,编号3,C213-C236(2013;兹bl 1275.65098) 全文: 内政部 链接