×

PFFT:FFTW到大规模并行体系结构的扩展。 (英语) Zbl 1275.65098号

摘要:我们提出了一个基于MPI的软件库,用于在基于消息传递接口标准(MPI)的大规模并行分布式内存体系结构上计算快速傅里叶变换(FFT)。与已建立的转置FFT算法类似,我们提出了一个并行FFT框架,该框架基于局部FFT、局部数据置换和全局数据转置的组合。该框架可以推广到任意多维数据和进程网格。所有与性能相关的构建块都可以在FFTW软件库的帮助下实现。因此,我们的库提供了极大的灵活性和可移植性。与FFTW类似,我们能够计算复杂数据、真实数据和偶或奇对称真实数据的FFT。所有变换都可以完全就地执行。此外,我们还提出了一种算法来更有效地计算分布式存储体系结构上的剪枝FFT。例如,我们提供了大小介于\(512^3)和\(8192^3)之间的FFT的性能测量,BlueGene/P体系结构上的FFT高达262144个内核,BlueGene/Q体系结构上高达32768个内核,以及Julich Research on Petaflop Architectures(JuRoPA)上高达4096个内核。

MSC公司:

65T50型 离散和快速傅里叶变换的数值方法
2005年5月 并行数值计算
65日元 数值算法的封装方法
65年20月 数值算法的复杂性和性能
PDF格式BibTeX公司 XML格式引用
全文: 内政部 链接