PNFFT

并行三维非quisited快速傅立叶变换及其在粒子模拟中的应用。从一个被认可的串行算法开始,我们开发了一个新的并行算法来计算大规模并行分布式存储体系结构上的非必需快速傅立叶变换。我们演示了如何处理串行算法由于使用过采样FFT而导致的固有负载不平衡。该算法已在一个新的开源软件库PNFFT中实现。此外,基于粒子网格近似格式,我们推导了一种新的并行分布式存储算法,用于快速计算带电粒子系统中具有非周期边界条件的全库仑相互作用。我们证明,适当调整基本的并行非平衡快速傅立叶变换可以避免由于粒子缩放而导致的严重负载不平衡。为了证明我们算法的高度可扩展性,我们在一个使用多达65536个核心的BlueGene/P系统上提供了性能结果。