PFFT公司

PFFT:FFTW到大规模并行架构的扩展。我们提出了一个基于MPI的软件库,用于在基于消息传递接口标准(MPI)的大规模并行分布式内存体系结构上计算快速傅立叶变换(FFTs)。与已有的转置FFT算法类似,我们提出了一个基于局部FFT、局部数据置换和全局数据交换的并行FFT框架。该框架可以推广到任意多维数据和过程网格。所有与性能相关的构建块都可以在FFTW软件库的帮助下实现。因此,我们的库提供了极大的灵活性和可移植性。与FFTW类似,我们可以计算复杂数据、实数据和偶或奇对称实数据的fft。所有的变换都可以在适当的地方进行。此外,我们还提出了一种在分布式内存架构下更有效地计算剪枝fft的算法。例如,我们提供大小介于$512^3$到$8192^3$之间的FFT的性能测量,在BlueGene/P体系结构上最多可提供262144个核心,在BlueGene/Q架构上最多可提供32768个核,在J“ulich Research on Petaflop architecture(JuRoPA)”上,我们提供了多达4096个核心的性能测量。


zbMATH中的参考文献(引用于,1标准件)

显示第1到16个结果,共16个。
按年份排序(引用)

  1. Bauer,Martin;Eibl,Sebastian;Godenschwager,Christian;Kohl,Nils;Kuron,Michael;Rettinger,Christoph;Schornbaum,Florian;Schwarzmeier,Christoph;Thönnes,Dominik;Köstler,Harald;Rüde,Ulrich:\ textscwaLBerla:多物理模拟的块结构高性能框架(2021)
  2. Gander,Martin J.;Wu,Shu Lin:用对角化技术求解初值问题的类周期波形松弛法的收敛性分析(2019)
  3. Jaber J.Hasbestan,INAC Senocak:PittPack:一个开源的Poisson方程求解器,用于使用加速器进行极端规模计算(2019年)阿尔十四
  4. Ashwin Vishnu Mohanan、Cyrille Bonamy、Pierre Augier:FluidFt:Fast Fourier Transform HPC库的通用API(C++和Python)(2018)阿尔十四
  5. Gerlind Plonka;Daniel Potts;Steidl,Gabriele;Tasche,Manfred:数值傅里叶分析(2018)
  6. Hofmann,Michael;Nestler,Franziska;Pippig,Michael:基于NFFT的带电荷和偶极子静电系统的Ewald求和(2017)
  7. 吕建峰;杨海钊:平面波离散化的预处理轨道极小化方法(2017)
  8. 戈拉米,阿米尔;马尔霍特拉,达尔;桑达,哈里;比罗斯,乔治:FFT,FMM,还是多重网格?单位立方体中均匀和非均匀网格的最新泊松解算器比较研究(2016)
  9. Jung,Jaewoon;Kobayashi,Chigusa;Imamura,Toshiyuki;Sugita,Yuji:三维FFT与体积分解方案的并行实现,用于高效分子动力学模拟(2016)
  10. Mortensen,Mikael;Langtangen,Hans Petter:湍流直接数值模拟的高性能python(2016)
  11. Fuka,V.:PoisFFT——自由并行快速泊松解算器(2015)
  12. Nestler,Franziska;Pippig,Michael;Potts,Daniel:基于混合周期NFFT的快速ewald求和(2015)
  13. Wiens,Jeffrey K.;Stockie,John M.:使用伪可压缩流体解算器的高效并行浸入式边界算法(2015)
  14. Browne,P.A.;Budd,C.J.;Piccolo,C.;Cullen,M.:快速三维r-自适应网格再分配(2014)
  15. Pippig,Michael:PFFT:FFTW到大规模并行架构的扩展(2013)
  16. Pippig,Michael;Potts,Daniel:并行三维非quisited快速傅立叶变换及其在粒子模拟中的应用(2013)