PFFT公司

PFFT:FFTW到大规模并行架构的扩展。我们提出了一个基于MPI的软件库,用于在基于消息传递接口标准(MPI)的大规模并行分布式内存体系结构上计算快速傅立叶变换(FFTs)。与已有的转置FFT算法类似,我们提出了一个基于局部FFT、局部数据置换和全局数据交换的并行FFT框架。该框架可以推广到任意多维数据和过程网格。所有与性能相关的构建块都可以在FFTW软件库的帮助下实现。因此,我们的库提供了极大的灵活性和可移植性。与FFTW类似,我们可以计算复杂数据、实数据和偶或奇对称实数据的fft。所有的变换都可以在适当的地方进行。此外,我们还提出了一种在分布式内存架构下更有效地计算剪枝fft的算法。例如,我们提供大小介于$512^3$到$8192^3$之间的FFT的性能测量,在BlueGene/P体系结构上最多可提供262144个核心,在BlueGene/Q架构上最多可提供32768个核,在J“ulich Research on Petaflop architecture(JuRoPA)”上,我们提供了多达4096个核心的性能测量。


zbMATH中的参考文献(参考文献17条,1标准件)

显示第1到17个结果,共17个。
按年份排序(引用)

  1. 鲍尔,马丁;埃布尔,塞巴斯蒂安;哥登施瓦格,基督徒;科尔,尼尔斯;库伦,迈克尔;雷廷格,克里斯托夫;舍恩堡,弗洛里安;施瓦茨迈尔,克里斯托夫;唐尼斯,多米尼克;科斯特勒,哈拉尔德;rude,Ulrich:\ textscwaLBerla:多物理模拟的块结构高性能框架(2021)
  2. 凯普莱斯,丹尼斯·加布里埃尔;吉利斯,托马斯;Philippe Chatelain:FLUPS:基于Fourier的无限泊松解算器库(2021)
  3. 甘德,马丁J。;吴树林:用对角化技术求解初值问题的类周期波形松弛法的收敛性分析(2019)
  4. Jaber J.Hasbestan,INAC Senocak:PittPack:一个开源的Poisson方程求解器,用于使用加速器进行极端规模计算(2019年)阿尔十四
  5. Ashwin Vishnu Mohanan、Cyrille Bonamy、Pierre Augier:FluidFt:Fast Fourier Transform HPC库的通用API(C++和Python)(2018)阿尔十四
  6. 普隆卡,格林德;波茨,丹尼尔;斯坦德尔,加布里埃尔;塔什,曼弗雷德:数值傅里叶分析(2018)
  7. 霍夫曼,迈克尔;雀巢,弗兰齐斯卡;2017年,Pipewald系统和基于Pipewald的静电充电系统
  8. 陆剑锋;杨海钊:平面波离散化的预处理轨道极小化方法(2017)
  9. 戈拉米,阿米尔;马尔霍特拉,达尔亚;桑达,哈里;比罗斯,乔治:FFT,FMM,还是多重网格?单位立方体中均匀和非均匀网格的最新泊松解算器比较研究(2016)
  10. 荣格,杰文;小林,千古;伊村俊美;Sugita,Yuji:用于高效分子动力学模拟的3D FFT与体积分解方案的并行实现(2016)
  11. 莫滕森,米凯尔;Langtangen,Hans Petter:湍流直接数值模拟的高性能python(2016)
  12. Fuka,V.:PoisFFT——自由并行快速泊松解算器(2015)
  13. 雀巢,弗兰齐斯卡;皮皮格,迈克尔;Daniel Potts:基于混合周期NFFT的快速ewald求和(2015)
  14. 维恩斯,杰弗里K。;Stockie,John M.:使用伪可压缩流体解算器的高效并行浸入式边界算法(2015)
  15. 布朗,P.A。;巴德,C.J。;短笛,C。;Cullen,M.:快速三维r-自适应网格再分配(2014)
  16. Pippig,Michael:PFFT:FFTW到大规模并行架构的扩展(2013)
  17. 皮皮格,迈克尔;Daniel Potts:并行三维非均匀快速傅立叶变换及其在粒子模拟中的应用(2013)