×

通用规模模块化FFT算法的自动并行库生成。 (英语) Zbl 1412.68307号

Gerdt,Vladimir P.(编辑)等人,科学计算中的计算机代数。2013年9月9日至13日在德国柏林举行的2013年中国社会科学院第15届国际研讨会。诉讼程序。柏林:斯普林格。莱克特。票据计算。科学。8136, 243-256 (2013).
摘要:本文介绍了任意输入尺寸的模块化FFT算法库的自动生成。我们展示了如何在高抽象级别上表示变换及其算法。然后,可以系统地应用使用重写系统的符号操作和代码优化来生成具有递归函数闭包的库。生成的库针对目标计算平台进行了自动优化,旨在支持Maple使用的modpn库中多元多项式计算的模块化算法。由此产生的标量和矢量代码提供了与中给出的固定大小代码相当的加速比[第一作者等,“螺旋生成的模块FFT算法”,载于:第四届并行符号计算国际研讨会论文集,PASCO 2010。纽约州纽约市:计算机协会(ACM)。169–170 (2010;doi:10.145/1837210.1837235)],比手动调整的modpn库快一个数量级。生成的库还利用了线程级并行性,并提供了额外的加速。
有关整个系列,请参见[Zbl 1291.68021号].

MSC公司:

68瓦30 符号计算和代数计算
65T50型 离散和快速傅里叶变换的数值方法
68宽10 计算机科学中的并行算法
PDF格式BibTeX公司 XML格式引用
全文: 内政部