螺旋形的

SPIRAL系统(www.SPIRAL.net)是一个自动推导、实现和优化数字信号处理(DSP)算法的工具,特别是快速变换算法,如快速傅立叶变换。SPIRAL能够在各种平台上生成优化的实现,包括SSE、multicore、Cell、GPU、分布式内存并行处理器和FPGA,并在这些平台上产生了一些最快的算法实现(SPIRAL被Intel用于实现其MKL和IPP库)。SPIRAL使用一种特定于领域的语言,基于DSP算法的代数公式,重写规则以生成大量实现,并使用智能搜索来寻找快速实现。讨论了螺旋线生成算法的一般方法,并在此基础上简要讨论了螺旋线生成算法在DSP系统中的应用。


zbMATH参考文献(46篇文章引用,1标准件)

显示结果1到20,共46个。
按年份排序(引用)
  1. Gadioli,Davide;Vitali,Emanuele;Palermo,Gianluca;Silvano,Cristina:mARGOt:用于自我感知近似计算的动态自动调整框架(2019)
  2. Andreatto,B.;Cariow,A.:矩阵向量乘法快速算法的自动生成(2018)
  3. 米克洛斯·霍莫利亚;劳伦斯·米切尔;法比奥·卢波里尼;大卫·A·哈姆:一种结构保持形式编译器(2018)
  4. 谭光明;刘俊红;李佳佳:多核多核体系结构自适应SpMV库的设计与实现(2018)
  5. Nelson,Thomas;Belter,Geoffrey;Siek,Jeremy G;Jessup,Elizabeth;Norris,Boyana:高性能矩阵代数的可靠生成(2015)
  6. Van Zee,Field G.;Van de Geijn,Robert A.:BLIS:快速实例化BLAS功能的框架(2015)
  7. Fabio Luporini、Ana Lucia Varbanescu、Florian Rathgeber、Ghorghe Teodor Bercea、J.Ramanujam、David A.Ham、Paul H.J.Kelly:COFFEE:有限元局部装配的优化编译器(2014)阿尔十四
  8. 孟玲川;约翰逊,杰里米:TFT的高性能实施(2014)
  9. 孟玲川;约翰逊,杰里米:通用模块化FFT算法的自动并行库生成(2013)
  10. Jan,Yahya;Jóźwiak,Lech:大规模并行硬件多处理器的可扩展通信体系结构(2012)ioport公司
  11. 卡尔托芬,埃里希L.:符号计算的“七个小矮人”(2012)
  12. Wernsing,John R.;Stitt,Greg:弹性计算:混合计算机的便携优化框架(2012)ioport公司
  13. Carette,Jacques;Kiselyov,Oleg:《用函子和单子的多阶段编程:消除泛型代码的抽象开销》(2011)
  14. D'Alberto,Paolo;Bodrato,Marco;Nicolau,Alexandru:利用对称多处理器系统的矩阵计算内核中的并行性:通过软件管道和线程分配优化矩阵乘法和矩阵加法算法(2011)
  15. Fabregat Traver,Diego;Bientinesi,Paolo:基于知识的分区矩阵表达式自动生成(2011)
  16. Genovese,Luigi;Videau,Brice;Ospici,Matthieu;Deutsch,Thierry;Goedecker,Stefan;Méhaut,Jean François:用于高性能电子结构计算的Daubechies小波:BigDFT项目(2011年)
  17. Kalinnik,Natalia;Korch,Matthias;Rauber,Thomas:Runge-Kutta型预测-校正方法的有效时间步长自适应算法(2011)
  18. Sheeran,Mary:并行前缀网络设计中的函数和动态规划(2011)
  19. Long,Kevin;Kirby,Robert;Van Bloemen Waanders,Bart:基于软件的Fréchet微分的统一嵌入式并行有限元计算(2010)
  20. 曼利,雷蒙德;格雷格,大卫:英特尔AES-NI指令的程序生成器(2010)

更多出版物请访问:http://www.spiral.net/publications/publ-topic.html