螺旋形的

螺旋系统(www.spiral.net网站)是一种自动推导、实现和优化数字信号处理(DSP)算法的工具,特别是快速变换算法,如快速傅立叶变换。SPIRAL能够在各种平台上生成优化的实现,包括SSE、multicore、Cell、GPU、分布式内存并行处理器和FPGA,并在这些平台上产生了一些最快的算法实现(SPIRAL被Intel用于实现其MKL和IPP库)。SPIRAL使用一种特定于领域的语言,基于DSP算法的代数公式,重写规则以生成大量实现,并使用智能搜索来寻找快速实现。本文概述了使用SPIRAL系统自动生成DSP算法,简要讨论了代数技术在生成DSP算法中的应用,最后讨论了SPIRAL的扩展,可以用于更一般的算法。


zbMATH中的参考文献(参考文献46条,1标准件)

显示结果1到20,共46个。
按年份排序(引用)
  1. 加迪奥利,戴维德;维塔利,伊曼纽尔;巴勒莫,吉安卢卡;Silvano,Cristina:mARGOt:用于自我感知近似计算的动态自动调整框架(2019)
  2. 安德烈亚托,B。;Cariow,A.:矩阵向量乘法快速算法的自动生成(2018)
  3. 你好,米克尔ós;米切尔,劳伦斯;卢波里尼,法比奥;大卫A.哈姆:TSFC:一种结构保持形式编译器(2018)
  4. 谭光明;刘俊红;李佳佳:多核多核架构自适应SpMV库的设计与实现(2018)
  5. 尼尔森,托马斯;贝尔特,杰弗里;谢克,杰里米·G。;杰西普,伊丽莎白;Norris,Boyana:高性能矩阵代数的可靠生成(2015)
  6. 范泽,G场。;van de Geijn,Robert A.:BLIS:快速实例化BLAS功能的框架(2015)
  7. 法比奥·卢波里尼,安娜·卢西亚·瓦尔班内斯库,弗洛里安·拉特格伯,格奥尔赫·特奥多尔·贝尔恰,J。拉马努贾姆,大卫A。Ham,Paul H.J.Kelly:COFFEE:有限元局部装配的优化编译器(2014)阿尔十四
  8. 孟,灵川;Johnson,Jeremy:TFT的高性能实施(2014)
  9. 孟,灵川;Johnson,Jeremy:通用模块FFT算法的自动并行库生成(2013)
  10. 简,叶海亚;Jóźwiak,Lech:大规模并行硬件多处理器的可扩展通信体系结构(2012)ioport公司
  11. 卡尔托芬,埃里希L.:符号计算的“七个小矮人”(2012)
  12. 沃森,约翰·R。;Stitt,Greg:弹性计算:混合计算机的便携优化框架(2012)ioport公司
  13. 卡莱特,雅克;Kiselyov,Oleg:用函子和单子的多阶段编程:消除泛型代码的抽象开销(2011)
  14. D'Alberto,保罗;博德拉托,马可;Nicolau,Alexandru:对称多处理器系统中矩阵计算核的并行性开发:通过软件管道和线程分配优化矩阵乘法和矩阵加法算法(2011)
  15. 法布盖特·特拉弗,迭戈;Bientinesi,Paolo:基于知识的分区矩阵表达式自动生成(2011)
  16. 吉诺维塞,路易吉;布里索,维多;奥斯皮西,马修;德意志,蒂埃里;戈德克、斯特凡;é上,让·弗兰çois:Daubechies小波用于高性能电子结构计算:BigDFT项目(2011)
  17. 卡林尼克,纳塔莉亚;科尔奇,马提亚斯;Rauber,Thomas:Runge-Kutta型预估-校正方法的有效时间步长自适应算法(2011)
  18. Sheeran,Mary:并行前缀网络设计中的函数和动态规划(2011)
  19. 很长,凯文;柯比,罗伯特;Van Bloemen Waanders,Bart:基于软件的统一嵌入式并行有限元计算é切特差异化(2010)
  20. 曼利,雷蒙德;格雷格,大卫:英特尔AES-NI指令的程序生成器(2010)

更多出版物请访问:http://www.spiral.net/publications/publ-topic.html