clSpMV

clSpMV:一个基于gpu的跨平台openclspmv框架。稀疏矩阵向量乘法(SpMV)核是线性代数中的一个关键运算。大多数迭代方法是由带有BLAS1更新的SpMV操作组成的。因此,研究者对稀疏线性代数中SpMV核的优化进行了大量的工作。随着OpenCL的出现,一种标准化了各种异构平台上并行编程的编程语言OpenCL,我们能够在许多不同的平台上优化SpMV内核。在本文中,我们提出了一种新的稀疏矩阵格式,鸡尾酒格式,以利用许多不同稀疏矩阵格式的优点。基于cocktack格式,我们开发了一个能够在运行时分析各种稀疏矩阵的clSpMV框架,并推荐给定稀疏矩阵在不同平台上的最佳表示。尽管在不同平台上可移植的解决方案通常比专门针对特定平台的解决方案提供更低的性能,但我们的实验结果表明,clSpMV可以在Nvidia和AMD平台上找到输入稀疏矩阵的最佳表示,与[3]中提出的混合稀疏格式的供应商优化CUDA实现相比,性能提高83%,与[3]中所有稀疏格式的CUDA实现相比,性能提高63.6%。

这个软件也是同行评审按日记帐汤姆斯.


zbMATH中的参考文献(参考文献10条)

显示第1到第10个结果,共10个。
按年份排序(引用)

  1. 陈月丹;肖国庆;吴凡;唐卓;李克勤:tpSpMV:一种适用于多核体系结构的两阶段大规模稀疏矩阵向量乘法核(2020)
  2. 谭光明;刘俊红;李佳佳:多核多核架构自适应SpMV库的设计与实现(2018)
  3. 菲利普斯,萨尔瓦托;卡德利尼,缬草;巴比里,戴维德;Fanfarillo,Alessandro:GPGPU上的稀疏矩阵向量乘法(2017)
  4. 高佳泉;吴克松;王玉顺;气、盘;何桂霞:二维麦克斯韦方程组的GPU加速预处理GMRES方法(2017)
  5. 高佳泉;气、盘;何桂霞:GPU上基于CSR的高效稀疏矩阵向量乘法(2016)
  6. 鲁普,卡尔;蒂莱,菲利普;鲁道夫,弗洛里安人;温布,约瑟夫;莫哈默,安德烈亚斯;格拉瑟,提博;安格尔,安格尔;Selberherr,Siegfried:多核和多核体系结构的ViennaCL线性代数库(2016)
  7. 马扎尔,哈默德;海恩,托比;内格罗特,丹;Tasora,Alessandro:使用Nesterov方法加速具有摩擦和接触的多体动力学(2015)
  8. 缪事,斯特芬;里博洛克,德克;Göddeke,Dominik:将多线程和加速器集成到DUNE-ISTL中(2015)
  9. 科鲁策,莫里茨;哈格,乔治;韦林,格哈德;费斯克,霍尔格;Bishop,Alan R.:在具有宽SIMD单元的现代处理器上实现高效通用稀疏矩阵向量乘法的统一稀疏矩阵数据格式(2014)
  10. 罗西,R。;莫萨比,F。;Idelsohn,S.R.:图形硬件上基于OpenCL的可移植非结构边缘有限元Navier-Stokes解算器(2013)