×

SpGEMM公司

swMATH ID: 14033
软件作者: 费利克斯·格雷姆斯;Höfter,安德烈亚斯;Lars Ole Schwen;费边·基斯林;乌韦·诺曼
描述: GPU通过迭代行合并加速稀疏矩阵乘法。我们提出了一种通用稀疏矩阵乘法(SpGEMM)算法,该算法适用于多核体系结构,如GPU。SpGEMM是通过迭代行合并实现的,与合并排序类似,只是具有重复列索引的元素是动态聚合的。主内核使用线程的子线程一次合并少量稀疏行,以实现早期压缩效果,从而减少全局内存访问的开销。将性能与并行CPU实现以及三种基于GPU的实现进行了比较。为计算21个稀疏矩阵的矩阵平方进行的测量表明,该方法始终优于其他方法。分析表明,性能是通过利用压缩效果和GPU缓存结构实现的。对于代数多重网格求解器所需的Galerkin积的计算,也发现了改进的性能。对于在漫反射光学成像环境中出现的七点模板矩阵,性能特别好,改进后的性能允许使用相同的计算资源以更高的分辨率执行图像重建。
主页: http://epubs.siam.org/doi/ref/10.1137/10948811
关键词: 稀疏矩阵-矩阵乘法GPU编程代数多重网格荧光介导断层扫描
相关软件: 稀疏矩阵CUSP公司CUDA公司海关推力维也纳CLSUMMA(总结)特里利诺斯Imalytics临床前R合并2SMMP公司C解析SpAMM公司符号控制犰狳yaSpMV公司英特尔TBB等离子体MAGMA公司clSpMV公司
引用于: 5文件

按年份列出的引文