SpGEMM公司 swMATH ID: 14033 软件作者: 费利克斯·格雷姆斯;Höfter,安德烈亚斯;Lars Ole Schwen;费边·基斯林;乌韦·诺曼 描述: GPU通过迭代行合并加速稀疏矩阵乘法。我们提出了一种通用稀疏矩阵乘法(SpGEMM)算法,该算法适用于多核体系结构,如GPU。SpGEMM是通过迭代行合并实现的,与合并排序类似,只是具有重复列索引的元素是动态聚合的。主内核使用线程的子线程一次合并少量稀疏行,以实现早期压缩效果,从而减少全局内存访问的开销。将性能与并行CPU实现以及三种基于GPU的实现进行了比较。为计算21个稀疏矩阵的矩阵平方进行的测量表明,该方法始终优于其他方法。分析表明,性能是通过利用压缩效果和GPU缓存结构实现的。对于代数多重网格求解器所需的Galerkin积的计算,也发现了改进的性能。对于在漫反射光学成像环境中出现的七点模板矩阵,性能特别好,改进后的性能允许使用相同的计算资源以更高的分辨率执行图像重建。 主页: http://epubs.siam.org/doi/ref/10.1137/10948811 关键词: 稀疏矩阵-矩阵乘法;GPU编程;代数多重网格;荧光介导断层扫描 相关软件: 稀疏矩阵;CUSP公司;CUDA公司;海关;推力;维也纳CL;SUMMA(总结);特里利诺斯;Imalytics临床前;R合并2;SMMP公司;C解析;SpAMM公司;符号控制;犰狳;yaSpMV公司;英特尔TBB;等离子体;MAGMA公司;clSpMV公司 引用于: 5文件 标准条款 1出版物描述软件,包括1出版物以zbMATH为单位 年份 GPU通过迭代行合并加速稀疏矩阵乘法。 Zbl 1327.65090号费利克斯·格雷姆斯;安德烈亚斯·霍夫特;Lars Ole施文;费边·基斯林;乌韦·诺曼 2015 全部的 前5名24位作者引用 2 格雷·巴拉德(Grey M.Ballard)。 2 费利克斯·格雷姆斯 2 乌韦·诺曼 1 阿里夫·阿扎德 1 艾登·布鲁索 1 詹姆斯·韦尔登·德梅尔 1 台伯·格拉泽 1 劳拉·格里戈里 1 安德烈亚斯·霍夫特 1 胡乔纳森·约瑟夫 1 安斯加·Jüngel 1 费边·基斯林 1 科尔斯汀·库珀 1 安德烈亚斯·莫哈默 1 弗洛里安·鲁道夫 1 卡尔·鲁普 1 奥德·施瓦茨 1 Lars Ole施文 1 齐格弗里德·塞尔伯赫尔 1 克里斯托弗·西弗特(Christopher M.Siefert)。 1 菲利普·蒂莱特 1 西万·托莱多 1 约瑟夫·温布布 1 塞缪尔·威廉姆斯。 连载1篇 5 SIAM科学计算杂志 在3个字段中引用 5 数值分析(65-XX) 1 组合数学(05-XX) 1 计算机科学(68至XX) 按年份列出的引文