算法980 swMATH ID: 22549 软件作者: 努里·叶拉兰参议员;蒂莫西·戴维斯;Wissam M.Sid-Lakhdar;桑杰·兰卡 描述: 算法980:GPU上的稀疏QR分解。稀疏矩阵分解涉及常规和非常规计算的混合,这在试图在图形处理单元(GPU)上可用的高度并行通用计算核心上获得高性能时是一个特殊的挑战。我们提出了一种稀疏的多前沿QR分解方法,该方法能够满足这一挑战,并且比多核CPU上的高度优化方法速度快得多。我们的方法将许多前沿矩阵并行分解,并将所有前沿矩阵之间传输的数据保存在GPU上。一种新的桶调度器算法通过利用更大的并行性和稀疏多前沿方法的前沿矩阵中的阶梯形式,扩展了密集矩阵的避免通信QR分解。 主页: https://dl.acm.org/citation.cfm?id=3065870 关键词: 性能;QR分解;最小二乘问题;稀疏矩阵;通用分组;TOMS_发布 相关软件: COLAMD公司;SuiteSparseQR套件;拉帕克;CUDA公司;ANSYS有限元分析软件;稀疏矩阵;低密度脂蛋白;巧克力;CIMGS公司;HSL_MI28型;LSMR公司;CUTEst公司;MIQR公司;SGEMM公司;石板;MAGMA公司;算法656;血浆;算法679;CUBLAS公司 引用于: 3文件 标准条款 1出版物描述软件 年份 算法980:GPU上的稀疏QR分解链接努里·叶拉兰参议员;蒂莫西·戴维斯;Wissam M.Sid-Lakhdar;桑杰·兰卡 2017 全部的 前5名17位作者引用 1 艾哈迈德·阿卜杜勒法塔赫 1 蒂莫西·科斯塔。 1 蒂莫西·奥尔登·戴维斯 1 杰克·多加拉(Jack J.Dongarra)。 1 马克·盖茨 1 阿扎姆·海达尔 1 斯文·哈姆马林。 1 尼古拉斯·海姆。 1 雅库布·库扎克 1 彼得·卢斯科 1 桑杰·兰卡 1 詹妮弗·斯科特 1 Sid-Lakhdar,Wissam M。 1 斯坦尼米尔·托莫夫。 1 Tůma,米罗斯拉夫 1 努里参议员耶兰 1 马乌西佐农 连载1篇 三 ACM数学软件汇刊 在1个字段中引用 三 数值分析(65-XX) 按年份列出的引文