×

算法980

swMATH ID: 22549
软件作者: 努里·叶拉兰参议员;蒂莫西·戴维斯;Wissam M.Sid-Lakhdar;桑杰·兰卡
描述: 算法980:GPU上的稀疏QR分解。稀疏矩阵分解涉及常规和非常规计算的混合,这在试图在图形处理单元(GPU)上可用的高度并行通用计算核心上获得高性能时是一个特殊的挑战。我们提出了一种稀疏的多前沿QR分解方法,该方法能够满足这一挑战,并且比多核CPU上的高度优化方法速度快得多。我们的方法将许多前沿矩阵并行分解,并将所有前沿矩阵之间传输的数据保存在GPU上。一种新的桶调度器算法通过利用更大的并行性和稀疏多前沿方法的前沿矩阵中的阶梯形式,扩展了密集矩阵的避免通信QR分解。
主页: https://dl.acm.org/citation.cfm?id=3065870
关键词: 性能;QR分解;最小二乘问题;稀疏矩阵;通用分组;TOMS_发布
相关软件: COLAMD公司;SuiteSparseQR套件;拉帕克;CUDA公司;ANSYS有限元分析软件;稀疏矩阵;低密度脂蛋白;巧克力;CIMGS公司;HSL_MI28型;LSMR公司;CUTEst公司;MIQR公司;SGEMM公司;石板;MAGMA公司;算法656;血浆;算法679;CUBLAS公司
引用于: 3文件

标准条款

1出版物描述软件 年份
算法980:GPU上的稀疏QR分解链接
努里·叶拉兰参议员;蒂莫西·戴维斯;Wissam M.Sid-Lakhdar;桑杰·兰卡
2017

在1个字段中引用

数值分析(65-XX)

按年份列出的引文