yaSpMV公司 swMATH ID: 17482 软件作者: S.Yan、Ch.Li、Y.Zhang、H.Zhou 描述: yaSpMV:GPU上的另一个SpMV框架。SpMV是一种关键的线性代数算法,在许多重要的应用领域得到了广泛的应用。因此,已多次尝试优化GPU上的SpMV,以利用其巨大的计算吞吐量。尽管前面的工作已经取得了显著的进展,但负载不平衡和高内存带宽仍然是SpMV的关键性能瓶颈。在本文中,我们提出了这些问题的新解决方案。首先,我们设计了一种新的SpMV格式,称为块压缩公共坐标(BCCOO),它使用位标志将行索引存储在块公共坐标(COO)格式中,以缓解带宽问题。我们进一步改进了这种格式,将矩阵划分为垂直片,以提高访问要倍增的向量时的缓存命中率。其次,我们重新讨论了SpMV的分段扫描方法,以解决负载不平衡问题。我们提出了一种高效的基于矩阵的SpMV分段和/扫描算法,并通过消除全局同步对其进行了进一步改进。然后,我们根据输入稀疏矩阵和目标硬件平台的特点,引入了一个自动调整框架来选择优化参数。我们在GTX680 GPU和GTX480 GPU上的实验结果表明,与供应商调优的CUSPARSE V5.0(高达229)相比,我们提出的框架实现了显著的性能改进 主页: http://dl.acm.org/ticitation.cfm?id=2555255 相关软件: 稀疏矩阵;clSpMV公司;CUDA公司;海关;CUSP公司;CSR5型;ITPACK公司;SELL_C_西格玛;LightSpMV公司;MAGMA公司;tpSpMV公司;向量乘法;swSpTRSV软件;pOSKI公司;智能;彼得布里克斯;稀疏度;斯帕斯基;OSKI公司;MKL公司 引用于: 7文件 全部的 前5名25位作者引用 三 高佳全 三 何桂霞 2 齐、潘潘 1 大卫·弗朗西斯科·巴比里 1 瓦莱里亚·卡德利尼 1 陈月丹 1 亚历山德罗·范法里略 1 萨尔瓦多菲利波内 1 台伯·格拉泽 1 安斯加·Jüngel 1 李佳佳 1 李克勤 1 刘俊红 1 安德烈亚斯·莫哈默 1 弗洛里安·鲁道夫 1 卡尔·鲁普 1 齐格弗里德·塞尔伯赫尔 1 谭光明 1 唐、卓 1 菲利普·蒂莱特 1 王玉顺 1 约瑟夫·温布布 1 吴凡 1 吴克松 1 肖国庆 5篇连载文章中引用 2 ACM数学软件汇刊 2 工程中的数学问题 1 信息科学 1 国际计算机数学杂志 1 SIAM科学计算杂志 在4个字段中引用 7 数值分析(65-XX) 1 偏微分方程(35-XX) 1 计算机科学(68至XX) 1 光学、电磁理论(78-XX) 按年份列出的引文