×

SELL_密码

swMATH ID: 11232
软件作者: 莫里茨·克鲁泽(Moritz Kreutzer);乔治·海格(Georg Hager);格哈德·韦莱因;霍尔格·费斯克;阿兰·R·毕晓普。
描述: 一种统一的稀疏矩阵数据格式,用于在具有宽SIMD单元的现代处理器上进行高效的通用稀疏矩阵-向量乘法。稀疏矩阵向量乘法(spMVM)是许多数值算法中最耗时的内核,在所有现代处理器和加速器体系结构中都得到了广泛的研究。然而,最佳稀疏矩阵数据存储格式是高度特定于硬件的,这在使用异构系统时可能会成为一个障碍。此外,如果矩阵的稀疏模式中没有结构,那么目前尚不清楚如何最有效地使用当前多核和多核处理器中的宽单指令多数据(SIMD)单元。我们建议使用SELL-C-σ,它是Sliced ELLPACK的一种变体,作为一种SIMD友好的数据格式,它结合了通用图形处理单元和矢量计算机编程的长期思想。我们讨论了SELL-C-σ与现有格式(如压缩行存储和ELLPACK)相比的优势,并展示了它在各种硬件平台(Intel Sandy Bridge、Intel Xeon Phi和Nvidia Tesla K20)上对不同应用领域的各种测试矩阵的适用性。使用适当的性能模型,我们深入了解了SELL-C-σspMVM内核的数据传输属性。SELL-C-σ带有两个调谐参数,研究了这两个参数在测试矩阵范围内的性能影响,并提出了合理的选择。这导致了硬件相关(“catch-all”)稀疏矩阵格式,它在所有硬件平台上为所有测试矩阵实现了非常高的效率。
主页: http://blogs.fau.de/essex/files/2012/11/SELL-C-sigma.pdf
关键词: 稀疏矩阵;稀疏矩阵向量乘法;数据格式;性能模型;数值示例;算法;单指令多数据
相关软件: 稀疏矩阵;CUDA公司;解析(CUSPARSE);yaSpMV公司;CUSP公司;clSpMV公司;CSR5型;项目参考;宴会;开放运算语言;FEniCS公司;LibGeoDecomp库;AGMG公司;修订版X;工艺;ELSI公司;ELPA公司;STRUMPACK系列;CholQR公司;CIRR公司
引用于: 12文件
全部的 前5名

65位作者引用

霍尔格·费斯克
乔治·海格
莫里茨·克鲁泽
格哈德·韦林
2 安德烈亚斯·阿尔弗曼
2 阿希姆·巴瑟曼
2 高佳全
2 何桂霞
2 梅尔文·Röhrig-Zöllner
2 提斯,乔纳斯
1 马西莫·贝纳斯基
1 主教Alan Reginald
1 毛罗·比森
1 Boukhris,西哈姆
1 汉斯·约阿希姆·本加茨
1 克里斯蒂安·卡波尼奥
1 Dziekonski,A。
1 多米尼克·恩斯特
1 卡洛·范托齐
1 福村,Yasunori
1 马丁·加尔贡
1 台伯·格拉泽
1 莎拉·休伯(Sarah E.Huber)。
1 托马斯·基利安·哈克尔
1 伊达,秋叶茂
1 阿基拉·Imakura
1 卡洛·贾纳
1 安斯加·Jüngel
1 Masatoshi卡瓦伊
1 西蒙·科彻
1 鲍里斯·克拉斯诺波尔斯基。
1 库斯,帕维尔
1 布鲁诺·朗
1 赫尔曼·莱德勒
1 瓦莱里·马宁
1 安德烈亚斯·马雷克
1 彼得·米罗诺维奇
1 马库斯·莫尔
1 安德烈亚斯·莫哈默
1 Mrozowski,M。
1 中岛贤吾
1 阿特姆·纳波夫
1 利迪亚·奈梅克
1 伊凡公证人
1 安德烈亚斯·皮埃尔
1 Nileshchandra K.皮克尔。
1 齐、潘潘
1 路透社,卡斯滕
1 迈克尔·里普
1 乌尔里奇·吕德
1 弗洛里安·鲁道夫
1 卡尔·鲁普
1 日本樱井
1 沙伊莱什·萨特(Shailesh R.Sathe)。
1 马蒂亚斯·谢夫勒
1 克里斯托弗·舍勒
1 齐格弗里德·塞尔伯赫
1 费萨尔·沙赫扎德
1 Simoes Brambila,达尼洛
1 菲利普·蒂莱特
1 阿文德·维亚弗哈雷(Arvind Y.Vyavhare)。
1 约瑟夫·温布布
1 魏斯米勒,J。
1 马库斯·威特曼
1 芭芭拉·沃尔穆特。

按年份列出的引文