文件Zbl 07486619-zbMATH Open

SIMD并行稀疏矩阵向量和转置矩阵向量乘法的DD精度。（英文） Zbl 07486619号

Dutra，Inás（编辑）等人，《计算科学的高性能计算——VECPAR 2016》。第十二届国际会议，2016年6月28日至30日，葡萄牙波尔图。修订了选定的论文。查姆：施普林格。莱克特。注释计算。科学。10150, 21-34 (2017).

摘要：我们使用SIMD AVX2加速了双精度稀疏矩阵和DD向量乘法（DD-SpMV）及其转置和DD矢量乘法（DD-TSpMV）。AVX2需要更改内存访问模式，以允许同时读取四个连续的64位元素。在我们之前的研究中，使用AVX2的CRS中的DD-SpMV需要非连续的内存加载、余数的处理以及AVX2寄存器中四个元素的总和。这些因素会降低DD-SpMV的性能。本文比较了AVX2的DD-SpMV和DD-TSpMV的存储格式，以消除CRS中的性能下降因素。我们的结果表明，块大小与AVX2寄存器长度相匹配的BCRS4x1对DD-Sp中压和DD-TSpMV是有效的。
关于整个系列，请参见[Zbl 1369.68022号].

MSC公司：

65年xx月	数值算法的计算机方面
65传真	数值线性代数

关键词：

矩阵存储格式;向量乘法;转置SpMV;双精度运算;AVX2型

PDF格式 BibTeX公司 XML格式引用

全文：内政部

参考文献：

[1]	佛罗里达大学稀疏矩阵收藏。网址：http://www.cise.uhl ·兹比尔1365.65123
[2]	Knuth，D.E.：《计算机编程的艺术：半数值算法》，第2卷。Addison-Wesley，雷丁（1969）·Zbl 0191.18001号
[3]	Dekker，T.：一种扩展可用精度的浮点技术。数字数学18，224-242（1971）·Zbl 0226.65034号 ·doi:10.1007/BF01397083
[4]	Liu，X.，Smelyanskiy，M.，Chow，E.，Dubey，P.：基于x86的多核处理器上的高效稀疏矩阵向量乘法。摘自：第27届超级计算国际会议，第273-282页（2013）
[5]	Im，E.，Yelick，K.，Vuduc，R.：SPARSITY：稀疏矩阵核的优化框架。国际期刊高性能计算。申请。18(1), 135-158 (2004) ·doi:10.1177/109434204041296
[6]	Karakasis，V.，Goumas，G.，Koziris，N.：探索块状形状对稀疏内核性能的影响。2009年IEEE并行与分布式处理国际研讨会，第1-8页（2009年）
[7]	线性系统迭代解算器库。http://www.ssisc.org/lis网站/
[8]	Li，X.，等：扩展和混合精度BLAS的设计、实现和测试。ACS传输。数学。柔和。28(2), 152-205 (2002) ·Zbl 1070.65523号 ·数字对象标识代码：10.1145/567806.567808
[9]	Barrett，R.等人：《线性系统解的模板：迭代方法的构建块》，第57-65页。SIAM（1994）
[10]	Hishinuma，T.、Fujii，A.、Tanaka，T.和Hasegawa，H.：稀疏矩阵和向量之间DD算法的AVX加速。收录人：Wyrzykowski，R.、Dongarra，J.、Karczewski，K.、Wa she niewski，J.（编辑）PPAM 2013。LNCS，第8384卷，第622-631页。斯普林格，海德堡（2014）。doi:10.1007/978-3-642-55224-3_58·doi:10.1007/978-3-642-55224-3_58
[11]	英特尔。http://software.intel.com/en-us/articles/intel-intrinsics-guide
[12]	Bailey，D.H.：科学计算中的高精度浮点运算。计算。科学。工程7，54-61（2005）·doi:10.1109/MCSE.2005.52
[13]	Kouya，T.：多精度稀疏矩阵-向量乘法的高效实现及其在乘积型Krylov子空间方法中的应用。国际期刊数字。应用方法。7(2), 107-119 (2012) ·Zbl 1288.65039号
[14]	Hishinuma，T.、Fujii，A.、Tanaka，T.和Hasegawa，H.：BCRS格式的双精度稀疏矩阵和DD向量乘积的AVX2加速。IPSJ事务。高级计算。系统。7(4), 25-33 (2014). （日语）

此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配，可能包含数据转换错误。在某些情况下，zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献，而不要求完整或完全匹配。

任何	在任何地方
一个	内部文档标识符
澳大利亚	作者、编辑
人工智能	内部作者标识符
钛	标题
洛杉矶	语言
所以	来源
ab公司	回顾，摘要
第页	出版年份
车辆	评审员
复写的副本	MSC代码
美国犹他州	关键字
数据传输时间	文件类型(j个：期刊文章；b条：book；一：图书文章）

一&b条	逻辑和
一\|b条	逻辑或
!ab公司	逻辑不
作业成本法*	右通配符
"ab c公司"	短语
(ab c公司)	圆括号

示例

领域

操作员

SIMD并行稀疏矩阵向量和转置矩阵向量乘法的DD精度。（英文） Zbl 07486619号

MSC公司：

关键词：

参考文献：

示例

领域

操作员

SIMD并行稀疏矩阵向量和转置矩阵向量乘法的DD精度。 （英文） Zbl 07486619号

MSC公司：

关键词：

参考文献：

SIMD并行稀疏矩阵向量和转置矩阵向量乘法的DD精度。（英文） Zbl 07486619号