×

SIMD并行稀疏矩阵向量和转置矩阵向量乘法的DD精度。 (英文) Zbl 07486619号

Dutra,Inás(编辑)等人,《计算科学的高性能计算——VECPAR 2016》。第十二届国际会议,2016年6月28日至30日,葡萄牙波尔图。修订了选定的论文。查姆:施普林格。莱克特。注释计算。科学。10150, 21-34 (2017).
摘要:我们使用SIMD AVX2加速了双精度稀疏矩阵和DD向量乘法(DD-SpMV)及其转置和DD矢量乘法(DD-TSpMV)。AVX2需要更改内存访问模式,以允许同时读取四个连续的64位元素。在我们之前的研究中,使用AVX2的CRS中的DD-SpMV需要非连续的内存加载、余数的处理以及AVX2寄存器中四个元素的总和。这些因素会降低DD-SpMV的性能。本文比较了AVX2的DD-SpMV和DD-TSpMV的存储格式,以消除CRS中的性能下降因素。我们的结果表明,块大小与AVX2寄存器长度相匹配的BCRS4x1对DD-Sp中压和DD-TSpMV是有效的。
关于整个系列,请参见[Zbl 1369.68022号].

MSC公司:

65年xx月 数值算法的计算机方面
65传真 数值线性代数
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 佛罗里达大学稀疏矩阵收藏。网址:http://www.cise.uhl ·兹比尔1365.65123
[2] Knuth,D.E.:《计算机编程的艺术:半数值算法》,第2卷。Addison-Wesley,雷丁(1969)·Zbl 0191.18001号
[3] Dekker,T.:一种扩展可用精度的浮点技术。数字数学18,224-242(1971)·Zbl 0226.65034号 ·doi:10.1007/BF01397083
[4] Liu,X.,Smelyanskiy,M.,Chow,E.,Dubey,P.:基于x86的多核处理器上的高效稀疏矩阵向量乘法。摘自:第27届超级计算国际会议,第273-282页(2013)
[5] Im,E.,Yelick,K.,Vuduc,R.:SPARSITY:稀疏矩阵核的优化框架。国际期刊高性能计算。申请。18(1), 135-158 (2004) ·doi:10.1177/109434204041296
[6] Karakasis,V.,Goumas,G.,Koziris,N.:探索块状形状对稀疏内核性能的影响。2009年IEEE并行与分布式处理国际研讨会,第1-8页(2009年)
[7] 线性系统迭代解算器库。http://www.ssisc.org/lis网站/
[8] Li,X.,等:扩展和混合精度BLAS的设计、实现和测试。ACS传输。数学。柔和。28(2), 152-205 (2002) ·Zbl 1070.65523号 ·数字对象标识代码:10.1145/567806.567808
[9] Barrett,R.等人:《线性系统解的模板:迭代方法的构建块》,第57-65页。SIAM(1994)
[10] Hishinuma,T.、Fujii,A.、Tanaka,T.和Hasegawa,H.:稀疏矩阵和向量之间DD算法的AVX加速。收录人:Wyrzykowski,R.、Dongarra,J.、Karczewski,K.、Wa she niewski,J.(编辑)PPAM 2013。LNCS,第8384卷,第622-631页。斯普林格,海德堡(2014)。doi:10.1007/978-3-642-55224-3_58·doi:10.1007/978-3-642-55224-3_58
[11] 英特尔。http://software.intel.com/en-us/articles/intel-intrinsics-guide
[12] Bailey,D.H.:科学计算中的高精度浮点运算。计算。科学。工程7,54-61(2005)·doi:10.1109/MCSE.2005.52
[13] Kouya,T.:多精度稀疏矩阵-向量乘法的高效实现及其在乘积型Krylov子空间方法中的应用。国际期刊数字。应用方法。7(2), 107-119 (2012) ·Zbl 1288.65039号
[14] Hishinuma,T.、Fujii,A.、Tanaka,T.和Hasegawa,H.:BCRS格式的双精度稀疏矩阵和DD向量乘积的AVX2加速。IPSJ事务。高级计算。系统。7(4), 25-33 (2014). (日语)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。