×

使用Kaczmarz和其他线性系统迭代算法进行GPU计算。 (英语) Zbl 1204.68260号

概述:图形处理单元(GPU)用于求解由偏微分方程导出的大型线性系统。所研究的微分方程以强对流为主导,具有不同的尺寸,在许多领域都很常见,包括计算流体力学、传热学和结构力学。本文比较了几种著名迭代方法的GPU和CPU实现,包括Kaczmarz、Cimmino、分量平均、共轭梯度法向残差(CGNR)、对称连续超松弛-条件共轭梯度、,和共轭梯度加速成分平均行投影(CARP-CG)。计算是用稠密和一般带状系统进行的。结果表明,我们的GPU实现优于这些算法的CPU实现,也优于之前研究的Linux集群和共享内存系统上的并行实现。虽然CGNR方法在解决此类问题方面已经开始失宠,但对于本文研究的问题,在GPU上实现的CGNR方法比其他方法表现更好,包括CARP-CG方法的集群实现。

MSC公司:

68瓦10 计算机科学中的并行算法
2005年5月 并行数值计算
65层99 数值线性代数
68米99 计算机系统组织
PDF格式BibTeX公司 XML格式引用
全文: DOI程序 链接

参考文献:

[1] Saad,Y.:稀疏线性系统的迭代方法,(2000)·Zbl 0955.65020号
[2] Göddeke,D。;斯特佐德卡,R。;Turek,S.:面向硬件的本地、仿真和混合精度求解器在有限元模拟中的性能和准确性,并行、紧急和分布式系统国际期刊22,第4期,221-256(2007)·Zbl 1188.68084号 ·网址:10.1080/17445760601122076
[3] Bolz,J。;农民,I。;格林斯彭,E。;Schröder,P.:GPU上的稀疏矩阵求解器:共轭梯度和多重网格,图形上的ACM事务22,917-924(2003)
[4] Krüger,J。;Westermann,R.:用于GPU实现数字算法的线性代数运算符,图形上的ACM事务22,908-916(2003)
[5] N.Galopo,N.K.Govindaraju,M.Henson,D.Manocha,LU-GPU:在图形硬件上求解稠密线性系统的有效算法,载于:超级计算会议记录,2005年,第3页。
[6] 布拉姆利,R。;Sameh,A.:平行行投影算法的区域分解,应用数值数学8,第4-5期,303-315页(1991)·Zbl 0738.65022号 ·doi:10.1016/0168-9274(91)90071-7
[7] 布拉姆利,R。;Sameh,A.:大型非对称线性系统的行投影方法,SIAM科学与统计计算杂志13,第1期,168-193(1992)·兹比尔0752.65024 ·doi:10.1137/0913010
[8] Arioli,M。;达夫,I。;Noailles,J。;Ruiz,D.:稀疏矩阵的块投影方法,SIAM科学与统计计算杂志13,第1期,47-70(1992)·Zbl 0761.65015号 ·doi:10.1137/0913003
[9] 戈登,D。;Gordon,R.:《分量平均行投影:稀疏线性系统的稳健块并行方案》,SIAM科学计算杂志27,第3期,1092-1117(2005)·Zbl 1093.65033号 ·数字对象标识代码:10.1137/040609458
[10] D.Gordon、R.Gordon,CARP-CG:一个稳健高效的线性系统并行求解器,应用于强对流主导的椭圆偏微分方程,以色列海法大学计算机科学系技术代表,提交出版,2008年4月·Zbl 1195.65062号
[11] 戈登,D。;Gordon,R.:CGMN重访:从椭圆偏微分方程导出的刚性线性系统的稳健和有效解,ACM数学软件事务35,No.3,18.1-18.27(2009)
[12] http://www.nvidia.com/object/cuda_home.html。
[13] Lindholm,E。;Nickolls,J。;Oberman,S。;Montrym,J.:《NVIDIA tesla:统一图形和计算架构》,IEEE micro 28,39-55(2008)
[14] C.Lin,D.Manocha(编辑),《边缘计算特刊:使用新商品架构》,IEEE Proceedings 96(5)(2008)753-899。
[15] A.Gottlieb,K.Hwang,S.Sahni(编辑),《使用图形处理单元的通用处理》专刊,《并行与分布式计算杂志》68(10)(2008)1305-1402。
[16] Kaczmarz,S.:Angenäherte auflösung von systemen linearer gleichungen,《波兰科学通报》35,355-357(1937)·Zbl 0017.31703号
[17] 斯特罗默,T。;Vershynin,R.:指数收敛线性系统的随机求解器,499-507(2006)·Zbl 1155.65323号 ·doi:10.1007/11830924_45
[18] Cimmino,G.:Calcolo approssimato per le soluzioni dei sistemi di equazioni lineari,La ricerca scientifica 16,No.9,326-333(1938)
[19] Combettes,P.L.:不一致信号可行性问题:产品空间中的最小二乘解,IEEE信号处理事务42,2955-2966(1994)
[20] 审查员,Y。;戈登,D。;Gordon,R.:《分量平均:大型稀疏非结构化问题的高效迭代并行算法》,《并行计算》27,第6期,777-808(2001)·Zbl 0972.68189号 ·doi:10.1016/S0167-8191(00)00100-9
[21] Hestenes,M.R。;Stiefel,E.:求解线性系统的共轭梯度方法,国家标准局研究杂志49,409-435(1952)·Zbl 0048.09901号
[22] &焦虑;比约克。;Elfving,T.:计算线性方程组伪逆解的加速投影方法,BIT数值数学19,145-163(1979)·Zbl 0409.65022号
[23] D.Göddeke,R.Strzodka,面向硬件的本地、模拟和混合精度求解器在有限元模拟中的性能和准确性(第2部分:双精度GPU),多特蒙德技术大学技术代表,2008年·Zbl 1188.68084号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。