×

高性能GPU平台上的稀疏近似逆预处理器。 (英语) Zbl 1359.65041号

摘要:使用基于偏微分方程的模型进行模拟通常需要求解大型稀疏代数线性系统的(序列)。在多维域中,预处理的Krylov迭代求解器通常适用于这些任务。因此,为Krylov子空间方法寻找有效的预条件是一个关键的主题。最近的发展,特别是在计算硬件方面,重新引起了人们对近似逆预处理器在分解形式中,因为它们在求解过程中的应用可以更高效。我们在这里介绍了一些关于由M.本齐等[SIAM J.Sci.Compute.17,No.5,1135–1149(1996;Zbl 0856.65019号)]以及A.C.N.van Duin公司[SIAM J.Matrix Anal.Appl.20,No.4,987–1006(1999;Zbl 0936.65028号)]. 传统和创新计算架构(如图形编程单元(GPU))都考虑了计算成本、重新排序和实现问题。

MSC公司:

65F08个 迭代方法的前置条件
65平方英尺 线性系统和矩阵反演的直接数值方法
65层50 稀疏矩阵的计算方法
65日元10 特定类别建筑的数值算法
15A09号 矩阵反演理论与广义逆
PDF格式BibTeX公司 XML格式引用
全文: 内政部 链接

参考文献:

[1] Benzi,M.,《大型线性系统的预处理技术:综述》,J.Compute。物理。,182, 418-477 (2002) ·Zbl 1015.65018号
[2] Barbieri,D。;卡德里尼,V。;Filippone,S.,《GPGPU上的广义GEMM应用:实验和应用》,(2009年国际并行计算大会议事录,2009年国际平行计算大会议事稿,2009年ParCo(2009),IOS出版社)
[3] 卡德里尼,V。;菲利波内,S。;Rouson,Damian,混合CPU/GPU平台上稀疏矩阵计算的设计模式,科学。程序。,22, 1-19 (2014)
[4] Choi,J.W。;辛格,A。;Vuduc,Richard W.,GPU上稀疏矩阵向量乘法的模型驱动自动调谐,SIGPLAN Not。,45, 115-126 (2010)
[5] Benzi,M。;Bertaccini,D.,移位线性系统的近似逆预处理,BIT,43231-244(2003)·Zbl 1037.65043号
[6] Bertaccini,D.,参数复杂对称线性系统序列的有效预处理,电子。事务处理。数字。分析。,18, 49-64 (2004) ·兹比尔1066.65048
[7] 贝尔塔奇尼,D。;Sgallari,F.,更新非线性去模糊和去噪图像恢复的预条件,应用。数字。数学。,60, 994-1006 (2010) ·Zbl 1195.94008号
[8] 南卡罗来纳州贝拉维亚。;贝尔塔奇尼,D。;Morini,B.,非线性系统Newton-Krylov方法中的非对称预条件更新,SIAM J.Sci。计算。,33, 2595-2619 (2011) ·Zbl 1232.65049号
[9] Dehnavi,M.M。;费尔南德斯,D.M。;Gaudiot,J.L。;Giannacopoulos,D.D.,图形处理单元上的并行稀疏近似逆预处理,IEEE Trans。并行分配系统。,24, 1852-1862 (2013)
[10] van Duin,A.C.N.,三角矩阵稀疏近似逆的可缩放并行预处理,SIAM J.矩阵分析。申请。,20, 987-1006 (1999) ·Zbl 0936.65028号
[11] Benzi,M。;Szyld,D.B。;van Duin,A.,非对称问题的不完全因式分解预处理的排序,SIAM J.Sci。计算。,20, 1652-1670 (1999) ·兹伯利0940.65033
[12] Benzi,M。;Tůma,M.,因子化稀疏近似逆预条件的排序,SIAM J.Sci。计算。,21, 1851-1868 (2000) ·Zbl 0959.65047号
[13] Saad,Y.,《稀疏线性系统的迭代方法》(2003),SIAM:SIAM Philadelphia,PA·Zbl 1002.65042号
[14] Aho,A.V。;约翰·霍普克罗夫特(John E.Hopcroft)。;杰弗里·乌尔曼(Jeffrey D.Ullman),《数据结构和算法》(1983),艾迪森·韦斯利·Zbl 0487.68005号
[15] Benzi,M。;Tůma,M.,非对称线性系统的稀疏近似逆预条件,SIAM J.Sci。计算。,19, 968-994 (1998) ·Zbl 0930.65027号
[16] Benzi,M。;库卢姆,J.K。;Tůma,M.,共轭梯度法的稳健近似逆预处理,SIAM J.Sci。计算。,221318-1332(2000年)·Zbl 0985.65035号
[17] Benzi,M。;梅耶,C.D。;Tůma,M.,共轭梯度法的稀疏近似逆预条件,SIAM J.Sci。计算。,17, 1135-1149 (1996) ·Zbl 0856.65019号
[18] Rafiei,A。;Toutounian,F.,非对称正定矩阵的ainv方法的新无分解变体,J.Compute。申请。数学。,219, 72-80 (2008) ·兹比尔1152.65047
[19] 达夫,I.S。;Meurant,G.A.,排序对预处理共轭梯度的影响,BIT,29635-657(1989)·Zbl 0687.65037号
[20] Bridson,R。;Tang,W.-P.,有序、各向异性和因子稀疏近似反演,SIAM J.Sci。计算。,867-882年(1999年)·Zbl 0955.65018号
[21] Demko,S。;莫斯,W.F。;Smith,P.W.,带矩阵逆矩阵的衰减率,数学。公司。,43, 491-499 (1984) ·Zbl 0568.15003号
[22] Filippone,S。;Colajanni,M.,PSBLAS:稀疏矩阵上的并行线性代数计算库,ACM Trans。数学。软件,26527-550(2000)·Zbl 1365.65128号
[23] Filippone,S。;Buttari,A.,Fortran 2003中稀疏矩阵计算的面向对象技术,ACM Trans。数学。软件,38(2012)·Zbl 1365.65127号
[24] 埃里希·加玛(Erich Gamma);理查德·赫尔姆(Richard Helm);拉尔夫·约翰逊(Ralph Johnson);John Vlissides,《设计模式:可重用面向对象软件的元素》(1995),Addison-Wesley·Zbl 0887.68013号
[25] Barbieri,D。;卡德里尼,V。;Filippone,S。;Rouson,Damian,《稀疏矩阵科学计算的设计模式》(HPSS 2011(2011),Springer)
[26] D'Ambra,P。;di Serafino,D。;Filippone,S.,MLD2P4:Fortran 95中的并行代数多级域分解预条件包,ACM Trans。数学。软件,37(2010)·Zbl 1364.65276号
[27] 贝尔塔奇尼,D。;Filippone,S.,异构并行计算机上krylov方法的近似逆预条件,(Bader,M.;Bode,A.;Bungartz,H.;Gerndt,M.);Joubert,G.;Peters,F.,《并行计算:加速计算科学与工程》(2014),IOS出版社,183-192
[28] 贝尔,N。;Garland,M.,《在面向吞吐量的处理器上实现稀疏矩阵向量乘法》,(《高性能计算网络、存储和分析国际会议论文集》,《高性能计算机网络、存储与分析国际会议文献集》,SC'09(2009),ACM)
[29] Farina,R。;科莫,S。;De Michele,P。;Chinnici,M.,《全球海洋模型中GPU架构的逆预处理技术》,(Mastorakis,N.E.;Bojkovic,Z.,《应用数学和信息学的最新研究》,《应用数理和信息学近期研究》,瑞士蒙特勒,12月29日至31日。应用数学和信息学的最新研究。《应用数学和信息学的最新研究》,瑞士蒙特勒,12月29日至31日,第16届世界峰会应用数学国际会议论文集(2012年),世界峰会出版社,15-20
[30] Geveler,M。;里布洛克,D。;戈德克,D。;Zajac,P。;Turek,S.,《面向GPU上基于FEM的完整仿真工具包:基于稀疏近似逆的强平滑器的非结构化网格有限元几何多重网格解算器》,计算。流体,80327-332(2013)·Zbl 1284.76249号
[31] 徐,S。;薛伟。;王凯。;Lin,H.-X.,使用CUDA和GPGPU生成稀疏矩阵的近似逆预处理器,J.算法计算。技术。,5, 475-500 (2011) ·Zbl 1229.65059号
[32] Naumov,M.,使用CUSPARSE和CUBLAS的不完全-LU和Cholesky预处理迭代方法,技术报告。(2011),英伟达公司
[33] van der Vorst,H.,Bi-CGSTAB:非对称线性系统解的Bi-CG的一个快速平滑收敛变体,SIAM J.Sci。统计计算。,13, 631-644 (1992) ·Zbl 0761.65023号
[34] 贝尔塔奇尼,D。;Golub,G.H。;Serra-Capizano,S.,对流扩散方程预处理迭代方法的谱分析,SIAM J.矩阵分析。申请。,29, 260-278 (2007) ·Zbl 1140.65024号
[35] D'Ambra,P。;Filippone,S.,GPU上高性能图像分割的并行广义松弛方法,J.Compute。申请。数学。(2015)
[36] Filippone,S。;D'Ambra,P。;Colajanni,M.,在linux集群上的流体动力学应用程序代码中使用稀疏线性代数的并行库,(Joubert,G.;Murli,a.;Peters,F.;Vanneschi,M..,《并行计算-进展与当前问题》(2002),帝国理工学院出版社,441-448
[37] 贝拉,G。;波扎,F。;De Maio,A。;Del Citto,F。;Filippone,S.,《KIVA-3V与1D CFD代码耦合的增强并行版本及其在通用发动机应用中的应用》,(Gerndt,M.;Kranzlmuller,D.,《HPCC 2006年会议录》。HPCC 2006年会议记录,LNCS,第4208卷(2006),Springer Verlag),11-20
[38] Davis,T.A。;Hu,Y.,佛罗里达大学稀疏矩阵收集,ACM Trans。数学。软件,38,1:1-1:25(2011)·Zbl 1365.65123号
[39] Benzi,M。;Tůma,M.,稀疏近似逆预条件的比较研究,应用。数字。数学。,30, 305-340 (1999) ·Zbl 0949.65043号
[40] 中华人民共和国埃姆斯泰。;Davis,T.A。;达夫,I.S.,算法837:AMD,一种近似最小度排序算法,ACM-Trans。数学。软件,30,381-388(2004)·Zbl 1070.65534号
[41] 阿梅斯托,P。;Davis,T.A。;达夫,I.S.,《近似最小度排序算法》,SIAM J.矩阵分析。申请。,1896-905年(1996年)·Zbl 0861.65021号
[42] 吉布斯,N.E。;普尔,W.G。;Stockmeyer,P.K.,《几种带宽和剖面缩减算法的比较》,ACM Trans。数学。软件,2322-330(1976)·Zbl 0345.65014号
[43] 吉布斯,N.E。;普尔,W.G。;Stockmeyer,P.K.,《减少稀疏矩阵带宽和轮廓的算法》,SIAM J.Numer。分析。,18, 235-251 (1976)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。