×

基于峰值的分布式内存并行高斯-赛德尔的分区和重新排序。 (英语) Zbl 1518.65044号

摘要:高斯赛德尔(GS)是一种广泛用于求解稀疏线性方程组的迭代方法,在代数多重网格方法中也被认为是一种有效的平滑器。GS的并行化是一项具有挑战性的任务,因为求解GS中的稀疏下三角系统在每次迭代中都会构成一个连续的瓶颈。我们通过实现基于Spike算法的并行稀疏三角解算器(stSpike),提出了一种分布式内存并行GS(dmpGS)。stSpike将全局三角系统解耦为可以并发求解的较小系统,并且需要求解一个更小的简化稀疏下三角系统,该系统构成了一个连续的瓶颈。为了缓解这个瓶颈并减少dmpGS的通信开销,我们提出了一个由两个阶段组成的分区和重新排序模型。第一阶段是一个新的超图划分模型,其划分目标同时编码以最小化减少的系统大小和通信量。第二阶段是块内行重新排序方法,用于减少简化系统的非零计数。在由359个稀疏线性系统组成的数据集上进行的大量实验验证了所提出的分区和重新排序模型在减少通信和连续计算开销方面的有效性。在12个使用320个内核的大型系统上的并行实验表明,该模型显著提高了dmpGS的可扩展性。

MSC公司:

65层50 稀疏矩阵的计算方法
65层10 线性系统的迭代数值方法
第65年 并行数值计算
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] S.Acer、E.Kayaaslan和C.Aykanat,用于轮廓最小化的超图划分模型,SIAM J.Sci。计算。,41(2019年),第A83-A108页·Zbl 1402.05153号
[2] L.M.Adams和H.F.Jordan,SOR是色盲吗?,SIAM J.科学。统计师。计算。,7(1986),第490-506页·Zbl 0601.65018号
[3] M.Adams、M.Brezina、J.Hu和R.Tuminaro,《并行多重网格平滑:多项式与高斯赛德尔》,J.Compute。物理。,188(2003),第593-610页·Zbl 1022.65030号
[4] M.F.Adams,用于多重网格平滑器的分布式内存非结构化Gauss-Seidel算法,载于SC'01:2001年ACM/IEEE超级计算会议论文集,2001年。
[5] P.R.Amestoy、I.S.Duff、J.-Y.L'Excellent和J.Koster,《使用分布式动态调度的完全异步多面解算器》,SIAM J.Matrix Anal。申请。,23(2001),第15-41页·Zbl 0992.65018号
[6] P.Amodio和F.Mazzia,块三对角线性系统的并行高斯-赛德尔方法,SIAM J.Sci。计算。,16(1995年),第1451-1461页·Zbl 0839.65042号
[7] R.Bagnara,Jacobi和Gauss-Seidel方法收敛性的统一证明,SIAM Rev.,37(1995),第93-97页·Zbl 0824.65013号
[8] G.Ballard,A.Druinsky,N.Knight和O.Schwartz,稀疏矩阵矩阵乘法的超图划分,ACM Trans。并行计算。,3(2016),第1-34页。
[9] R.Barrett、M.Berry、T.F.Chan、J.Demmel、J.Donato、J.Dongarra、V.Eijkhout、R.Pozo、C.Romine和H.Van der Vorst,《线性系统解的模板:迭代方法的构建块》,SIAM,费城,1994年·Zbl 0814.65030号
[10] M.Benzi,《大型线性系统的预处理技术:综述》,J.Compute。物理。,182(2002),第418-477页·Zbl 1015.65018号
[11] M.Benzi和M.Tuma,非对称线性系统的稀疏近似逆预条件,SIAM J.Sci。计算。,19(1998年),第968-994页·Zbl 0930.65027号
[12] M.Bernaschi、P.D'Ambra和D.Pasquini,基于GPU兼容加权匹配的AMG,并行计算。,92 (2020), 102599.
[13] M.W.Berry,大尺度稀疏奇异值计算,国际。J.超级计算。申请。,6(1992年),第13-49页。
[14] R.H.Bisseling,《并行科学计算:使用BSP的结构化方法》,牛津大学出版社,纽约,2020年·Zbl 07269864号
[15] E.S.Bolukbasi和M.Manguoglu,多线程递归和非递归并行稀疏直接求解器,《计算流体-结构相互作用和流动模拟进展》,Springer,Cham,2016年,第283-292页·Zbl 1356.65117号
[16] J.Boyle、M.Mihajlovic和J.Scott,HSL MI20:高效AMG预处理程序,国际。J.数字。方法工程,82(2010),第64-98页·Zbl 1183.76799号
[17] B.Bylina和J.Bylina,稀疏矩阵两种因式分解方法(LU和WZ)的重排序分析与比较,国际计算科学会议,Springer,Cham,2008年,第983-992页·Zbl 1498.65232号
[18] U.V.Catalysturek和C.Aykanat,并行稀疏矩阵向量乘法的基于Hypergraph-partitioning的分解,IEEE Trans。并行分配系统。,10(1999年),第673-693页。
[19] Uê。V.Çatalyu¨rek和C.Aykanat,PaToH(超图的分区工具),摘自《并行计算百科全书》,Springer,Cham,2011年,第1479-1487页。
[20] U¨。V.Çatalyu¨rek、C.Aykanat和B.Uc \807]ar,《关于二维稀疏矩阵划分:模型、方法和配方》,SIAM J.Sci。计算。,32(2010年),第656-683页·Zbl 1298.05198号
[21] S.-C.Chen、D.J.Kuck和A.H.Sameh,实用平行带三角形系统求解器,ACM Trans。数学。软件,4(1978),第270-277页·Zbl 0384.65013号
[22] 我。Çuğu和M.Manguog \774]lu,并行多线程稀疏三角线性系统求解器,计算。数学。申请。,80(2020年),第371-385页·Zbl 1453.65059号
[23] T.A.Davis,《稀疏线性系统的直接方法》,SIAM,费城,2006年,第83-95页·Zbl 1119.65021号
[24] T.A.Davis和Y.Hu,佛罗里达大学稀疏矩阵集合,ACM Trans。数学。《软件》,38(2011),第1-25页·Zbl 1365.65123号
[25] K.D.Devine、E.G.Boman、R.T.Heaphy、R.H.Bisseling和U.V.Catalystek,科学计算的并行超图划分,收录于《第20届IEEE国际并行与计算学报》;分布式处理研讨会,IEEE,2006年,第10-pp页。
[26] J.Diíaz、J.Petit和M.Serna,图形布局问题调查,ACM Comput。调查。,34(2002),第313-356页。
[27] E.D.Dolan和J.J.More©,《性能曲线基准优化软件》,数学。程序。,91(2002),第201-213页·邮编:1049.90004
[28] J.J.Dongarra和A.H.Sameh,关于一些并行带状系统解算器,并行计算。,1(1984年),第223-235页·Zbl 0572.65015号
[29] I.S.Duff和J.Koster,关于将大型条目排列到稀疏矩阵对角线的算法,SIAM J.matrix Anal。申请。,22(2001),第973-996页·Zbl 0979.05087号
[30] H.C.Elman、D.J.Silvester和A.J.Wathen,《有限元和快速迭代求解器:在不可压缩流体动力学中的应用》,数值。数学。科学。计算。,牛津大学出版社,牛津,2014年·Zbl 1304.76002号
[31] G.C.Fox,《解决并行处理器上的问题》,普伦蒂斯·霍尔,新泽西州老塔潘,1988年。
[32] M.Gee、C.Siefert、J.Hu、R.Tuminaro和M.Sala,《ML 5.0平滑聚合用户指南》,技术报告SAND2006-2649,桑迪亚国家实验室,2006年。
[33] G.Golub和J.M.Ortega,《科学计算:并行计算导论》,学术出版社,纽约,1993年·Zbl 0790.65001号
[34] G.H.Golub和C.F.Van Loan,《矩阵计算》,第四版,约翰·霍普金斯大学出版社,马里兰州巴尔的摩,2013年,第606-616页·Zbl 1268.65037号
[35] L.Grigori、S.Moufawad和F.Nataf,用于减少通信的扩大Krylov子空间共轭梯度法,SIAM J.矩阵分析。申请。,37(2016),第744-773页·兹比尔1382.65086
[36] V.E.Henson和U.M.Yang,BoomerAMG:并行代数多重网格求解器和预处理器,应用。数字。数学。,41(2002),第155-177页·Zbl 0995.65128号
[37] 英特尔,英特尔数学内核库(MKL),2019年,https://software.intel.com/en-us/mkl。
[38] 康康,大规模并行计算机上并行多重网格方法的可扩展实现,计算。数学。申请。,70(2015),第2701-2708页·兹比尔1443.65044
[39] G.Karypis、R.Aggarwal、V.Kumar和S.Shekhar,多层超图划分:VLSI领域的应用,IEEE Trans。超大规模集成系统。,7(1999),第69-79页。
[40] G.Karypis和V.Kumar,METIS:非结构化图划分和稀疏矩阵排序系统,第5.1版,2013年,网址:http://www.cs.umn.edu/梅蒂斯。
[41] M.Kawai、T.Iwashita、H.Nakashima和O.Marques,《多重网格泊松解算器基于块红黑排序的并行平滑器》,国际计算科学高性能计算会议,施普林格,查姆,2012年,第292-299页。
[42] D.P.Koester、S.Ranka和G.C.Fox,稀疏电力系统矩阵的并行Gauss-Seidel算法,收录于《1994年超级计算:1994年ACM/IEEE超级计算会议论文集》,IEEE,1994年,第184-193页。
[43] X.S.Li和J.W.Demmel,《SuperLU_DIST:非对称线性系统的可扩展分布式内存稀疏直接求解器》,ACM Trans。《软件》,29(2003),第110-140页·Zbl 1068.90591号
[44] 林毅,袁建元,矩阵和图的轮廓最小化问题,数学学报。申请。罪。,10(1994年),第107-112页·Zbl 0804.05060号
[45] W.Liu、A.Li、J.Hogg、I.S.Duff和B.Vinter,并行稀疏三角解的无同步算法,欧洲并行处理会议,Springer,Cham,2016年,第617-630页·Zbl 1439.65035号
[46] L.O.Mafteiu-Scai,矩阵的带宽。算法综述,维斯特蒂米斯大学。序列号。材料-通知。,52(2014),第183-223页·Zbl 1374.65082号
[47] M.Mangooglu,域分解并行稀疏线性系统求解器,J.Compute。申请。数学。,236(2011),第319-325页·Zbl 1228.65051号
[48] M.Manguoglu,稀疏线性系统的并行求解,《高性能科学计算》,Springer,Cham,2012年,第171-184页。
[49] M.Manguoglu、A.H.Sameh和O.Schenk,PSPIKE:并行混合稀疏线性系统求解器,《欧洲并行处理会议论文集》,Springer,2009年,第797-808页。
[50] C.C.K.Mikkelsen和M.Manguoglu,截断SPIKE算法分析,SIAM J.矩阵分析。申请。,30(2009年),第1500-1519页·Zbl 1176.65028号
[51] Y.Notay,一种基于聚合的代数多重网格方法,Electron。事务处理。数字。分析。,37(2010年),第123-146页·兹比尔1206.65133
[52] D.P.O'Leary,某些网格问题并行处理的排序方案,SIAM J.Sci。统计师。计算。,5(1984),第620-632页·Zbl 0584.65063号
[53] W.Pazner,无矩阵高阶连续和间断Galerkin方法的高效低阶精细预处理,SIAM J.Sci。计算。,42(2020年),第A3055-A3083页·Zbl 1452.65051号
[54] E.Polizzi和A.Sameh,并行混合带状系统求解器:SPIKE算法,并行计算。,32(2006),第177-194页。
[55] E.Polizzi和A.Sameh,SPIKE:求解带状线性系统的并行环境,Comput&《流体》,36(2007),第113-120页·Zbl 1181.76110号
[56] J.W.Ruge和K.Stuében,《代数多重网格》,载于多重网格方法,费城SIAM,1987年,第73-130页。
[57] Y.Saad,ILUT:双阈值不完全LU因式分解,Numer。线性代数应用。,1(1994年),第387-402页·Zbl 0838.65026号
[58] Y.Saad,稀疏线性系统的迭代方法,SIAM,费城,2003年·Zbl 1031.65046号
[59] A.H.Sameh和R.P.Brent,在并行计算机上求解三角形系统,SIAM J.Numer。分析。,14(1977年),第1101-1113页·Zbl 0375.65016号
[60] O.Schenk、M.Manguoglu、A.Sameh、M.Christen和M.Sathe,并行可扩展PDE约束优化:热疗癌症治疗规划中的天线识别,计算机。科学。《研究与发展》,23(2009),第177-183页。
[61] Y.Shang,线性代数系统的分布式存储并行高斯-赛德尔算法,计算。数学。申请。,57(2009),第1369-1376页·Zbl 1186.65038号
[62] B.S.Spring、E.Polizzi和A.H.Sameh,一个功能完备的SPIKE密集带状解算器,ACM Trans。数学。《软件》,46(2020),第1-35页·Zbl 1486.65032号
[63] R.Tavakoli和P.Davami,基于交替群显式方法和区域分解方法的新型并行高斯-赛德尔方法,应用。数学。计算。,188(2007),第713-719页·Zbl 1114.65317号
[64] B.Uçar和C.Aykanat,《重新审视稀疏矩阵划分的超图模型》,SIAM Rev.,49(2007),第595-603页·Zbl 1130.65061号
[65] UHEM,国家高性能计算中心,2021年,http://www.uhem.itu.edu.tr。
[66] P.Van、M.Brezina和J.Mandel,基于平滑聚合的代数多重网格收敛,数值。数学。,88(2001),第559-579页·Zbl 0992.65139号
[67] B.Vastenhouw和R.H.Bisseling,并行稀疏矩阵-向量乘法的二维数据分布方法,SIAM Rev.,47(2005),第67-95页·Zbl 1083.65044号
[68] I.E.Venetis、A.Kouris、A.Sobczyk、E.Gallopoulos和A.H.Sameh,基于Givens旋转的GPU架构直接三对角求解器,并行计算。,49(2015),第101-116页。
[69] K.Watanabe、H.Igarashi和T.Honma,基于边缘的有限元分析中几何和代数多重网格方法的比较,IEEE Trans。马格纳。,41(2005),第1672-1675页。
[70] R.Webster,Navier-Stokes问题的代数多重网格求解器,国际。J.数字。方法流体,18(1994),第761-780页·Zbl 0806.76046号
[71] U.M.Yang,《并行代数多重网格方法高性能预处理器》,《并行计算机上偏微分方程的数值求解》,Springer,Cham,2006,第209-236页·Zbl 1097.65125号
[72] 张杰,泊松方程多重网格中五点红黑高斯-赛德尔加速,应用。数学。计算。,80(1996),第73-93页·Zbl 0870.65023号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。