×

稀疏直接解的分布记忆随机结构多波前方法。 (英语) Zbl 1393.65002号

摘要:我们设计了一个用于大型稀疏矩阵的分布式内存随机结构化多面解算器。使用了两层层次树并行。开发了一系列创新的并行方法,用于随机结构化前沿矩阵操作、结构化更新矩阵计算、精简扩展添加操作、从结构化矩阵中提取选定条目等。提出了几种策略,以重用计算和减少通信。与早期的并行结构多波前方法不同,该方法仍然涉及大型密集中间矩阵,我们的并行求解器以瘦矩阵和完全结构化形式执行主要操作。因此,它显著提高了效率和可扩展性。系统的通信代价分析表明,在二维和三维中,单词数分别减少了约(O(sqrt{n}/r)和约(O)(n^{2/3}/r。通过二维和三维求解一些大型离散偏微分方程,证明了其效率和并行性能。通过弱缩放和强缩放测试,可以观察到良好的可扩展性以及在成本和内存方面的显著节约,特别是对于在非结构化网格上离散的一些三维问题。

MSC公司:

65层50 稀疏矩阵的计算方法
15A23型 矩阵的因式分解
65平方英尺 线性系统和矩阵反演的直接数值方法
65楼30 其他矩阵算法(MSC2010)
2005年5月 并行数值计算
65日元10 特定类别建筑的数值算法
65年20月 数值算法的复杂性和性能
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] S.Ambikasaran和E.F.Darve,{it An\(O(N\log N)\)部分层次半可分矩阵的快速直接求解器},J.Sci。计算。,57(2013),第477-501页·Zbl 1292.65030号
[2] P.Amestoy、C.Ashcraft、O.Boiteau、A.Buttari、J.-Y.L'Excellent和C.Weisbecker,{通过块低阶表征改进多额叶方法},SIAM J.Sci。计算。,37(2015),第A1451-A1474页·Zbl 1314.05111号
[3] P.Amestoy、I.S.Duff和J.Y.L'优秀,{它是多前沿并行分布对称和非对称解算器},计算。方法应用。机械。工程184(2000),第501-520页·Zbl 0956.65017号
[4] L.S.Blackford、J.Choi、A.Cleary、E.D'Azeuedo、J.Demmel、I.Dhillon等,《ScaLAPACK用户指南》,宾夕法尼亚州费城SIAM,1997年。
[5] S.Boírm和W.Hackbusch,{it自适应数据解析近似}(mathcal{H}^2){it矩阵},计算,69(2002),第1-35页·Zbl 1012.65023号
[6] S.Chandrasekaran、P.Dewilde、M.Gu和T.Pals,{\it A fast}(\emph{ULV}){\it分解求解器用于层次半可分表示},SIAM J.矩阵分析。申请。,28(2006),第603-622页·Zbl 1120.65031号
[7] S.Chandrasekaran、P.Dewilde、M.Gu和N.Somasunderam,{关于离散椭圆偏微分方程Schur补的非对角块的数值秩},SIAM J.矩阵分析。申请。31(2010),第2261-2290页·Zbl 1209.65032号
[8] R.Clint Whaley,{基本线性代数通信子程序:跨多个并行体系结构的分析和实现},LAPACK工作注释73,田纳西大学,1994年。
[9] I.S.Duff和J.K.Reid,{不定稀疏对称线性}的多面解,ACM Trans。数学。《软件》,9(1983年),第302-325页·Zbl 0515.65022号
[10] J.A.George,{常规有限元网格的嵌套剖分},SIAM J.Numer。分析。,10(1973年),第345-363页·Zbl 0259.65087号
[11] J.A.George、J.W.H.Liu和E.Ng,{超立方体上并行稀疏Cholesky因式分解的通信结果},并行计算。,10(1989年),第287-298页·Zbl 0687.65024号
[12] N.Gibbs,W.Poole和P.Stockmeyer,{\it一种减少稀疏矩阵带宽和轮廓的算法},SIAM J.Sci。计算。,13(1976年),第236-250页·Zbl 0329.65024号
[13] J.R.Gilbert和S.-H.Teng,{\it MESHPART,MATLAB网格划分和图形分隔工具箱}。
[14] A.Gillman和P.G.Martinsson,{it通过高阶复合谱配置法离散的变系数椭圆偏微分方程的一个具有O(N)复杂性的直接求解器},SIAM J.Sci。计算。,36(2014),第A2023-A2046页·Zbl 1303.65099号
[15] L.Grasedyck、R.Kriemann和S.Le Borne,{it基于域分解}(mathcal{H}){it-LU预条件},《科学与工程领域分解方法》第十六卷,O.B.Widlund和D.E.Keyes编辑,Lect。笔记。计算。科学。Eng.55,Springer,纽约,2006年,第661-668页。
[16] M.Gu和S.C.Eisenstat,计算强秩揭示QR因式分解的高效算法,SIAM J.Sci。计算。,17(1996),第848-869页·Zbl 0858.65044号
[17] W.Hackbusch,B.N.Khoromskij和R.Kriemann,{基于弱可容许准则的层次矩阵},《计算》,73(2004),第207-243页·Zbl 1063.65035号
[18] N.Halko、P.G.Martinsson和J.Tropp,《寻找具有随机性的结构:构造近似矩阵分解的概率算法》,SIAM Rev.,53(2011),第217-288页·Zbl 1269.65043号
[19] G.Karypis和V.Kumar,{划分不规则图的快速高质量多级方案},SIAM J.Sci。计算。,20(1998年),第359-392页·Zbl 0915.68129号
[20] X.S.Li和J.W.Demmel,{it SuperLU\(_)DIST非对称线性系统的可扩展分布式内存稀疏直接求解器},ACM Trans。数学。《软件》,29,(2002),第110-140页·Zbl 1068.90591号
[21] E.Liberty、F.Woolfe、P.G.Martinsson、V.Rokhlin和M.Tygert,{矩阵低阶近似的随机算法},Proc。国家。阿卡德。科学。美国,104(2007),第20167-20172页·Zbl 1215.65080号
[22] J.W.H.Liu,《稀疏矩阵解的多波前方法:理论与实践》,SIAM Rev.,34(1992),第82-109页·Zbl 0919.65019号
[23] X.Liu,J.Xia和M.V.de Hoop,{大型结构稠密线性系统的并行随机和无矩阵直接求解器},SIAM J.Sci。计算。,38,(2016),第S508-S538页·Zbl 1352.65094号
[24] P.G.Martinsson,{\it计算矩阵}的层次半可分表示的快速随机算法,SIAM。《矩阵分析杂志》。申请。,32(2011),第1251-1274页·Zbl 1237.65028号
[25] F.Pellegrini和J.Roman,{\it Sparse matrix ordering with SCOTCH},摘自《1997年HPCN会议录》,奥地利维也纳,《计算讲义》。科学。1225年,施普林格,纽约,1997年,第370-378页。
[26] A.Pothen和C.Sun,{\it并行稀疏Cholesky因式分解的映射算法},SIAM J.Sci。计算。,14(1993),第1253-1257页·Zbl 0785.65016号
[27] P.Schmitz和L.Ying,{\it二维一般网格上椭圆问题的快速直接求解器},J.Compute。物理。,231(2012),第1314-1338页·Zbl 1408.65022号
[28] S.Wang。X.S.Li、F.H.Rouet、J.Xia和M.V.de Hoop,{使用分层半可分结构}的平行几何多面解算器,ACM Trans。数学。软件,42(2016)·Zbl 1369.6500号
[29] S.Wang,X.S.Li,J.Xia,Y.Situ,and M.V.de Hoop,{求解具有分层半可分结构的稠密线性系统的高效可伸缩算法},SIAM J.Sci。计算。,35(2013年),第C519-C544页·Zbl 1285.65017号
[30] Xia,{广义大型稀疏矩阵的高效结构多前沿因式分解},SIAM J.Sci。计算。,35(2013),第A832-A860页·Zbl 1266.15022号
[31] J.Xia,{随机稀疏直接解算器},SIAM J.矩阵分析。申请。,34(2013),第197-227页·Zbl 1269.65029号
[32] J.Xia,{\it多层分层半可分离结构},GMIG报告15-16,普渡大学,2015。
[33] J.Xia、S.Chandrasekaran、M.Gu和X.S.Li,{大型结构线性方程组的超快速多面方法},SIAM J.矩阵分析。申请。,31(2009),第1382-1411页·Zbl 1195.65031号
[34] J.Xia,S.Chandrasekaran,M.Gu,和X.S.Li,{分层半可分矩阵的快速算法},Numer。线性代数应用。,17(2010年),第953-976页·Zbl 1240.65087号
[35] J.Xia、Y.Xi和M.Gu,{它是通过随机抽样求解Toeplitz线性系统的超快速结构化解算器},SIAM J.Matrix Anal。申请。,33(2012年),第837-858页·Zbl 1258.65030号
[36] Z.Xin、J.Xia、M.V.de Hoop、S.Cauley和V.Balakrishnan,《通用稀疏矩阵的并行随机结构化多前沿方法》,GMIG报告14-17,普渡大学,2014年·Zbl 1393.65002号
[37] Z.Xin、J.Xia、M.V.de Hoop、S.Cauley和V.Balakrishnan,《大尺度稀疏直接解的可扩展随机结构化多前沿方法》,GMIG报告15-14,普渡大学,2015年·Zbl 1393.65002号
[38] Z.Xin,J.Xia,M.V.de Hoop,S.Cauley,V.Balakrishnan,{稀疏直接解的分布记忆随机结构多前沿方法},GMIG报告9,莱斯大学,2016年,第169-189页·Zbl 1393.65002号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。