×

分布式内存分层插值因子分解。 (英语) Zbl 1375.65141号

摘要:层次插值因子分解(HIF)为求解或预处理椭圆偏微分方程提供了一种有效的方法。通过利用算子的局部性和低秩性质,HIF实现了分解离散正定椭圆算子的拟线性复杂度和求解相关线性系统的线性复杂度。本文介绍了分布式内存HIF(DHIF),作为HIF的并行分布式内存实现。DHIF以层次结构组织流程,并尽可能保持本地通信。对于构造和应用DHIF,计算复杂性分别为(O(\frac{N\log N}{P})和(O(\frac{N}{P}),其中,(N)是问题的大小,(P)是进程的数量。通信复杂度为\(O(\sqrt{P}\log^3P)\alpha+O(\frac{N^{2/3}}{\sqart{P}})\beta\),其中\(\alpha\)是延迟,\(\beta)是反向带宽。在NERSC爱迪生系统上进行了大量的数值示例,共有8192个过程。数值结果与复杂性分析相一致,并证明了DHIF的效率和可扩展性。

MSC公司:

65号06 含偏微分方程边值问题的有限差分方法
65年20月 数值算法的复杂性和性能
35J25型 二阶椭圆方程的边值问题
第65年 并行数值计算
65F08个 迭代方法的前置条件
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Ambikasaran,S.,Darve,E.:部分层次半可分矩阵的快速直接求解器:应用于径向基函数插值。SIAM J.科学。计算。57(3), 477-501 (2013) ·Zbl 1292.65030号
[2] Amestoy,P.,Ashcraft,C.,Boiteau,O.,Buttari,A.,L'Excellent,J.-Y.,Weisbecker,C.:通过块低阶表征改进多额叶方法。SIAM J.科学。计算。37(3),A1451-A1474(2015)·Zbl 1314.05111号 ·数字对象标识代码:10.1137/120903476
[3] Amestoy,P.R.,Duff,I.S.,L'Excellent,J.-Y.:多前沿平行分布对称和非对称解算器。计算。方法应用。机械。工程184(24),501-520(2000)·Zbl 0956.65017号 ·doi:10.1016/S0045-7825(99)00242-X
[4] Amestoy,P.R.,Duff,I.S.,L'Excellent,J.-Y.,Koster,J.:使用分布式动态调度的完全异步多前沿求解器。SIAM J.矩阵分析。申请。23(1), 15-41 (2001) ·Zbl 0992.65018号 ·doi:10.1137/S0895479899358194
[5] Ballard,G.,Demmel,J.,Holtz,O.,Schwartz,O:数字线性代数中的通信最小化。SIAM J.矩阵分析。申请。32(3), 866-901 (2011) ·Zbl 1246.68128号 ·doi:10.1137/090769156
[6] Bebendorf,M.:具有非光滑系数的一般二阶椭圆算子的Galerkin矩阵的有效反演。数学。计算。74(251), 1179-1199 (2005) ·兹比尔1330.65173 ·doi:10.1090/S0025-5718-04-01716-8
[7] Bebendorf,M.,Hackbusch,W.:\[\cal的存在{H} H(H)\]-具有L∞系数的椭圆算子的逆FE-矩阵的矩阵逼近。数字。数学。95(1),1-28(2003)·Zbl 1033.65100号 ·doi:10.1007/s00211-002-0445-6
[8] Börm,S.:椭圆偏微分方程解算子的\[\cal逼近{H} H(H)\]-和\[\cal{H}^2 \]H2矩阵。数字。数学。115(2), 165-193 (2010) ·Zbl 1191.65148号 ·doi:10.1007/s00211-009-0278-7
[9] Briggs,W.L.,Henson,V.E.,McCormick,S.F.:《多重网格教程》,第二版。工业与应用数学学会(2000年)。doi:10.1137/1.9780898719505·Zbl 0958.65128号
[10] Chandrasekaran,S.,Dewilde,P.,Gu,M.,Pals,T.,Sun,X.,van der Veen,A.-J.,White,D.:序列半可分表示的一些快速算法。SIAM J.矩阵分析。申请。27(2), 341-364 (2005) ·Zbl 1091.65063号 ·网址:10.1137/S0895479802405884
[11] Chandrasekaran,S.,Dewilde,P.,Gu,M.,Somasunderam,N.:离散椭圆偏微分方程Schur补的非对角块的数值秩。SIAM J.矩阵分析。申请。31(5), 2261-2290 (2010) ·Zbl 1209.65032号 ·数字对象标识代码:10.1137/090775932
[12] Cheng,H.,Gimbutas,Z.,Martinsson,P.-G.,Rokhlin,V.:关于低秩矩阵的压缩。SIAM J.科学。计算。26(4), 1389-1404 (2005) ·Zbl 1083.65042号 ·数字对象标识代码:10.1137/030602678
[13] Chow,E.、Falgout,R.D.、Hu,J.J.、Tuminaro,R.S.和Yang,U.M.:多重网格求解器的并行化技术调查。并行过程。科学。计算。,第10章,第179-201页。工业和应用数学学会(2006)·Zbl 0992.65018号
[14] Duff,I.S.,Reid,J.K.:不定稀疏对称线性方程的多面解。ACM事务处理。数学。柔和。9(3), 302-325 (1983) ·Zbl 0515.65022号 ·数字对象标识代码:10.1145/356044.356047
[15] Falgout,R.D.,Jones,J.E.:大规模并行架构上的多重网格。收录于:Dick,E.,Riemslagh,K.,Vierendeels,J.(eds.)Multigrid Methods VI.计算科学与工程课堂讲稿,第14卷,第101-107页。施普林格,柏林(2000)。doi:10.1007/978-3-642-58312-4_13·Zbl 0972.65110号
[16] George,A.:常规有限元网格的嵌套剖分。SIAM J.数字。分析。10(2), 345-363 (1973) ·Zbl 0259.65087号 ·doi:10.1137/0710032
[17] Gillman,A.,Martinsson,P.-G.:通过高阶复合谱配置方法离散的变系数椭圆偏微分方程的一个具有\[O(N)O(N。SIAM J.科学。计算。36(4),A2023-A2046(2014)·Zbl 1303.65099号 ·数字对象标识代码:10.1137/130918988
[18] Hackbusch,W.:一种基于\[\cal的稀疏矩阵算法{H} H(H)\]-矩阵。I.\[\cal简介{H} H(H)\]-矩阵。计算62(2),89-108(1999)·Zbl 0927.65063号 ·doi:10.1007/s006070050015
[19] Hackbusch,W.,Börm,S.:自适应H2矩阵的数据解析近似。计算69(1),1-35(2002)·Zbl 1012.65023号 ·doi:10.1007/s00607-002-1450-4
[20] Hackbusch,W.,Khoromskij,B.N.:稀疏的{H} H(H)\]-矩阵运算。二、。应用于多维问题。计算64(1),21-47(2000)·Zbl 0962.65029号
[21] Hao,S.,Martinsson,P.-G.:基于Poincaré-Steklov算子层次合并的三维椭圆偏微分方程直接求解器。J.计算。申请。数学。308, 419-434 (2016). doi:10.1016/j.cam.2016.05.013·Zbl 1346.65062号 ·doi:10.1016/j.cam.2016.05.013
[22] Ho,K.L.,Ying,L.:椭圆算子的层次插值因子分解:微分方程。Commun公司。纯应用程序。数学。69(8), 1415-1451 (2016). doi:10.1002/cpa.21582·Zbl 1353.35142号 ·doi:10.1002/cpa.21582
[23] Ho,K.L.,Ying,L.:椭圆算子的层次插值因式分解:积分方程。Commun公司。纯应用程序。数学。69(7), 1314-1353 (2016) ·Zbl 1344.65123号 ·doi:10.1002/cpa.21577
[24] Izadi,M.:平行\[\cal{H} H(H)\]-分布式内存系统的矩阵算法。计算。视觉。科学。15(2),87-97(2012)·Zbl 1388.65209号 ·doi:10.1007/s00791-013-0198-z
[25] Kriemann,R.:\[\cal{H} H(H)\]-许多核心系统上的LU因子分解。计算。视觉。科学。16(3), 105 (2013) ·Zbl 1388.65210号 ·doi:10.1007/s00791-014-0226-7
[26] Liu,J.W.H.:稀疏矩阵解的多波前方法:理论与实践。SIAM修订版34(1),82-109(1992)·Zbl 0919.65019号 ·数字对象标识代码:10.1137/1034004
[27] Liu,X.,Xia,J.,Hoop,M.V.D.E.:大型结构稠密线性系统的并行随机和无矩阵直接求解器。SIAM J.科学。计算。38(5), 1-32 (2016) ·Zbl 1352.65094号 ·数字对象标识代码:10.1137/15M1023774
[28] Martinsson,P.-G.:一类椭圆偏微分方程的快速直接求解器。SIAM J.科学。计算。38(3), 316-330 (2009) ·Zbl 1203.65066号
[29] Martinsson,P.G.:分块秩揭示QR分解:如何使用随机抽样来避免单矢量旋转。arXiv:1505.08115(2015)·Zbl 1353.35142号
[30] Poulson,J.,Engquist,B.,Li,S.,Ying,L.:异质3D亥姆霍兹方程的并行扫描预处理器。SIAM J.科学。计算。35(3),C194-C212(2013)·Zbl 1275.65073号 ·doi:10.1137/120871985
[31] Poulson,J.,Marker,B.,van de Geijn,R.A.,Hammond,J.R.,Romero,N.A.:元素:分布式内存密集矩阵计算的新框架。ACM事务处理。数学。柔和。39(2), 13:1-13:24 (2013) ·兹比尔1295.65137 ·doi:10.1145/2427023.2427030
[32] Pouransari,H.,Coulier,P.,Darve,E.:使用低秩近似的稀疏矩阵快速层次解算器。arXiv:15100.07363(2016)·Zbl 1365.65072号
[33] Saad,Y.:稀疏线性系统的并行迭代方法。螺柱计算。数学。8, 423-440 (2001) ·Zbl 1002.65042号 ·doi:10.1016/S1570-579X(01)80025-2
[34] Saad,Y.:稀疏线性系统的迭代方法,第2版。工业和应用数学学会(2003年)。数字对象标识代码:10.1137/1.9780898718003·Zbl 1031.65046号
[35] Schmitz,P.G.,Ying,L.:二维一般网格上椭圆问题的快速直接求解器。J.计算。物理学。231(4),1314-1338(2012)·Zbl 1408.65022号 ·doi:10.1016/j.jcp.2011.10.013
[36] Schmitz,P.G.,Ying,L.:使用层次矩阵的笛卡尔三维椭圆问题的快速嵌套剖分求解器。J.计算。物理学。258, 227-245 (2014) ·兹比尔1349.65598 ·doi:10.1016/j.jcp.2013.10.030
[37] Scott,D.S.:超立方体和网状拓扑中的高效全对所有通信模式。摘自:分布式内存计算会议,第398-403页。IEEE(1991)·兹比尔1388.65209
[38] Wang,S.,Li,X.S.,Rouet,F.H.,Xia,J.,De Hoop,M.V.:使用分层半分离结构的平行几何多额头解算器。ACM事务处理。数学。柔和。42(3), 21:1-21:21 (2016) ·Zbl 1369.6500号 ·数字对象标识代码:10.1145/2830569
[39] Xia,J.:一般大型稀疏矩阵的高效结构化多前沿因式分解。SIAM J.科学。计算。35(2),A832-A860(2013)·Zbl 1266.15022号 ·数字对象标识代码:10.1137/120867032
[40] Xia,J.:随机稀疏直接解算器。SIAM J.矩阵分析。申请。34(1), 197-227 (2013) ·Zbl 1269.65029号 ·数字对象标识码:10.1137/12087116X
[41] Xia,J.,Chandrasekaran,S.,Gu,M.,Li,X.S.:大型结构线性方程组的超快速多面方法。SIAM J.矩阵分析。申请。31(3), 1382-1411 (2009) ·Zbl 1195.65031号 ·数字对象标识码:10.1137/09074543X
[42] Xia,J.,Chandrasekaran,S.,Gu,M.,Li,X.S.:分层半可分矩阵的快速算法。数字。线性代数。申请。17(6), 953-976 (2010) ·Zbl 1240.65087号 ·doi:10.1002/nla.691
[43] Xin,Z.,Xia,J.,De Hoop,M.V.,Cauley,S.,Balakrishnan,V.:稀疏直接解的分布记忆随机结构化多前沿方法。普渡GMIG报告14(17),1-25(2014)
此参考列表基于出版商或数字数学图书馆提供的信息。它的项目与zbMATH标识符启发式匹配,并且可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。