×

在稀疏线性系统的迭代解中利用线程级并行。 (英语) Zbl 1216.65039号

摘要:我们研究了共享内存多处理机上大规模稀疏线性系统的有效迭代解。我们的并行方法基于多级ILU预条件器,该预条件器保留了ILUPACK中顺序方法的数学语义。我们利用与嵌套分解层次结构相对应的任务树所暴露的并行性(任务并行性),将任务动态调度到处理器以改善负载平衡,并将并行预处理共轭梯度PCG方法的各个阶段与预处理器的计算相一致,以提高数据重用性。在16个处理器的CC-NUMA平台上的结果表明了该解决方案的并行效率。

MSC公司:

65层10 线性系统的迭代数值方法
65F08个 迭代方法的前置条件
65层50 稀疏矩阵的计算方法
2005年5月 并行数值计算
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] George,A.:常规有限元网格的嵌套剖分,SIAM J.Numer。肛门。10,第2期,345-363(1973)·Zbl 0259.65087号 ·doi:10.1137/0710032
[2] Saad,Y.:稀疏线性系统的迭代方法,(2003)·兹比尔1031.65046
[3] 博勒费尔,M。;Saad,Y.:基于逆序ilus构建的多层预处理子,SIAM J.Sci。计算。27,第5期,1627-1650(2006)·Zbl 1104.65037号 ·数字对象标识代码:10.1137/040608374
[4] 申克,O。;博勒费尔,M。;Römer,R.A.:关于安德森定位模型的大规模对角化技术,SIAM rev.5091-112(2008)·Zbl 1136.65044号 ·doi:10.1137/070707002
[5] 申克,O。;瓦希特,A。;Weiser,M.:大型非凸约束优化的惯性揭示预处理,SIAM J.Sci。计算。31,第2期,939-960(2008)·Zbl 1194.35029号 ·doi:10.1137/070707233
[6] 博勒费尔,M。;格罗特,M.J。;Schenk,O.:非均匀介质中亥姆霍兹方程的代数多层预条件,SIAM J.Sci。计算。31,第5号,3781-3805(2009)·Zbl 1203.65273号 ·数字对象标识代码:10.1137/080725702
[7] T.George,A.Gupta,V.Sarin,SPD系统迭代求解器性能的实证分析,技术报告。RC 24737,IBM Thomas J.Watson Research Center,约克镇高地,纽约105982009年1月。
[8] 琼斯,M.T。;Plassmann,P.E.:稀疏线性系统的可缩放迭代解,并行计算。20,第5期,753-773(1994)·Zbl 0802.65034号 ·doi:10.1016/0167-8191(94)90004-3
[9] Karypis,G。;Kumar,V.:基于并行阈值的ILU因子分解,1-24(1997)
[10] Hysom,D。;Pothen,A.:不完全因子预处理的可扩展并行算法,SIAM J.Sci。计算。22,第6期,2194-2215(2001)·Zbl 0986.65048号
[11] Made,M.M.Monga;Van Der Vorst,H.A.:伪重叠子域的并行不完全因式分解,并行计算。第989-1008号第27页(2001年)·Zbl 0971.68060号
[12] 李,Z。;萨阿德,Y。;Sosonkina,M.:Parms:代数递归多级求解器Numer的并行版本。alg公司。申请。10, 485-509 (2003) ·Zbl 1071.65532号
[13] 萨阿德,Y。;Suchomel,B.:ARMS:一般稀疏线性系统的代数递归多级解算器,Numer。线性代数。w.申请。9,第5期,359-378(2002)·Zbl 1071.65001号
[14] 赫斯特内斯,M。;Stiefel,E.:《求解线性系统的共轭梯度方法》,J.research nat.Bur。标准49,409-436(1952)·兹比尔0048.09901
[15] Amestoy,P.R.(艾姆斯泰,P.R.)。;达夫,I.S。;L'excellent,J.-Y。;Koster,J.:使用分布式动态调度的完全异步多前沿解算器,SIAM J.Matrix anal。申请。23,第1期,第15-41页(2001年)·Zbl 0992.65018号 ·doi:10.1137/S0895479899358194
[16] 申克,O。;Gärtner,K.:pardiso中的两级动态调度:提高共享内存多处理系统的可伸缩性,并行计算。28,第2期,187-197(2002)·Zbl 0982.68195号 ·doi:10.1016/S0167-8191(01)00135-1
[17] Aliaga,J.I。;博勒费尔,M。;马丁·A·F。;金塔纳-奥尔特(Quintana-Ort)&阿奎特(acute),E.S.;:共享内存多处理机上基于逆ilu构造的多级预条件的并行化,并行计算进展38,287-294(2007)·Zbl 1172.68402号
[18] Aliaga,J.I。;博勒费尔,M。;马丁·A·F。;金塔纳-奥尔特(Quintana-Ort)&阿奎特(acute),E.S.;:并行多级ILU预处理器的设计、调整和评估,计算机科学讲义5336,314-327(2008)·Zbl 1204.65032号
[19] SCOTCH:静态映射、图形分区和稀疏矩阵块排序包&书信电报;http://www.labri.fr/perso/pelegrin/scotch/>.
[20] 佩莱格里尼,F。;罗曼,J。;Amestoy,P.:高效稀疏矩阵排序的混合嵌套剖分和晕近似最小度,第13届国际并行处理研讨会和第10届并行和分布式处理研讨会联合举办的11个IPPS/SDP'99研讨会的会议记录,计算机科学1586/1999的讲稿,986-995(1999年)
[21] Karypis,G。;Kumar,V.:用于划分不规则图的快速高质量多级方案,SIAM J.Sci。计算。20,编号1,359-392(1998)·兹比尔0915.68129 ·doi:10.1137/S1064827595287997
[22] 博勒费尔,M。;Saad,Y.:关于ilus和因子近似倒数之间的关系,SIAM J.Matrix anal。申请。24,第1期,219-237(2002)·Zbl 1017.65019号 ·doi:10.1137/S0895479800372110
[23] 克莱恩,A。;莫勒,C.B。;斯图尔特,G。;Wilkinson,J.:矩阵条件数的估计,SIAM J.Numer。肛门。16, 368-375 (1979) ·Zbl 0403.65012号 ·doi:10.1137/0716029
[24] J.I.Aliaga、M.Bollhöfer、A.F.Martin、E.S.Quintana-Ort駬´、;,并行稀疏向后/向前替换的调度策略,技术报告,载于《2008年PARA会议录》,第九届科学与并行计算技术现状国际研讨会,2008年,提交出版。
[25] Haase,G。;兰格,美国。;Meyer,A.:近似Dirichlet区域分解方法。第一部分:代数方法,计算47,137-151(1991)·Zbl 0741.65091号 ·doi:10.1007/BF02253431
[26] 申克,O。;Gärtner,K.:关于稀疏对称不定系统的快速因式分解旋转方法,Electr。变速器。肛门数。23, 158-179 (2006) ·Zbl 1112.65022号
[27] 申克,O。;Gärtner,K.:用PARDISO,J.future gener.comput求解非对称稀疏线性方程组。系统。20,第3期,475-487(2004)·Zbl 1062.65035号
[28] 斯特拉科斯,Z。;Tichy,P.:预处理共轭梯度中的误差估计,Bit 45,No.4,789-817(2005)·Zbl 1095.65029号 ·doi:10.1007/s10543-005-0032-1
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。