×

代数多重网格区域分解的并行性能。 (英语) Zbl 07361110号

摘要:代数多重网格(AMG)是一种广泛使用的可扩展求解器和预处理器,用于大规模线性系统,该系统由一类广泛的椭圆偏微分方程离散化而成。虽然AMG具有最佳的计算复杂度,但随着现代机器上处理器数量的不断增长,通信成本已成为限制其可扩展性的一个重要瓶颈。本文研究了一种新算法——代数多重网格域分解(AMG-DD)的设计、实现和并行性能,该算法专门用于限制通信。AMG-DD的目标是通过牺牲一些额外的计算开销来显著降低通信成本,从而为标准AMG V循环提供一种低通信替代方案。数值结果表明,与AMG相比,AMG-DD在单位通信成本上达到了更高的精度,并且在大型GPU集群上证明了其优于AMG的加速比。

MSC公司:

65M55型 多重网格方法;涉及偏微分方程的初值和初边值问题的区域分解
65号55 多重网格方法;含偏微分方程边值问题的区域分解
65层10 线性系统的迭代数值方法
2005年5月 并行数值计算
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] 品牌A、麦考密克SF、橄榄球JW。稀疏矩阵方程的代数多重网格(AMG)。稀疏性及其应用。马萨诸塞州剑桥:剑桥大学出版社,1984年;第257-284页·Zbl 0548.65014号
[2] StübenK,RugeJW。代数多重网格。收录:McCormickSF(编辑),编辑。多重网格方法。应用数学前沿。第3卷。宾夕法尼亚州费城:SIAM,1987年;第73-130页·Zbl 0659.65094号
[3] BriggsWF、HensonVE、McCormickSF。多重网格教程。第2版,宾夕法尼亚州费城:SIAM,2000年·Zbl 0958.65128号
[4] BakerAH、FalgoutRD、KolevTV、YangUM。将hypre的多重网格解算器扩展到100000核。收录人:BerryM(编辑),编辑。高性能科学计算算法和应用。纽约州纽约市:施普林格出版社,2012年。
[5] GahvariH、BakerAH、SchulzM、YangUM、JordanKE、GroppW。在HPC平台上对代数多重网格循环的性能进行建模。第25届超级计算国际会议记录(ICS 2011)。亚利桑那州塔斯康市;2011年,第172-181页。
[6] BienzA、FalgoutRD、GroppW、OlsonLN、SchroderJB。通过稀疏化减少代数多重网格中的并行通信。SIAM科学计算杂志。2016;38(5):S332-S357·Zbl 1352.65102号
[7] BankRE、FalgoutRD、JonesTM、ManteuffelTA、McCormickSF、RugeJW。代数多重网格域和范围分解(AMG‐DD/AMG‐RD)。SIAM科学计算杂志。2015;37(5):S113-S136·Zbl 1325.65169号
[8] BakerAH,FalgoutRD,YangUM。一种用于确定处理器间通信的假定分区算法。并行计算。2006;32(5‐6):394-414.
[9] BienzA、GroppWD、OlsonLN。节点感知稀疏矩阵向量乘法。J Parall-Distrib计算。2019;130:166-178.
[10] De SterckH,FalgoutRD,NoltingJW,YangUM。并行代数多重网格的距离二插值。数值线性代数应用。2008;15(2‐3):115-139. ·Zbl 1212.65139号
[11] De SterckH、YangUM、HeysJJ。降低并行代数多重网格预条件的复杂性。SIAM J矩阵分析应用。2006年1月;27(4):1019-1039. ·兹比尔1102.65034
[12] 杨姆。关于主动粗化的长范围插值算子。数字线性代数应用。2010;17(2‐3):453-472. ·Zbl 1240.65286号
[13] 施罗德JB,FalgoutRD。代数多重网格的非Galerkin粗网格。SIAM科学计算杂志。2014;36(3):C309-C334·Zbl 1297.65035号
[14] LeeB、McCormickSF、PhilipB、QuinlanDJ。椭圆问题的异步快速自适应复合网格方法:理论基础。SIAM J数字分析。2004年1月;42(1):130-152. ·Zbl 1079.65120号
[15] VassilevskiPS,YangUM。使用加法变量减少代数多重网格中的通信。数字线性代数应用。2014;21(2):275-296. ·Zbl 1340.65304号
[16] BankRE和HolstM。并行自适应网格算法的一种新范式。SIAM科学计算杂志。1999年;。
[17] 米切尔WF。具有全域划分的并行自适应多级方法。ANACM应用数值分析计算数学。2004;1(1‐2):36-48. ·Zbl 1064.65146号
[18] 米切尔WF。使用全域划分的并行多重网格方法。电子传输数字分析。1998;6:224-233. ·Zbl 0898.65080号
[19] AppelhansDJ、ManteuffelT、McCormickS、RugeJ。基于范围分解的求解偏微分方程的低通信并行算法。数字线性代数应用。2017;24(3):e2041·兹比尔1424.65264
[20] MitchellWB,ManteuffelTA。范围分解算法嵌套迭代的实现、理论动机和数值结果的进展。数字线性代数应用。2018;25(3):e2149-e2126·Zbl 1499.65716号
[21] VaněkP,MandelJ,BrezinaM。二阶和四阶椭圆问题的光滑聚合代数多重网格。计算。1996年9月;56(3):179-196. ·兹比尔0851.65087
[22] McCormickSF公司。偏微分方程的多级自适应方法。马萨诸塞州剑桥:剑桥大学出版社,1989年。
[23] BakerAH、FalgoutRD、KolevTV、YangUM。用于超并行计算的多重网格平滑器。SIAM科学计算杂志。2011年1月;33(5):2864-2887. ·Zbl 1237.65032号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。