×

图形处理单元的并行辅助网格代数多重网格方法。 (英语) 兹比尔1275.65021

摘要:我们开发了一种新的并行辅助网格代数多重网格(AMG)方法来利用图形处理单元(GPU)的能力。在构造分层粗网格时,我们使用了一个简单且固定的粗化过程,该过程基于从辅助网格生成的区域四叉树。这使我们能够显式控制AMG解算器的稀疏模式和算子复杂性。此功能在形状规则的网格上提供(几乎)最佳的负载平衡和可预测的通信模式,这使得我们的新算法适用于并行计算,尤其是在GPU上。我们还设计了一种基于四叉树特殊着色的并行平滑器,以加快收敛速度,提高该求解器的并行性能。基于CUDA工具包[NVIDIA CUDA Programming Guide,NVIDIA Corp.,2010],我们在GPU上实现了我们新的并行辅助网格AMG方法,该实现的数值结果证明了我们新方法对于(几乎)各向同性问题的有效性。与CUSP中的AMG实现相比,结果在准均匀网格上的平均加速比超过4,在形状规则网格上的加速比超过2[M.加兰N.贝尔,CUSP:稀疏矩阵和图形计算的通用并行算法,http://cusplibrary.github.com/(2010)].

MSC公司:

65层10 线性系统的迭代数值方法
65F08个 迭代方法的前置条件
65层50 稀疏矩阵的计算方法
65号55 多重网格方法;含偏微分方程边值问题的区域分解
65M55型 多重网格方法;涉及偏微分方程初值和初边值问题的区域分解
65N30型 含偏微分方程边值问题的有限元、Rayleigh-Ritz和Galerkin方法
6500万08 含偏微分方程初值和初边值问题的有限体积法
PDF格式BibTeX公司 XML格式引用