×

在代数多重网格方法中揭示细粒度并行性。 (英语) Zbl 1253.65041号

摘要:大型稀疏线性系统的代数多重网格方法在许多计算模拟中是必要的,但此类求解器的并行算法通常分解为适合具有传统处理核心的分布式计算机的粗粒度任务。然而,在面向图形处理单元(GPU)等大规模并行处理器上加速多重网格方法需要具有丰富细粒度并行性的算法。在本文中,我们开发了一种并行代数多重网格方法,该方法在多重网格层次结构的构建以及循环或求解阶段都暴露出了实质性的细粒度并行性。我们的算法是用可扩展的并行原语表示的,这些原语在GPU上得到了有效实现。与典型的CPU实现相比,得到的解算器在设置阶段的平均加速比为\(1.8倍\),在循环阶段的平均速度比为\。

MSC公司:

65层10 线性系统的迭代数值方法
65层50 稀疏矩阵的计算方法
PDF格式BibTeX公司 XML格式引用
全文: 内政部 链接