×

适用于GPU型处理器的5-/9点模具问题的细粒度并行RRB求解器。 (英语) 兹比尔1375.65142

摘要:基于不完全因式分解的预条件对于预处理共轭梯度(PCG)算法的快速收敛非常流行。然而,这些预处理程序很难并行化,因为大多数操作本质上是顺序的。在本文中,我们提出了RRB-solver,这是一种基于重复红黑(RRB)方法的使用不完全Cholesky因式分解的PCG型求解器。RRB求解器的规模几乎与Multigrid一样大,本文表明,该方法可以在包括GPU在内的现代计算体系结构上高效地并行化。对于高效的并行实现,聪明的存储方案是关键。存储方案称为\(r_1/r_2/b_1/b_2 \),它确保在整个算法中合并内存传输,从而产生RRB解算器的近最优性能。对于5/9点模具问题,与在一个CPU内核上的顺序实现相比,结合GPU上的CUDA实现,\(r_1/r_2/b_1/b_2)存储方案的加速因子超过30。与代数多重网格的比较进一步表明,RRB求解器可以在GPU上非常有效地实现。

MSC公司:

65号06 含偏微分方程边值问题的有限差分方法
35J05型 拉普拉斯算子、亥姆霍兹方程(约化波动方程)、泊松方程
65号55 多重网格方法;含偏微分方程边值问题的区域分解
65层10 线性系统的迭代数值方法
65F08个 迭代方法的前置条件
PDF格式BibTeX公司 XML格式引用
全文: EMIS公司