马丁·德容;奥克·范德普洛格;奥克·迪泽尔;基斯·威克 适用于GPU型处理器的5-/9点模具问题的细粒度并行RRB求解器。 (英语) 兹比尔1375.65142 ETNA,电子。变速器。数字。分析。 46, 375-393 (2017). 摘要:基于不完全因式分解的预条件对于预处理共轭梯度(PCG)算法的快速收敛非常流行。然而,这些预处理程序很难并行化,因为大多数操作本质上是顺序的。在本文中,我们提出了RRB-solver,这是一种基于重复红黑(RRB)方法的使用不完全Cholesky因式分解的PCG型求解器。RRB求解器的规模几乎与Multigrid一样大,本文表明,该方法可以在包括GPU在内的现代计算体系结构上高效地并行化。对于高效的并行实现,聪明的存储方案是关键。存储方案称为\(r_1/r_2/b_1/b_2 \),它确保在整个算法中合并内存传输,从而产生RRB解算器的近最优性能。对于5/9点模具问题,与在一个CPU内核上的顺序实现相比,结合GPU上的CUDA实现,\(r_1/r_2/b_1/b_2)存储方案的加速因子超过30。与代数多重网格的比较进一步表明,RRB求解器可以在GPU上非常有效地实现。 MSC公司: 65号06 含偏微分方程边值问题的有限差分方法 35J05型 拉普拉斯算子、亥姆霍兹方程(约化波动方程)、泊松方程 65号55 多重网格方法;含偏微分方程边值问题的区域分解 65层10 线性系统的迭代数值方法 65F08个 迭代方法的前置条件 关键词:重复红-黑;不完全Cholesky;并行化;二维泊松方程;预处理共轭梯度算法 PDF格式BibTeX公司 XML格式引用 \textit{M.de Jong}等人,ETNA,Electron。变速器。数字。分析。46、375--393(2017年;Zbl 1375.65142) 全文: EMIS公司