王璐;胡晓哲;乔纳森·科恩;徐金超 图形处理单元的并行辅助网格代数多重网格方法。 (英语) 兹比尔1275.65021 SIAM J.科学。计算。 35,编号3,C263-C283(2013). 摘要:我们开发了一种新的并行辅助网格代数多重网格(AMG)方法来利用图形处理单元(GPU)的能力。在构造分层粗网格时,我们使用了一个简单且固定的粗化过程,该过程基于从辅助网格生成的区域四叉树。这使我们能够显式控制AMG解算器的稀疏模式和算子复杂性。此功能在形状规则的网格上提供(几乎)最佳的负载平衡和可预测的通信模式,这使得我们的新算法适用于并行计算,尤其是在GPU上。我们还设计了一种基于四叉树特殊着色的并行平滑器,以加快收敛速度,提高该求解器的并行性能。基于CUDA工具包[NVIDIA CUDA Programming Guide,NVIDIA Corp.,2010],我们在GPU上实现了我们新的并行辅助网格AMG方法,该实现的数值结果证明了我们新方法对于(几乎)各向同性问题的有效性。与CUSP中的AMG实现相比,结果在准均匀网格上的平均加速比超过4,在形状规则网格上的加速比超过2[M.加兰和N.贝尔,CUSP:稀疏矩阵和图形计算的通用并行算法,http://cusplibrary.github.com/(2010)]. 引用于7文件 MSC公司: 65层10 线性系统的迭代数值方法 65F08个 迭代方法的前置条件 65层50 稀疏矩阵的计算方法 65号55 多重网格方法;含偏微分方程边值问题的区域分解 65M55型 多重网格方法;涉及偏微分方程初值和初边值问题的区域分解 65N30型 含偏微分方程边值问题的有限元、Rayleigh-Ritz和Galerkin方法 6500万08 含偏微分方程初值和初边值问题的有限体积法 关键词:代数多重网格法;聚合;非线性AMLI循环;辅助电网;通用分组;并行算法;泊松方程;有限元;传热方程;有限体积法;图形处理单元;汇聚;数值结果 软件:MAGMA公司;BoomerAMG公司;炒作;CUDA公司;库拉;github;NaSt3DGPF公司;CUSP公司;SAMG公司;毫升 PDF格式BibTeX公司 XML格式引用 \textit{L.Wang}等人,SIAM J.Sci。计算。35,第3号,C263--C283(2013;Zbl 1275.65021) 全文: 内政部 arXiv公司