丹尼尔·洛厄尔;杰斯温·戈德温;贾斯汀·霍列文斯基;卡提克,迪潘;Chekuri Choudary公司;阿扎马特·马梅特亚诺夫;博亚纳诺里斯;杰拉尔德·萨宾;萨达亚潘,P。;杰森·萨里奇 支持模具的GPU优化迭代求解器。 (英语) Zbl 1281.65138号 SIAM J.科学。计算。 35,第5号,S209-S228(2013). 摘要:非线性偏微分方程的数值解通常依赖迭代Newton-Krylov方法,该方法将基于有限差分模板的问题离散化线性化,生成具有规则结构的稀疏矩阵。该结构的知识可用于利用现代基于缓存的多核和多核体系结构上的并行性和引用局部性,从而在常用迭代线性解算器的基础上实现高性能的计算。在本文中,我们描述了稀疏矩阵数据结构设计的方法,以及PETSc中迭代线性解算器底层内核的实现。我们还基于基于模板的矩阵和向量操作的高级描述描述了CUDA实现的自动调整。 MSC公司: 65号06 含偏微分方程边值问题的有限差分方法 35J60型 非线性椭圆方程 65层10 线性系统的迭代数值方法 65层50 稀疏矩阵的计算方法 65牛顿50 涉及偏微分方程的边值问题的网格生成、细化和自适应方法 关键词:结构化网格;稀疏矩阵格式;迭代求解器;自整定;GPGPU(通用图形处理器);PETSc公司;数值示例;数值示例;牛顿-克利洛夫法;有限差分 软件:特里利诺斯;hiCUDA公司;CUDA公司;ELLPACK公司;超级LU-DIST;PETSc公司;CUSP公司;LAPACK公司 PDF格式BibTeX公司 XML格式引用 \textit{D.Lowell}等人,SIAM J.Sci。计算。35,编号5,S209-S228(2013;兹bl 1281.65138) 全文: 内政部 链接