×

稀疏一般和对称不定线性系统的数据并行ILUPACK。 (英语) Zbl 1483.65049号

Desprez,Frédéric(编辑)等人,《2016年欧洲-巴黎:平行加工车间》。2016年8月24日至26日在法国格勒诺布尔举行的2016年欧洲保时捷国际研讨会。修订了选定的论文。查姆:斯普林格。莱克特。注释计算。科学。10104, 121-133 (2017).
摘要:大维稀疏线性系统的求解是跨越不同应用范围的问题的关键步骤。出于这个原因,已经开发了许多迭代求解器,其中ILUPACK集成了一个具有吸引人的数值特性的基于逆的多级ILU预处理器。在本文中,我们通过将几个关键计算内核的执行卸载到图形处理单元(GPU)来提高ILUPACK的计算性能。特别地,我们针对稀疏一般系统的预处理GMRES和BiCG方法,以及ILUPACK中稀疏对称不定问题的预处理SQMR方法。对NVIDIA开普勒GPU的评估表明,在保持原始ILUPACK解算器的收敛速度和数值特性的同时,执行时间明显减少。
关于整个系列,请参见[Zbl 1364.68008号].

MSC公司:

65层10 线性系统的迭代数值方法
65层50 稀疏矩阵的计算方法
2005年5月 并行数值计算
PDF格式BibTeX公司 XML格式引用
全文: DOI程序

参考文献:

[1] Schenk,O.,Wächter,A.,Weiser,M.:大规模非凸约束优化的惯性揭示预处理。SIAM J.科学。Comp公司·Zbl 1194.35029号 ·doi:10.1137/070707233
[2] Saad,Y.:稀疏线性系统的迭代方法。SIAM出版物,费城(2003)·Zbl 1031.65046号 ·数字对象标识代码:10.1137/1.9780898718003
[3] Saad,Y.:一种灵活的内外预处理GMRES算法。SIAM J.科学。计算。14(2), 461-469 (1993) ·Zbl 0780.65022号 ·doi:10.1137/0914028
[4] Greathouse,J.L.,Daga,M.:使用CSR存储格式的GPU上的高效稀疏矩阵向量乘法。In:《高性能计算、网络、存储和分析国际会议论文集》,SC 2014(2014)
[5] Eijkhout,V.:LAPACK工作说明50:线性代数运算的分布式稀疏数据结构。技术报告,美国田纳西州诺克斯维尔(1992)
[6] Davis,T.A.,Hu,Y.:佛罗里达大学稀疏矩阵集合。ACM事务处理。数学。柔和。38(1), 1-25 (2011) ·Zbl 1365.65123号
[7] Bollhöfer,M.,Saad,Y.:基于逆ILU构建的多层预处理子。SIAM J.科学。计算。27(5), 1627-1650 (2006) ·Zbl 1104.65037号 ·数字对象标识代码:10.1137/040608374
[8] Barrett,R.、Berry,M.、Chan,T.F.、Demmel,J.、Donato,J.和Dongarra,J.,Eijkhout,V.、Pozo,R.,Romine,C.、Van der Vorst,H.:线性系统解的模板:迭代方法的构建块,第2版。SIAM,费城(1994)·Zbl 0814.65030号 ·doi:10.1137/1.9781611971538
[9] Aliaga,J.I.,Bollhöfer,M.,Martín,A.F.,Quintana-Ortyí,E.S.:分布式内存多处理器上多级ILU预处理器的并行化。收录于:Jónasson,K.(编辑)PARA 2010。LNCS,第7133卷,第162-172页。施普林格,海德堡(2012)。doi:10.1007/978-3-642-28151-8_16·doi:10.1007/978-3-642-28151-8_16
[10] Aliaga,J.I.,Bollhöfer,M.,Martín,A.F.,Quintana-Ortyí,E.S.:利用稀疏线性系统迭代解中的线程级并行性。并行计算。37(3), 183-202 (2011) ·Zbl 1216.65039号 ·doi:10.1016/j.parco.2010.11.002
[11] Aliaga,J.I.、Badia,R.M.、Barreda,M.、Bollhöfer,M.,Dufrechou,E.、Ezzatti,P.、Quintana-Ortyí,E.S.:利用ILUPACK预处理CG解算器在NUMA架构和多核加速器上的任务和数据并行性。并行计算。54, 97-107 (2016) ·doi:10.1016/j.parco.2015.12.004号
[12] CUDA工具包5.5。CUSPARSE图书馆。NVIDIA Corporation,5.5版,2013年7月
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。