×

并行多线程稀疏三角线性系统求解器。 (英语) Zbl 1453.65059号

摘要:我们提出了一种基于Spike算法的并行稀疏三角线性系统求解器。稀疏三角系统在许多应用中都需要求解。通常,由于其固有的顺序性,它们是一个瓶颈。此外,通常需要求解具有相同系数矩阵和不同右侧向量的多个连续系统。在带状情况下,所提出的求解器以额外的算术运算为代价将问题解耦。与带状情况相比,三角系数矩阵的稀疏性带来了额外的节省。我们展示了在多核体系结构上,与英特尔数学内核库(MKL)中最先进的并行稀疏三角解算器相比,所提出的解算器的并行性能。我们还展示了各种稀疏矩阵重排序方案的效果。数值结果表明,在(sim 80%\)的情况下,所提出的求解器平均比MKL的求解器好2.47倍。

MSC公司:

65平方英尺 线性系统和矩阵反演的直接数值方法
2005年5月 并行数值计算
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Hysom,D。;Pothen,A.,不完全因子预处理的可扩展并行算法,SIAM J.Sci。计算。,22, 6, 2194-2215 (2001) ·Zbl 0986.65048号
[2] 哈钦森,S。;沙迪德,J。;Tuminaro,R.,《阿兹特克用户指南》。版本1。科技代表(1995),科学技术信息办公室(OSTI)
[3] 艾森斯塔特,S.C。;古尔斯基,M.C。;舒尔茨,M.H。;谢尔曼,A.H.,耶鲁稀疏矩阵包i:对称码,国际。J.数字。方法工程,18,8,1145-1151(1982)·Zbl 0492.65012号
[4] Li,X.S。;Demmel,J.W.,SuperLU_DIST:非对称线性系统的可扩展分布式内存稀疏直接求解器,ACM Trans。数学。柔和。(TOMS),29,2,110-140(2003)·Zbl 1068.90591号
[5] R·D·法尔古特。;Yang,U.M.,Hypre:高性能预处理程序库,(国际计算科学会议(2002),Springer),632-641·Zbl 1056.65046号
[6] 申克,O。;Gärtner,K。;Fichtner,W。;Stricker,A.,Pardiso:半导体器件模拟中的高性能串行和并行稀疏线性解算器,Future Gener。计算。系统。,18, 1, 69-78 (2001) ·Zbl 1032.68172号
[7] 巴莱,S。;Abhyankar,S。;亚当斯,M。;Brown,J。;布鲁纳,P。;Buschelman,K。;达尔星。;艾伊霍特,V。;格罗普,W。;Kaushik,D.,《Petsc用户手册》第3.8版,技术代表(2017),阿贡国家实验室(ANL):阿贡国家实验(ANL,美国伊利诺伊州阿贡)
[8] 中华人民共和国埃姆斯泰。;达夫,I.S。;卓越,J.-Y。;Koster,J.,使用分布式动态调度的完全异步多线程求解器,SIAM J.矩阵分析。申请。,23, 1, 15-41 (2001) ·Zbl 0992.65018号
[9] Davis,T.A。;Duff,I.S.,稀疏lu因子分解的非对称模式多前沿方法,SIAM J.矩阵分析。申请。,18, 1, 140-158 (1997) ·Zbl 0884.65021号
[10] Filippone,S。;Colajanni,M.,Psblas:稀疏矩阵并行线性代数计算库,ACM Trans。数学。柔和。(TOMS),26,4,527-550(2000)·Zbl 1365.65128号
[11] 乔希,M。;Karypis,G。;库马尔,V。;古普塔,A。;Gustavson,F.,《Pspases:一种高效且可扩展的并行稀疏直接求解器》(第九届科学计算并行处理SIAM会议论文集(1999),Citeser)
[12] 安德森,E。;Saad,Y.,《在并行计算机上求解稀疏三角线性系统》,国际期刊《高速计算》。,1, 01, 73-95 (1989) ·Zbl 0726.65026号
[13] Saltz,J.H.,多处理器上求解稀疏三角系统的聚合方法,SIAM J.Sci。统计计算。,11, 1, 123-144 (1990) ·Zbl 0692.65009号
[14] 施赖伯,R。;Tang,W.-P.,向量化共轭梯度法(CYBER 205应用研讨会论文集(1982))
[15] Naumov,M.,《GPU上预处理迭代方法中的并行不完全-LU和Cholesky因子分解》,技术代表(2012年),NVIDIA公司:美国马萨诸塞州韦斯特福德NVIDIA公司
[16] Picciau,A。;Inggs,G.E。;Wickerson,J。;科里根,E.C。;Constantinides,G.A.,平衡局部性和并发性:在gpus上解决稀疏三角形系统,(2016年IEEE第23届高性能计算国际会议(HiPC)(2016),IEEE),183-192
[17] 李,R。;Saad,Y.,Gpu-加速预处理迭代线性解算器,J.Supercomput。,63, 2, 443-466 (2013)
[18] Park,J。;Smelyanskiy,M。;Sundaram,N。;Dubey,P.,高性能共享内存稀疏三角解算器的稀疏化同步,(国际超级计算会议(2014),Springer),124-140
[19] 沃尔夫,M.M。;Heroux,医学硕士。;Boman,E.G.,《影响多线程稀疏三角求解性能的因素》(计算科学高性能计算国际会议(2010),Springer),32-44·Zbl 1323.65146号
[20] Rothberg,E。;Gupta,A.,《分层内存多处理器上的并行iccg——解决三角形解决瓶颈》。,并行计算。,18, 7, 719-741 (1992) ·Zbl 0792.68053号
[21] 哈蒙德,S.W。;Schreiber,R.,《共享内存多处理器上的高效iccg》,国际期刊《高速计算》。,4, 01, 1-21 (1992)
[22] 王,X。;薛伟。;刘伟。;Wu,L.,Swsptrsv:sunway架构上具有稀疏层瓦片布局的快速稀疏三角解,(第23届ACM SIGPLAN并行编程原理与实践研讨会论文集(2018),ACM),338-353
[23] Naumov,M。;卡斯通圭,P。;Cohen,J.,《平行图着色及其在GPU上不完全LU因式分解中的应用》,技术代表(2015),NVIDIA公司:美国马萨诸塞州韦斯特福德NVIDIA公司
[24] 苏霍斯基,B。;塞文,C。;桑塔拉姆,M。;Raghavan,P.,《将稀疏三角解应用于gpu》,(2012年第41届并行处理研讨会国际会议(2012年),IEEE),140-148
[25] 岩田,T。;Nakashima,H。;Takahashi,Y.,iccg方法中并行多线程稀疏三角形解算器的代数块多色排序方法,(并行与分布式处理研讨会(IPDPS),2012年IEEE第26国际(2012),IEEE),474-483
[26] 马,S。;Saad,Y.,《非结构化稀疏线性系统的分布式ILU(0)和SOR前置条件》,技术代表(1994),陆军高性能计算研究中心
[27] Koester,D.P。;兰卡,S。;Fox,G.C.,稀疏电力系统矩阵的并行高斯-赛德算法,(1994年ACM/IEEE超级计算会议论文集(1994),IEEE计算机社会出版社),184-193
[28] 刘伟。;李,A。;霍格,J。;达夫,I.S。;Vinter,B.,并行稀疏三角形解的无同步算法,(欧洲并行处理会议(2016),Springer),617-630·Zbl 1439.65035号
[29] Vuduc,R。;卡米勒,S。;徐,J。;尼什塔拉,R。;Demmel,J.W。;Yelick,K.A.,《稀疏三角求解的自动性能调优和分析》(ICS 2002:通过高级语言和库进行性能优化研讨会(2002))
[30] 周,E。;Anzt,H。;斯科特·J。;Dongarra,J.,在不完全因式分解预处理中使用Jacobi迭代和分块求解稀疏三角系统,J.并行分布计算。,119219-230(2018),网址http://www.sciencedirect.com/science/article/pii/S074373151830304
[31] 托托尼,E。;麻省理工学院Heath。;Kale,L.V.,稀疏三角线性系统的结构自适应并行解,并行计算。,40, 9, 454-470 (2014)
[32] Mayer,J.,用稀疏三角矩阵求解线性系统的并行算法,《计算》,86,4,291(2009)·Zbl 1179.65038号
[33] Li,X.S.,多核平台上稀疏lu分解和三角解的评估,(计算科学高性能计算国际会议(2008),Springer),287-300
[34] 波顿,A。;Alvarado,F.L.,并行稀疏三角形解的快速重排序算法,SIAM J.Sci。统计师。计算。,13, 2, 645-653 (1992) ·Zbl 0744.65024号
[35] B.史密斯。;Zhang,H.,《稀疏三角形解决了重新审视的ilu:数据布局对更好的性能至关重要》,《国际高性能计算》。申请。,25, 4, 386-391 (2011)
[36] Teranishi,K。;Raghavan,P。;Ng,E.,一种新的用于延迟容忍分布式稀疏三角解的数据映射方案,(超级计算,ACM/IEEE 2002年会议(2002),IEEE),27
[37] Sameh,A.H。;Brent,R.P.,在并行计算机上求解三角形系统,SIAM J.Numer。分析。,14, 6, 1101-1113 (1977) ·Zbl 0375.65016号
[38] Chen,S.-C。;库克·D·J。;Sameh,A.H.,实用平行带三角形系统求解器,ACM Trans。数学。柔和。(TOMS),4,3,270-277(1978)·Zbl 0384.65013号
[39] Dongarra,J.J。;Sameh,A.H.,关于一些并行带状系统解算器,并行计算。,1, 3-4, 223-235 (1984) ·Zbl 0572.65015号
[40] 波利齐,E。;Sameh,A.H.,并行混合带状系统求解器:SPIKE算法,并行计算。,32, 2, 177-194 (2006)
[41] 波利齐,E。;Sameh,A.,Spike:求解带状线性系统的并行环境,计算与流体,36,1,113-120(2007)·兹比尔1181.76110
[42] Mangooglu,M。;Sameh,A.H。;Schenk,O.,Pspike:并行混合稀疏线性系统求解器,(欧洲并行处理会议(2009),Springer),797-808
[43] 申克,O。;Mangooglu,M。;萨米赫,A。;Christen,M。;Sathe,M.,并行可扩展pde-constrained优化:热疗癌症治疗规划中的天线识别,计算机。科学-Res.Dev.,23,3-4,177-183(2009)
[44] Manguoglu,M.,一个区域分解并行稀疏线性系统解算器,J.Compute。申请。数学。,236, 3, 319-325 (2011) ·Zbl 1228.65051号
[45] Manguoglu,M.,稀疏线性系统的并行求解,(高性能科学计算(2012),Springer),171-184
[46] Bolukbasi,E.S。;Manguoglu,M.,多线程递归和非递归并行稀疏直接求解器,(计算流体-结构相互作用和流动模拟进展(2016),Springer),283-292·Zbl 1356.65117号
[47] 威尼斯,I.E。;Kouris,A。;Sobczyk,A。;加洛普洛斯,E。;Sameh,A.H.,一种用于gpu架构的基于givens旋转的直接三对角解算器,并行计算。,49, 101-116 (2015)
[48] Mendiratta,K。;Polizzi,E.,求解一般带状系统的线程尖峰算法,并行计算。,37, 12, 733-741 (2011)
[49] Karypis,G。;Kumar,V.,《划分不规则图的快速高质量多级方案》,SIAM J.Sci。计算。,20, 1, 359-392 (1998) ·Zbl 0915.68129号
[50] Karypis,G。;Kumar,V.,《多级图划分和稀疏矩阵排序的并行算法》,J.parallel Distribute.Compute。,48, 1, 71-95 (1998)
[51] 中华人民共和国埃姆斯泰。;Davis,T.A。;达夫,I.S.,《近似最小度排序算法》,SIAM J.矩阵分析。申请。,17, 4, 886-905 (1996) ·Zbl 0861.65021号
[52] George,A.,常规有限元网格的嵌套剖分,SIAM J.Numer。分析。,10, 2, 345-363 (1973) ·Zbl 0259.65087号
[53] 乔治,A。;Liu,J.W.,大型稀疏正定系统的计算机解(1981),Prentice Hall Professional Technical Reference·Zbl 0516.65010号
[54] 英特尔数学内核库。参考手册,技术代表,英特尔公司,美国圣克拉拉(2018)。统一资源定位地址https://software.intel.com/en-us/mkl。
[55] Davis,T.A。;Hu,Y.,佛罗里达大学稀疏矩阵集合,ACM Trans。数学。柔和。(TOMS),38,1,1(2011)·Zbl 1365.65123号
[56] 达贡,L。;Menon,R.,Openmp:共享内存编程的行业标准API,IEEE Comput。科学。工程师,5,1,46-55(1998)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。