×

通过分块和选择性转置提高ILU预条件器的性能和鲁棒性。 (英语) Zbl 1360.65094号

摘要:对于大型稀疏线性方程组的Krylov子空间解算器,不完全因式分解是最有效的通用预处理方法之一。描述了两种增强稀疏非对称系统不完全LU分解鲁棒性和性能的技术。提出了一种基于LU分解的Crout变分的块不完全分解算法。该算法适用于结合基于阈值的下降和无限制的部分旋转,并克服了现有不完全LU分解算法在有阻塞和无阻塞两种情况下的一些局限性。结果表明,阻塞有三方面的影响:它加快了不完全因子的计算和相关三角系统的求解,允许经济地计算更密集和更稳健的因子,并且允许权衡GMRES的重启参数,以进一步提高整体速度和鲁棒性。提出了一种高效的启发式算法,用于提高预处理的质量和相关迭代方法的后续收敛性。选择Crout变量作为底层因式分解算法可以有效地实现这种启发式算法,这有可能改进需要旋转以实现数值稳定性的矩阵的不完全和完全稀疏LU因式分解。

理学硕士:

65F08个 迭代方法的前置条件
65层10 线性系统的迭代数值方法
65英尺50英寸 稀疏矩阵的计算方法
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] M.Benzi,《大型线性系统的预处理技术:综述》,J.Compute。物理。,182(2002),第418-477页·Zbl 1015.65018号
[2] M.Bollho¨fer,{\it基于监测逆因子增长}的旋转稳健ILU,线性代数应用。,338(2001),第201-213页·兹比尔0991.65028
[3] M.Bollho¨fer,{它是一个稳健高效的ILU,包含了反三角形因子的增长},SIAM J.Sci。计算。,25(2003年),第86-103页·Zbl 1038.65021号
[4] M.Bollhoïfer、Y.Saad和O.Schenk,{\it ILUPACK V}2.2。(2006年)。
[5] E.Buturla、J.Johnson、S.Furkay和P.Cottrell,《一种新的三维器件模拟公式》,载于《半导体器件和集成电路数值分析学报》,1989年。
[6] B.Carpentieri,J.Liao和M.Sosonkina,{it VBARMS:稀疏线性系统的可变块代数递归多级求解器},J.Compute。申请。数学。,259(2014),第164-173页·Zbl 1291.65095号
[7] E.Chow和M.A.Heroux,{块预处理的面向对象框架},ACM Trans。数学。《软件》,24(1998),第159-183页·Zbl 0930.65052号
[8] E.Chow和Y.Saad,{不定矩阵ILU预条件的实验研究},J.Compute。申请。数学。,86(1997),第387-414页·Zbl 0891.65028号
[9] E.Cuthill和J.McKee,{减少稀疏对称矩阵的带宽},载于1969年第24届美国医学会全国会议论文集,第152-172页。
[10] T.A.Davis,{佛罗里达大学稀疏矩阵集合},技术报告,佛罗里达大学计算机科学系,2007年·Zbl 1365.65123号
[11] V.F.de Almeida、A.M.Chapman和J.J.Derby,{关于偏微分方程有限元解中矩阵的平衡和稀疏因式分解},数值。方法偏微分方程,16(2000),第11-29页·Zbl 0956.65018号
[12] J.J.Dongarra、J.D.Croz、S.Hammarling和I.S.Duff,{一组水平}3{基本线性代数子程序},ACM Trans。数学。《软件》,16(1990),第1-17页·Zbl 0900.65115号
[13] J.J.Dongarra、J.D.Croz、S.Hammarling和R.J.Hanson,{it FORTRAN基本线性代数子程序的扩展集},ACM Trans。数学。《软件》,14(1988),第1-17页·Zbl 0639.65016号
[14] I.S.Duff、A.M.Erisman和J.K.Reid,《稀疏矩阵的直接方法》,牛津大学出版社,英国牛津,1990年·Zbl 0666.65024号
[15] I.S.Duff和J.Koster,《关于将大型条目排列到稀疏矩阵的对角线的算法》,SIAM J.matrix Anal。申请。,22(2001),第973-996页·Zbl 0979.05087号
[16] I.S.Duff和G.A.Meurant,《有序对预处理共轭梯度的影响》,BIT,29(1989),第635-657页·Zbl 0687.65037号
[17] I.S.Duff和J.K.Reid,{不定稀疏对称线性方程组的多面解},ACM Trans。数学。软件,9(1983),第302-325页·Zbl 0515.65022号
[18] Q.Fan,P.A.Forsyth,J.R.F.McMacken和W.-P.Tang,{设备模拟中迭代求解器的性能问题},SIAM J.Sci。计算。,17(1996),第100-117页·Zbl 0847.65022号
[19] R.W.Freund,{非厄米线性系统的无转置拟最小残差算法},SIAM J.Sci。统计。计算。,14(1993年),第470-482页·兹伯利0781.65022
[20] A.George和J.W.-H.Liu,{大型稀疏正定系统的计算机解},Prentice-Hall,Englewood Cliffs,NJ,1981年·Zbl 0516.65010号
[21] T.George,A.Gupta和V.Sarin,《SPD系统迭代求解器性能的实证分析》,ACM Trans。数学。软件,38(2012)·Zbl 1365.65076号
[22] J.R.Gilbert和S.Toledo,{非对称线性系统不完全LU预条件的评估},Informatica,24(2000),第409-425页·Zbl 0969.68604号
[23] C.Greif,S.He,and P.Liu,{it SYM-ILDL:对称不定矩阵不完全因式分解的C++包},(2013)。
[24] A.Gupta,{改进不完全因式分解预条件的性能和鲁棒性},于2012年在西班牙巴伦西亚举行的SIAM应用线性代数会议上发表。
[25] A.Gupta,{改进的非对称稀疏矩阵的符号和数值分解算法},SIAM J.矩阵分析。申请。,24(2002),第529-552页·Zbl 1021.65014号
[26] A.Gupta,{图分区和稀疏矩阵排序的快速有效算法},IBM J.Research Development,41(1997),第171-183页。
[27] A.Gupta,{\it WSMP:Watson稀疏矩阵包第二部分-通用系统的直接解决方案},技术报告RC 21888,IBM T.J.Watson研究中心,纽约州约克敦高地,2000年。
[28] A.Gupta,{\it WSMP:Watson稀疏矩阵包第三部分-稀疏系统的迭代解决方案},技术报告RC 24398,IBM T.J.Watson研究中心,纽约州约克敦高地,2007年。
[29] A.Gupta和T.George,{改善不完全因式分解预处理性能的自适应技术},SIAM J.Sci。计算。,32(2010年),第84-110页·Zbl 1209.65036号
[30] A.Gupta和L.Ying,{\it On Algorithms for Finding Maximum Matchings in Bipartive Graphs},技术报告RC 21576,IBM T.J.Watson Research Center,Yorktown Heights,NY,1999年。
[31] P.Heínon,P.Ramet,and J.Roman,{\it On finding approximate supernodes for a efficient block-ILU。,34(2008),第345-362页。
[32] N.J.Higham和D.J.Hiham,{旋转高斯消去中的大生长因子},SIAM J.矩阵分析。申请。,10(1989年),第155-164页·Zbl 0681.65012号
[33] D.Hysom和A.Pothen,《不完全因子预处理的可扩展并行算法》,SIAM J.Sci。计算。,22(2000),第2194-2215页·Zbl 0986.65048号
[34] C.Janna、M.Ferronato和G.Gambolia,{it对称正定线性系统的块FSAI-ILU并行预条件},SIAM J.Sci。计算。,32(2010年),第2468-2484页·Zbl 1220.65037号
[35] M.T.Jones和P.E.Plassmann,《Blocksolve95用户手册:稀疏线性系统并行解决方案的可扩展库软件》,技术报告ANL-95/48,伊利诺伊州阿贡市阿贡国家实验室,1995年。
[36] I.E.Kaporin,L.Y.Kolotilina和A.Y.Yeremin,{高阶三维有限元系统的块SSOR预处理。II不完全BSSOR预处理},线性代数应用。,154-156(1991),第647-674页·兹比尔0753.65026
[37] G.Karypis和V.Kumar,{基于并行阈值的ILU因子分解},技术报告TR 96-061,明尼苏达大学计算机科学系,1996年。
[38] N.Li,Y.Saad和E.Chow,{通用稀疏矩阵ILU的Crout版本},SIAM J.Scit。计算。,25(2003),第716-728页·Zbl 1042.65025号
[39] X.S.Li和M.Shao,{\it具有部分枢轴的不完全LU因子分解的超节点方法},ACM Trans。数学。软件,37(2011)·Zbl 1365.65078号
[40] 刘建华,{消去树在稀疏因子分解中的作用},SIAM J.矩阵分析。申请。,11(1990年),第134-172页·Zbl 0697.65013号
[41] J.W.-H.Liu,《稀疏矩阵解的多波前方法:理论与实践》,SIAM Rev.,34(1992),第82-109页·Zbl 0919.65019号
[42] J.W.-H.Liu、E.G.-Y.Ng和B.W.Peyton,《关于为稀疏矩阵计算寻找超节点》,SIAM J.矩阵分析。申请。,14(1993),第242-252页·Zbl 0765.65034号
[43] R.B.Morgan,{it用特征向量扩充的重新启动的GMRES方法},SIAM J.矩阵分析。申请。,16(1995年),第1154-1171页·Zbl 0836.6500号
[44] N.Munksgaard,{用预处理共轭梯度求解线性方程的稀疏对称集},ACM Trans。数学。《软件》,6(1980),第206-219页·Zbl 0438.65035号
[45] E.G.-Y.Ng、B.W.Peyton和P.Raghavan,{它是分层存储计算机的一个阻塞的不完全cholesky预处理器},载于科学计算中的迭代方法IV,计算和应用数学中的IMACS系列,D.R.Kincaid和A.C.Elster编辑,Elsevier,阿姆斯特丹,1999年,第211-221页。
[46] Y.Saad,{it SPARSKIT:稀疏矩阵计算的基本工具包},技术报告90-20,高级计算机科学研究所,NASA艾姆斯研究中心,加利福尼亚州莫菲特菲尔德,1990年。
[47] Y.Saad,{它ILUT:双阈值不完全({LU})因式分解},《数值线性代数及其应用》,1(1994),第387-402页·Zbl 0838.65026号
[48] Y.Saad,{寻找ILU预处理的精确和近似块结构},SIAM J.Sci。计算。,24(2003),第1107-1123页·Zbl 1034.65020号
[49] Y.Saad,《稀疏线性系统的迭代方法》,第二版,SIAM,费城,2003年·Zbl 1031.65046号
[50] Y.Saad和M.H.Schultz,{it GMRES:求解非对称线性系统的广义最小残差算法},SIAM J.Sci。统计。计算。,7(1986年),第856-869页·Zbl 0599.65018号
[51] Y.Saad和B.Suchomel,{\it ARMS:一般稀疏线性系统的代数递归多级求解器},Numer。线性代数应用。,9(2002),第359-378页·Zbl 1071.65001号
[52] J.Scott和M.T\ruma,{关于鞍点系统的有符号不完全Cholesky因式分解预条件},SIAM J.Sci。计算。,36(2014),第A2984-A3010页。
[53] R.D.Skeel,{平衡对部分旋转残余尺寸的影响},SIAM J.Numer。分析。,18(1981),第449-454页·兹伯利0463.65017
[54] H.A.van der Vorst,{it Bi-CGSTAB:非对称线性系统解的Bi-CG快速平滑收敛变体},SIAM J.Sci。统计师。计算。,13(1992年),第631-644页·Zbl 0761.65023号
[55] N.Vannieuwenhoven和K.Meerbergen,{国际货币基金组织:元素结构稀疏线性系统的不完全多锋面LU-制造},SIAM J.Sci。计算。,35(2013),第A270-A293页·Zbl 1264.65039号
[56] I.Yamazaki、H.Anzt、S.Tomov、M.Hoemmen和J.Dongarra,{用多个GPU改进CA-GMRES在多核上的性能},《国际并行和分布式处理研讨会论文集》,2014年。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。