×

一种适用于分布式并行计算的改进双共轭残差算法。 (英语) Zbl 1117.65047号

摘要:针对分布式并行环境,提出了一种求解系数矩阵不对称的大型稀疏线性系统的改进双共轭残差法(简称IBiCR法)。该方法通过重构BiCR方法将两个全局同步点减少为一个,每次迭代的所有内积都是独立的,内积所需的通信时间可以与向量更新的计算时间有效重叠。它结合了数值稳定性的要素和并行算法设计的特点。成本只是稍微增加了计算量。
性能和等效率分析表明,IBiCR方法比BiCR方法具有更好的并行性和可扩展性。数值实验表明,并行性能可以提高约2倍。我们还将IBiCR与IBiCG以及BiCR与BiCG方法进行了比较。结果表明,BiCR和IBiCR方法在相同的迭代次数下收敛,并且它们的收敛速度分别快于BiCG和IBiCG方法。此外,IBiCR方法克服了IBiCG方法剩余范数的振动。

MSC公司:

65层10 线性系统的迭代数值方法
65层50 稀疏矩阵的计算方法
2005年5月 并行数值计算
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] H.M.Bücker,M.Sauren,基于耦合二项递归的准最小残差方法的并行版本,载于:《工业问题和优化中的应用并行计算研讨会论文集》(Para96),丹麦林格比工业大学,施普林格出版社,1996年8月。;H.M.Bücker,M.Sauren,基于耦合二项递归的准最小残差法的并行版本,载于:《工业问题和优化中应用并行计算研讨会论文集》(第96段),丹麦林格比,丹麦理工大学,Springer-Verlag,1996年8月·Zbl 0888.65036号
[2] 池丽华;刘杰;刘兴平;胡庆峰;李晓梅,大型对称线性系统的改进共轭残差算法(ICCP6和CCP2003联合会议论文集)。ICCP6和CCP2003联合会议记录,计算。物理学。(2005),林顿出版社:美国新泽西林顿出版社),325-328
[3] Dongarra,J.J。;达夫,I.S。;索伦森特区。;van der Vorst,H.A.,《高性能计算机的数值线性代数》(1998),SIAM:宾夕法尼亚州费城SIAM·Zbl 0914.65014号
[4] Freund,R.W。;Nachtigal,N.M.,QMR:非厄米线性系统的准最小残差法,Numer。数学。,60, 315-339 (1991) ·Zbl 0754.65034号
[5] 阿南斯格拉玛;安舒尔·古普塔;Kumar,Vipin,Isoefficiency function:并行算法和架构的可伸缩性度量,IEEE parallel Distribute.Technol。,1, 3, 12-21 (1993)
[6] 顾桐祥;刘兴平;莫泽耀,多搜索方向共轭梯度法。一: 方法及其命题,国际计算杂志。数学。,8111133-1143(2004年)·Zbl 1059.65027号
[7] 刘兴平;顾桐祥;杭、徐登;Sheng,Zhi-qiang,分布式并行环境中大型线性系统的QMRCGSTAB方法的并行版本,Appl。数学。计算。,172, 2, 744-752 (2006) ·Zbl 1088.65030号
[8] Saad,Y.,《稀疏线性系统的迭代方法》(1996),PWS出版社:PWS出版社波士顿·Zbl 1002.65042号
[9] Sogabe,T。;张世良,解非对称线性系统的广义共轭残差法,(袁亚祥,数值线性代数与优化(2003),科学出版社:北京/纽约科学出版社),88-99
[10] de Sturler,E。;van der Vorst,H.A.,减少GMRES(m)和CG中的全局通信对并行分布式存储计算机的影响,Appl。数字。数学。,1841-459(1995年)·Zbl 0842.65019号
[11] de Sturler,E.,基于网格的并行计算机上Krylov子空间方法的性能模型,并行计算。,22, 57-74 (1996) ·Zbl 0873.65017号
[12] van der Vorst,H.A.,Bi-CGSTAB:非对称线性系统解的Bi-CG的一种快速且平滑收敛的变体,SIAM J.Sci。统计计算。,13, 631-644 (1992) ·Zbl 0761.65023号
[13] T.R.Yang,H.X.Lin,大规模分布式存储计算机上的改进准最小残差法,载《高性能计算与网络国际会议论文集》(HPCN-97),1997年4月。;T.R.Yang,H.X.Lin,大规模分布式存储计算机上的改进准最小残差法,载《高性能计算与网络国际会议论文集》(HPCN-97),1997年4月。
[14] T.R.Yang,《体同步并行体系结构上大型稀疏线性系统的改进CGS方法》,载于:2002年第五届并行处理算法和体系结构国际会议,IEEE计算机学会,2002年,第232-237页。;T.R.Yang,《体同步并行体系结构上大型稀疏线性系统的改进CGS方法》,载于:2002年第五届并行处理算法和体系结构国际会议,IEEE计算机学会,2002年,第232-237页。
[15] T.R.Yang,R.P.Brent,并行分布式存储体系结构上大型和稀疏非对称线性系统的改进BICGSTAB方法,2002年第五届并行处理算法和体系结构国际会议,IEEE计算机学会,2002年,第324-328页。;T.R.Yang,R.P.Brent,并行分布式存储体系结构上大型和稀疏非对称线性系统的改进BICGSTAB方法,2002年第五届并行处理算法和体系结构国际会议,IEEE计算机学会,2002年,第324-328页。
[16] Yang,T.R。;Brent,R.P.,《并行分布式存储体系结构上大型稀疏线性系统的改进BiCG方法》,Inform。J.,6349-360(2003)·Zbl 1103.65342号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。