×

多前沿并行分布式对称和非对称解算器。 (英语) Zbl 0956.65017号

本文讨论了基于\(LU\)因子分解的稀疏线性代数方程对称和非对称系统的多前锋直接解法,例如P.R.Amestoy公司等【国际超级计算机应用3,41-59(1989)】。在这两种情况下,将应用三个后续阶段。分析阶段生成订购树和组装树。数值分解阶段使用来自原始矩阵和节点子节点的数据,在树的每个节点处生成密集(前)子矩阵。可以在额叶矩阵的子矩阵中选择枢轴并执行消去。生成的因子将被存储起来,以便在解决方案阶段使用。Schur补码(贡献块)传递给父节点,以便在该节点进行装配。
在非对称情况下,使用阈值枢轴来保持数值稳定性,以便在分析阶段选择的枢轴可能不合适。这可能导致数据结构与分析预测的数据结构不同。这意味着需要允许动态调度。
针对这一问题,提出了一种新的动态调度并行异步算法。对于对称情况,也需要动态调度来解决非正定问题。讨论了主要的算法选择。包括实现问题和(LDL^T)和(LU)分解的性能。该方法的效率说明了在IBM SP2上对对称和非对称测试问题集进行的大量数值实验。

MSC公司:

65平方英尺 线性系统和矩阵反演的直接数值方法
第65年 并行数值计算
65层50 稀疏矩阵的计算方法
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 中华人民共和国埃姆斯泰。;Davis,T.A。;达夫,I.S.,一种近似最小度排序算法,SIAM J.矩阵分析应用。,17, 886-905 (1996) ·Zbl 0861.65021号
[2] 中华人民共和国埃姆斯泰。;Duff,I.S.,多处理器多线程代码的矢量化,国际超级计算机应用杂志。,3, 41-59 (1989)
[3] 中华人民共和国埃姆斯泰。;Duff,I.S.,稀疏多处理器多前沿方法中的内存分配问题,国际J超级计算机应用。,7, 64-82 (1993)
[4] P.R.Amestoy、I.S.Duff、J.-Y.L'Excellent、P.Plechánch。阳伞。并行稀疏矩阵求解器的集成编程环境,技术报告RAL-TR-98-039,卢瑟福阿普尔顿实验室,1998年,发表于《1998年HPCI会议论文集》;P.R.Amestoy,I.S.Duff,J.-Y.L’Excellent,P.Plecháč。阳伞。并行稀疏矩阵求解器的集成编程环境,技术报告RAL-TR-98-039,卢瑟福阿普尔顿实验室,1998年,发表于《1998年HPCI会议记录》
[5] E.Anderson,Z.Bai,C.Bischof,J.Demmel,J.Dongarra,J.D.Croz,A.Greenbaum,S.Hammarling,A.McKenney,S.Ostrouchov,D.Sorensen,LAPACK:高性能计算机的便携式线性代数库SIAM,费城,1992;E.Anderson,Z.Bai,C.Bischof,J.Demmel,J.Dongarra,J.D.Croz,A.Greenbaum,S.Hammarling,A.McKenney,S.Ostrouchov,D.Sorensen,LAPACK:高性能计算机的便携式线性代数库SIAM,费城,1992·Zbl 0843.65018号
[6] L.S.Blackford、J.Choi、A.Cleary、E.D'Azevedo、J.Demmel、I.Dhillon、J.Dongarra、S.Hammarling、G.Henry、A.Petitet、K.Stanley、D.Walker、R.C.Whaley、ScaLAPACK用户指南。SIAM出版社,1997年;L.S.Blackford、J.Choi、A.Cleary、E.D'Azevedo、J.Demmel、I.Dhillon、J.Dongarra、S.Hammarling、G.Henry、A.Petitet、K.Stanley、D.Walker、R.C.Whaley、ScaLAPACK用户指南。SIAM出版社,1997·兹伯利0886.65022
[7] Daydé,M.J。;达夫,I.S.,在在三个向量多处理器(alliant fx/80、cray-2和ibm 3090/vf,Int.J.Supercomputer Appl.)上的多处理环境中的因式分解。,5, 92-110 (1991)
[8] M.J.Daydé,I.S.Duff,RISC处理器三级BLAS的块实现。技术报告RT/APO/96/1,ENSEEIHT-IRIT,1996年;M.J.Daydé,I.S.Duff,RISC处理器三级BLAS的块实现。技术报告RT/APO/96/1,ENSEEIHT-IRIT,1996
[9] Dongarra,J。;亨佩尔,R。;嘿,A.J.G。;Walker,D.W.,MPI:消息传递接口标准,国际J超级计算机应用。,8, 3-4 (1995)
[10] Dongarra,J.J。;克罗兹,J.D。;达夫,I.S。;Hammarling,S.,《算法679》。一组三级基本线性代数子程序,ACM Trans。数学。软件,16,1-17(1990)·Zbl 0900.65115号
[11] Dongarra,J.J。;克罗兹,J.D。;达夫,I.S。;Hammarling,S.,《算法679》。一组三级基本线性代数子程序:模型实现和测试程序,ACM Trans。数学。软件,16,18-28(1990)·Zbl 0900.65116号
[12] J.J.Dongarra,I.S.Duff,D.C.Sorensen,H.A.van der Vorst,在向量和共享内存计算机上求解线性系统。SIAM,费城,1991年;J.J.Dongarra,I.S.Duff,D.C.Sorensen,H.A.van der Vorst,在向量和共享内存计算机上求解线性系统。SIAM,费城,1991年
[13] Duff,I.S.,《多前沿方案的并行实现》,并行计算,3193-204(1986)·Zbl 0628.65018号
[14] I.S.Duff,R.G.Grimes,J.G.Lewis,Harwell Boeing稀疏矩阵集合用户指南(第一版),技术报告RAL 92-086,卢瑟福-阿普尔顿实验室,1992年;I.S.Duff,R.G.Grimes,J.G.Lewis,Harwell-Being稀疏矩阵集合用户指南(第一版),技术报告RAL 92-086,卢瑟福阿普尔顿实验室,1992年
[15] 达夫,I.S。;Reid,J.K.,《不定稀疏对称线性系统的多面解》,ACM Trans。数学。软件,9,302-325(1983)·Zbl 0515.65022号
[16] 达夫,I.S。;Reid,J.K.,《非对称线性系统集的多面解》,SIAM J.科学统计计算,5633-641(1984)·Zbl 0557.65017号
[17] I.S.Duff、R.G.Grimes、J.G.Lewis,《卢瑟福-波音稀疏矩阵集合》。技术报告RAL-TR-97-031,卢瑟福阿普尔顿实验室,1997年。此外,波音信息与支持服务部的技术报告ISSTECH-97-017和图卢兹CERFACS的报告TR/PA/97/36;I.S.Duff、R.G.Grimes、J.G.Lewis,《卢瑟福-波音稀疏矩阵集合》。技术报告RAL-TR-97-031,卢瑟福阿普尔顿实验室,1997年。此外,波音信息与支持服务部的技术报告ISSTECH-97-017和图卢兹CERFACS的报告TR/PA/97/36
[18] V.Espirat,Dédevelopment D'une approche multifrontale pour machines a mémoire distributuee et réseau hétérogène de stations de travail埃斯皮拉特,《Développement D'une多锋面浇注机的开发》。《第三阶段技术报告》,安内,ENSEEIHT-IRIT,1996年;V.Espirat,Dédevelopment D'une approche multifrontale pour machines a mémoire distributuee et réseau hétérogène de stations de travail埃斯皮拉特,《Développement D'une多锋面浇注机的开发》。第三阶段技术报告Anneée,ENSEEIHT-IRIT,1996
[19] R.F.Fowler,C.Greenough,RALPAR-RAL网格划分程序,2.0版,技术报告RAL-TR-98-025,卢瑟福阿普尔顿实验室,1998年;R.F.Fowler,C.Greenough,RALPAR-RAL网格划分程序,2.0版,技术报告RAL-TR-98-025,卢瑟福阿普尔顿实验室,1998年
[20] 盖斯特,A。;Ng,E.,并行稀疏Cholesky因子分解的任务调度,国际并行程序杂志。,18, 291-314 (1989) ·Zbl 0702.68031号
[21] HSL,哈维尔子程序库。子程序目录(Release 12)。英国牛津郡哈维尔实验室AEA技术,1996年。有关HSL的信息,请联系:Scott Roberts博士,AEA Technology,552 Harwell,Didcot,Oxon OX11 0RA,England(电话:+44-1235-434988;传真:+44-1235-434136;电子邮件:斯科特·罗贝茨@aeat.co.uk); HSL,哈维尔子程序库。子程序目录(Release 12)。英国牛津郡哈维尔实验室AEA技术,1996年。有关HSL的信息,请联系:Scott Roberts博士,AEA Technology,552 Harwell,Didcot,Oxon OX11 0RA,England(电话:+44-1235-434988;传真:+44-1235-434136;电子邮件:斯科特·罗伯茨@aeat.co.uk)
[22] Mandel,J.,平衡域分解,Comm.Numer。方法。工程,9233-241(1993)·Zbl 0796.65126号
[23] 纳格尔,W.E。;阿诺德,A。;韦伯,M。;霍普,H.-C。;Solchenbach,K.,VAMPIR:MPI资源的可视化和分析,超级计算机,12,1,69-80(1996)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。