×

并行核心外LU分解的关键概念。 (英语) Zbl 1010.68539号

摘要:本文考虑了核心外密集LU分解例程设计中的关键思想。LU因式分解算法的左向变体比右向变体需要更少的磁盘I/O,并用于开发并行的非核心实现。这个实现使用了一个小型的并行I/O例程库,以及ScaLAPACK和PBLAS例程。在Intel Paragon上运行的结果使用简单的性能模型显示和解释。

MSC公司:

68单位99 计算方法和应用
68岁20岁 模拟(MSC2010)
第65年 并行数值计算
65英尺99英寸 数值线性代数
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Edelman,A.,《1993年大型密集数值线性代数:并行计算的影响》,《国际超级计算机应用杂志》,7113-128(1993)
[2] Edelman,A.,《1994年大型密集数值线性代数:并行计算的持续影响》(1994年可伸缩高性能计算会议论文集(1994),IEEE计算机社会出版社),781-787
[3] Intel Corporation,Paragon system prosolver-des libart software release 1.3(技术报告(1995年9月),Intel Scalable Systems Division:Intel Scalable system Division Beaverton)
[4] 西万·托莱多;Gustavson,F.G.,《SOLAR的设计和实现,SOLAR是一个可扩展的核心外线性代数计算的便携式库》(并行和分布式系统输入/输出第四次研讨会(1996年5月),28-40,宾夕法尼亚州费城
[5] Womble,D.E。;格林伯格,D.S。;Riesen,R.E。;Wheat,S.R.,《核心不在,头脑不在:实用的并行i/o》,(1993年可扩展图书馆会议记录(1993年10月),IEEE计算机学会出版社),10-16
[6] Klimkowski,K。;van de Geijn,R.A.,并行堆外稠密线性解算器的剖析,(1995年并行处理国际会议论文集(1995),CRC出版社),29-33
[7] Dongarra,J.J。;Whaley,R.C.,BLACS v1.0用户指南,(LAPACK工作说明第94号,技术报告CS-95-281(1995),田纳西大学计算机科学系:田纳西州诺克斯维尔大学计算机科学部)
[8] Choi,J.等人。;Dongarra,J.J。;奥斯特鲁乔夫,S。;佩蒂特,A.P。;Walker,D.W。;Whaley,R.C.,一组并行基本线性代数子程序的建议,(LAPACK工作说明第100号,技术报告CS-95-292(1995),田纳西大学计算机科学系:田纳西州诺克斯维尔大学计算机科学部)
[9] Choi,J.等人。;德梅尔,J。;迪隆,I。;Dongarra,J.J。;奥斯特鲁乔夫,S。;佩蒂特,A.P。;斯坦利,K。;Walker,D.W。;Whaley,R.C.,ScaLAPACK:一个用于分布式存储器计算机设计问题和性能的便携式线性代数库,(LAPACK工作说明第95号,技术报告CS-95-283(1995),田纳西大学计算机科学系:田纳西大学诺克斯维尔计算机科学系,田纳西州)·Zbl 0926.65148号
[10] Dongarra,J.J。;古斯塔夫森,F.G。;Karp,A.,在向量流水线机上实现密集矩阵的线性代数算法,SIAM Review,26,91-112(1984)·Zbl 0539.65009号
[11] 奥尔特加,J。;罗明,C.,Theijk公司因子分解的形式。并行系统,并行计算,7,2,149-162(1988)·Zbl 0665.65024号
[12] Dongarra,J.J。;杜克罗兹,J。;Hammarling,S。;Hanson,R.J.,FORTRAN基本线性代数子程序的扩展集,(算法656),ACM Trans。数学。软件,14,1-32(1988)·Zbl 0639.65016号
[13] Dongarra,J.J。;杜克罗兹,J。;达夫,I.S。;Hammarling,S.,一组三级基本线性代数子程序,(算法679),ACM Trans。数学。软件,16,1-28(1990)·Zbl 0900.65116号
[14] 安德森,E。;Bai,Z。;比肖夫,C.H。;德梅尔,J。;Dongarra,J.J。;杜克罗兹,J。;格林鲍姆,A。;Hammarling,S。;麦肯尼,A。;奥斯特鲁乔夫,S。;Sorensen,D.C.,《LAPACK用户指南》(1995),SIAM:SIAM Philadelphia,PA·Zbl 0843.65018号
[15] Choi,J.等人。;Dongarra,J.J。;波佐,R。;Walker,D.W.,ScaLAPACK:分布式内存并发计算机的可扩展线性代数库,(第四届大规模并行计算前沿研讨会论文集(1992),IEEE计算机社会出版社),120-127
[16] 托莱多,S。;Gustavson,F.,《SOLAR的设计与实现,SOLAR是一个可扩展的堆外线性代数计算的便携式库》(第四届并行和分布式系统I/O年度研讨会(1996年5月),ACM出版社)
[17] (第三届并行和分布式系统I/O年度研讨会论文集(1995年4月,圣巴巴拉),与IPPS’95联合举办
[18] 斯尼尔,M。;Otto,S.W。;Huss-Lederman,S。;Walker,D.W。;Dongarra,J.J.,MPI:The Complete Reference(1996),麻省理工学院出版社:马萨诸塞州剑桥
[19] 科贝特,P。;Feitelson,D。;Fineberg,S。;徐,Y。;Nitzberg,B。;普罗斯特,J.-P。;斯尼尔,M。;Traversat,B。;Wong,P.,MPI-IO并行I/O接口概述,(IPPS'95并行和分布式系统输入/输出研讨会(1995年4月)),1-15
此参考列表基于出版商或数字数学图书馆提供的信息。它的项目与zbMATH标识符启发式匹配,并且可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。