爱德华多·达泽维多;杰克·东加拉 并行核心外scaLAPACK LU、QR和Cholesky因式分解例程的设计和实现。 (英语) 兹比尔1008.68577 并发实践。实验。 12,第15号,1481-1493(2001). 摘要:本文描述了ScaLAPACK的核心外扩展中包含的三个核心因子分解例程——LU、QR和Cholesky——的设计和实现。这些例程允许对一个过于庞大而无法完全容纳在物理内存中的密集系统进行分解和求解。整个矩阵存储在磁盘上,分解例程将子矩阵面板转移到内存中。为了减少磁盘I/O流量,实现了面向“左向”列的因子分解算法变体。这些例程使用可移植的I/O接口实现,并使用高性能ScaLAPACK因式分解例程作为核心计算内核。我们介绍了核心外ScaLAPACK因子分解例程的实现细节,以及Beowulf Linux集群上的性能和可伸缩性结果。 引用于三文件 MSC公司: 68单位99 计算方法和应用 68甲19 其他编程范式(面向对象、顺序、并发、自动等) 关键词:线性解算器;非核心解算器;LU因子分解;数字图书馆 软件:EISPACK公司;PUMMA公司;线性代数库;太阳能;POOCLAPACK系列;LAPACK公司;PLAPACK系列;BLAS公司 PDF格式BibTeX公司 XML格式引用 \textit{E.D'Azevedo}和\textit{J.Dongarra},并发实践。实验12,第15号,1481--1493(2001;Zbl 1008.68577) 全文: 内政部 参考文献: [1] Berry,《物理评论快报》82(1999)·doi:10.1103/PhysRevLett.82.1871 [2] Jaeger,等离子体物理学7(2000) [3] Jaeger,《等离子体物理学》,第7页,第3319页–(2000年)·数字对象标识代码:10.1063/1.874197 [4] Cwik,《美国光学学会杂志》A 11(1994)·doi:10.1364/JOSAA.11.001538 [5] Demkowicz,《应用力学与工程中的计算机方法》(1992) [6] 耿,《声音与振动杂志》191(1996)·Zbl 1232.76033号 ·doi:10.1006/jsvi.1996.0111 [7] Semeraro,《边界元工程分析》19(1997)·doi:10.1016/S0955-7997(97)00026-X [8] 傅,国际工程数值方法杂志42(1998)·Zbl 0904.73072号 ·doi:10.1002/(SICI)1097-0207(19980815)42:7<1215::AID-NME406>3.0.CO;2-5 [9] 一组并行基本线性代数子程序的建议。技术报告CS-95-292,田纳西州诺克斯维尔田纳西大学,1995年5月(也可作为LAPACK工作注释#100获得)。 [10] Choi,《并行:实践与经验》,第8页,517页–(1996年)·doi:10.1002/(SICI)1096-9128(199609)8:7<517::AID-CPE226>3.0.CO;2瓦 [11] 块循环分解的算法重分布方法。田纳西大学博士论文,田纳西州诺克斯维尔,1996年(也可作为LAPACK工作注释#128和#133获得)。 [12] 二维基本线性代数通信子程序。技术报告CS-91-138,田纳西州诺克斯维尔田纳西大学,1991年(也可作为LAPACK工作注释#37获得)。 [13] 二维基本线性代数通信子程序。并行科学计算的环境和工具,第6卷。爱思唯尔科学出版社,1993年;31-40. [14] 负载平衡LU和QR因子,解决具有可伸缩I/O的可伸缩处理器的例程。第17届IMACS世界大会论文集,1994年。 [15] 剖析并行核心外密集线性解算器。《国际并行处理会议记录》,1995年。 [16] 英特尔并行超级计算机上的核心外密集解算器。第四届大规模并行计算前沿研讨会论文集,1992年;484 [17] 并行I/O和求解非核心线性方程组。1993年DAGS/PC研讨会论文集,达茅斯高级研究生研究所,1993年;123 [18] POOCLAPACK:并行核心外线性代数包。技术报告99-33,德克萨斯大学计算机科学系,德克萨斯州奥斯汀,1999年(也可作为PLAPACK工作注释#10获得)。 [19] Dongarra,《计算机与数学及其应用》,第35页,第13页–(1998年)·Zbl 1010.68539号 ·doi:10.1016/S0898-1221(98)00029-7 [20] 部分旋转LU分解中的参考位置。技术报告RC 20344(1996年1月19日),IBM研究部,T.J.Watson研究中心,纽约约克敦高地,1996年。 [21] ScaLAPACK LU、QR和Cholesky因式分解例程的设计和实现。技术报告ORNL/TM-12470,橡树岭国家实验室,1994年。 [22] SOLAR的设计和实现,这是一个可扩展的核心外线性代数计算的便携式库。IOPADS第四届并行和分布式I/O年度研讨会,ACM出版社,1996年;28-40. 此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。