×

PoLAPACK系列

swMATH ID: 1596
软件作者: Choi,Jaeyong先生
描述: PoLAPACK:带算法块的并行因式分解例程LU、QR和Cholesky因式分解是求解稠密线性方程组最常用的方法,在向量机和并行计算机上得到了广泛的研究和实现。大多数这些分解例程都是用块分割算法实现的,以便执行矩阵-矩阵运算,也就是说,通过最大限度地重用上层内存(如缓存)中的数据来获得最高性能。由于并行计算机具有不同的计算和通信性能比,因此为了获得算法的最大性能,最佳计算块大小会有所不同。因此,在计算之前,数据矩阵应按机器特定的最佳块大小分布。两个较小或较大的块大小使得在机器上实现良好性能几乎是不可能的。在这种情况下,要获得更好的性能,可能需要对数据矩阵进行完全重新分配。我们提出了并行LU、QR和Cholesky因式分解例程,在二维块循环数据分布上使用“算法块”。使用算法块,无论物理块大小如何,都可以获得接近最佳的性能。这些例程在Intel Paragon和SGI/Cray T3E上实现,并与相应的ScaLAPACK因子分解例程进行了比较
主页: http://onlinelibrary.wiley.com/doi/10.1002/cpe.589/abstract
关键词: Cholesky因子分解;稠密线性方程组
相关软件: PUMMA公司;PLAPACK系列;SUMMA(总结);线性代数库;LAPACK公司;阿特拉斯
引用于: 1文件

1位作者引用

1 Choi,Jaeyong先生

在1个字段中引用

1 计算机科学(68至XX)

按年份列出的引文