×

通信优化并行和顺序QR和LU分解。 (英语) Zbl 1241.65028号

摘要:我们提出了并行和顺序密集QR分解算法,它们在执行的通信量方面都是最优的(多达多对数因子),并且与Householder QR一样稳定。我们通过推导“非Strassen-like”QR乘法次数的新下界,并将其用于与乘法次数成比例的已知通信下界,来证明最优性。我们不仅证明了我们的QR算法达到了这些下限(高达多对数因子),而且现有的LAPACK和ScaLAPACKs算法执行了渐近更多的通信。我们推导了LU因子分解的类似通信下界,并指出了文献中最近的LU算法,这些算法至少达到了其中的一些下界。高矩阵和瘦矩阵的顺序和并行QR算法在实践中比一些现有算法(包括LAPACK和ScaLAPACK)有显著的加速,例如,比ScaLAPACK高达6.7倍。通用矩形矩阵并行算法的性能模型预测了ScaLAPACK的显著加速。

MSC公司:

65平方英尺 线性系统和矩阵反演的直接数值方法
第65年 并行数值计算
65岁20岁 数值算法的复杂性和性能
15A23型 矩阵的因式分解
65层25 数值线性代数中的正交化
65层20 超定系统伪逆的数值解
PDF格式BibTeX公司 XML格式引用