×

共享内存体系结构上的并行稀疏QR分解。 (英语) Zbl 0875.68281号

摘要:我们讨论了多额叶QR分解的并行共享内存实现。为了实现一般大型稀疏矩阵的高性能,使用了树级和节点级并行的组合。可接受的负载平衡是通过使用任务池方法实现的。为了存储正面矩阵和更新矩阵,我们使用了基于斐波那契块的伙伴系统。事实证明,它比其他作者提出的大小为(2^{i})的块更有效。此外,为更新和正面矩阵分配内存空间的顺序也很重要。所提出的算法在CRAY X-MP/416(四个处理器)上的实现提供了大约三个加速,所需的额外实际内存空间约为20%。

MSC公司:

68N99型 软件理论
68M99型 计算机系统组织

软件:

备用-QR
PDF格式BibTeX公司 XML格式引用
全文: 内政部