第6卷第7期p。543-570
文章

Pumma:分布式内存并发计算机上的并行通用矩阵乘法算法

蔡杰永,

数学科学部橡树岭国家实验室橡树岭,田纳西州37831-6367,美国

搜索此作者的更多论文
大卫W。散步的人,

数学科学部橡树岭国家实验室橡树岭,田纳西州37831-6367,美国

搜索此作者的更多论文
杰克J。唐加拉,

田纳西大学计算机科学系,田纳西州诺克斯维尔,田纳西州37996-1301,美国

搜索此作者的更多论文
首次出版:1994年10月
引文:70

摘要

本文描述了分布式内存并发计算机上的并行通用矩阵乘法算法(PUMMA)。PUMMA包不仅包括非转置矩阵乘法例程C=AB、 也包括转置乘法例程C=ATB、 C=ABT,且C=ATBT,用于块循环数据分布。对于各种处理器配置和块大小,这些例程都能有效地执行。PUMMA一起提供了与3级BLAS例程xGEMM相同的功能。文中给出了这些例程的并行实现细节,并给出了在英特尔Touchstone Delta计算机上运行的结果。

由于技术上的困难,本文的全文无法在iucr.org上找到。