×

分布式内存并发计算机上的一种新的并行矩阵乘法算法。 (英语) Zbl 0903.68088号

摘要:我们提出了一种新的快速可扩展的矩阵乘法算法,称为DIMMA(分布式无关矩阵乘法),用于分布式内存并发计算机上的块循环数据分发。该算法基于两种新思想;它使用一种改进的流水线通信方案来有效地重叠计算和通信,并利用LCM块概念来获得每个处理器中顺序BLAS(基本线性代数子程序)例程的最大性能,即使块大小非常小或非常大。在Intel Paragon计算机上实现了该算法,并与SUMMA进行了比较。

MSC公司:

68宽10 计算机科学中的并行算法
68米99 计算机系统组织
PDF格式BibTeX公司 XML格式引用
全文: 内政部