×

分布式内存并发计算机上的并行矩阵转置算法。 (英语) Zbl 0874.68129号

摘要:本文描述了分布式内存并发处理器上的并行矩阵转置算法。我们假设矩阵分布在具有块循环数据分布的Q处理器模板上。P、 Q,并且块大小可以是任意的,因此算法具有广泛的适用性。这些算法的通信方案由P和Q的最大公约数(GCD)决定。如果P和Q是相对素数,则矩阵转置算法涉及完全交换通信。如果P和Q不是相对素数,则处理器被划分为GCD组,不同处理器组的通信操作重叠。处理器同时转置GCD包裹的对角块,矩阵可以用LCM/GCD步骤转置,其中LCM是P和Q的最小公共倍数。算法利用处理器之间的非阻塞点对点通信。非阻塞通信的使用允许处理器重叠发送给不同处理器的消息,从而避免不必要的同步。结合矩阵乘法例程,C类=A类\(\cdot\)B类,这些算法用于计算转置矩阵的并行乘法,C类=A类\(^{T}\cdot\)B类\(^{T}\),在PUMMA包中。给出了算法的并行实现细节,并给出了在Intel Touchstone Delta计算机上运行的结果。

MSC公司:

68宽10 计算机科学中的并行算法
68M99型 计算机系统组织
65英尺30英寸 其他矩阵算法(MSC2010)
2005年5月 并行数值计算
65岁10岁 特定类别建筑的数值算法

软件:

PUMMA公司
PDF格式BibTeX公司 XML格式引用
全文: 内政部