Choi,Jaeyong先生;杰克·多加拉(Jack J.Dongarra)。;大卫·沃克。 分布式内存并发计算机上的并行矩阵转置算法。 (英语) Zbl 0874.68129号 并行计算。 第9期第21期,1387-1405页(1995年). 摘要:本文描述了分布式内存并发处理器上的并行矩阵转置算法。我们假设矩阵分布在具有块循环数据分布的Q处理器模板上。P、 Q,并且块大小可以是任意的,因此算法具有广泛的适用性。这些算法的通信方案由P和Q的最大公约数(GCD)决定。如果P和Q是相对素数,则矩阵转置算法涉及完全交换通信。如果P和Q不是相对素数,则处理器被划分为GCD组,不同处理器组的通信操作重叠。处理器同时转置GCD包裹的对角块,矩阵可以用LCM/GCD步骤转置,其中LCM是P和Q的最小公共倍数。算法利用处理器之间的非阻塞点对点通信。非阻塞通信的使用允许处理器重叠发送给不同处理器的消息,从而避免不必要的同步。结合矩阵乘法例程,C类=A类\(\cdot\)B类,这些算法用于计算转置矩阵的并行乘法,C类=A类\(^{T}\cdot\)B类\(^{T}\),在PUMMA包中。给出了算法的并行实现细节,并给出了在Intel Touchstone Delta计算机上运行的结果。 引用于4文件 MSC公司: 68宽10 计算机科学中的并行算法 68M99型 计算机系统组织 65英尺30英寸 其他矩阵算法(MSC2010) 2005年5月 并行数值计算 65岁10岁 特定类别建筑的数值算法 关键词:线性代数;矩阵转置算法;分布式内存多处理器;点对点通信;英特尔Touchstone Delta 软件:PUMMA公司 PDF格式BibTeX公司 XML格式引用 \textit{J.Choi}等人,《并行计算》。21,第9号,1387--1405(1995;Zbl 0874.68129) 全文: 内政部