×

前缀计算中块递归矩阵乘法的并行化。 (英语) Zbl 1172.68413号

Christian Bischof等人,《并行计算:体系结构、算法和应用》。根据2007年9月4日至7日在德国亚琛举行的国际并行计算会议(ParCo 2007)上的演示文稿选出的论文。阿姆斯特丹:IOS出版社(ISBN 978-1-58603-796-3/hbk)。并行计算进展15,175-184(2008)。
摘要:我们对量子控制问题中一系列矩阵乘法的并行化进行了性能和可伸缩性研究。作为一个时间关键型子任务,必须计算矩阵(a_1,dots,a_m)的所有矩阵乘积(a_1\cdots a_k)(前缀问题)。并行化可以是粗粒度的,其中并行前缀计算用于并发执行单个矩阵乘法;然而,也有明显的细粒度并行化方法来并行化随后的矩阵乘法,并且这两种主要方法可以混合使用。我们比较了两种基于块结构的并行乘法算法——SRUMMA和一种基于Peano空间填充曲线的改进的块递归方法——并研究了它们在具有128个处理器的计算集群上的效率。事实证明,Peano方法特别适用于中等大小的矩阵。因此,我们比较了Peano算法在粗粒度、细粒度和混合并行前缀问题上的性能。皮诺算法被证明是可扩展的,足以实现前缀问题的纯细粒度并行化。
有关整个系列,请参见[兹比尔1149.68004].

MSC公司:

68N20型 编译与解释理论
68宽10 计算机科学中的并行算法
PDF格式BibTeX公司 XML格式引用