×

在混合GPU加速多核系统上进行分而治之。 (英语) Zbl 1248.65041号

摘要:随着图形处理单元(GPU)的原始计算能力在商品多核系统中越来越广泛地可用,迫切需要将其能力用于重要的数字库,如LAPACK。在这篇文章中,我们考虑了在这种现代异质系统上用LAPACK分治算法求解稠密对称和厄米特特征问题。我们的重点是如何充分利用大规模并行多核GPU和多核CPU的各自优势。由此产生的算法克服了当前针对同质多核进行优化的实现所面临的性能瓶颈。在配备NVIDIA GTX 280 GPU的双插槽四核Intel Xeon 2.33 GHz处理器上,对于完全密集的问题,我们通常可以获得大约十倍的性能提升。因此,这里描述的技术代表了如何开发数值软件以有效使用异构体系结构的示例。随着异构性在架构设计中变得越来越常见,这项工作的重要性和需求预计会增加。

MSC公司:

2015财年65 矩阵特征值和特征向量的数值计算
2005年5月 并行数值计算
PDF格式BibTeX公司 XML格式引用
全文: 内政部