克里斯托夫·沃尔梅尔;斯坦尼米尔·托莫夫;杰克·东加拉 在混合GPU加速多核系统上进行分而治之。 (英语) Zbl 1248.65041号 SIAM J.科学。计算。 34,第2号,C70-C82(2012). 摘要:随着图形处理单元(GPU)的原始计算能力在商品多核系统中越来越广泛地可用,迫切需要将其能力用于重要的数字库,如LAPACK。在这篇文章中,我们考虑了在这种现代异质系统上用LAPACK分治算法求解稠密对称和厄米特特征问题。我们的重点是如何充分利用大规模并行多核GPU和多核CPU的各自优势。由此产生的算法克服了当前针对同质多核进行优化的实现所面临的性能瓶颈。在配备NVIDIA GTX 280 GPU的双插槽四核Intel Xeon 2.33 GHz处理器上,对于完全密集的问题,我们通常可以获得大约十倍的性能提升。因此,这里描述的技术代表了如何开发数值软件以有效使用异构体系结构的示例。随着异构性在架构设计中变得越来越常见,这项工作的重要性和需求预计会增加。 MSC公司: 2015财年65 矩阵特征值和特征向量的数值计算 2005年5月 并行数值计算 关键词:对称特征值问题;LAPACK公司;性能;多芯;混合体系结构;异构计算;并行计算;数值示例;图形处理单元(GPU);分治算法 软件:血浆;TAU公司;算法880;岩浆;SBR工具箱;LAPACK公司;CUDA公司;线性代数库 PDF格式BibTeX公司 XML格式引用 \textit{C.Vömel}等人,SIAM J.Sci。计算。34,第2号,C70-C82(2012;Zbl 1248.65041) 全文: 内政部