研究论文

在GPU上解决索引数字算法的大问题：FFT和三对角系统解算器

作者：
阿德里安·佩雷斯·迪格斯

西班牙科鲁尼亚科鲁尼亚大学计算机架构小组

西班牙科鲁尼亚科鲁尼亚大学计算机架构小组
查看个人资料

,
玛格丽塔·阿莫尔

西班牙科鲁尼亚科鲁尼亚大学计算机架构小组

西班牙科鲁尼亚科鲁尼亚大学计算机架构小组
查看个人资料

,
雅各布·洛贝拉斯

西班牙科鲁尼亚科鲁尼亚大学计算机架构小组

西班牙科鲁尼亚科鲁尼亚大学计算机架构小组
查看个人资料

,
拉蒙·多亚洛

西班牙科鲁尼亚科鲁尼亚大学计算机架构小组

西班牙拉科鲁尼亚拉科鲁尼亚大学计算机体系结构集团
查看个人资料

电气电子工程师学会计算机期刊第67卷第1版2018年1月第86–101页https://doi.org/10.109/TC.2017.2723879

出版：2018年1月1日出版历史

电气电子工程师学会计算机期刊

摘要

当前图形处理单元（GPU）能够在科学应用中获得高计算性能。然而，程序员必须为这些体系结构使用合适的并行算法，并且通常必须在实现中考虑优化技术，以实现所述性能。对于直接适用于CUDA GPU共享内存的有限大小问题，有许多有效的建议，但是，很少有GPU建议能够针对超过共享内存存储容量的大问题设计高效算法。在这项工作中，我们提出了一种调优策略，用于解决一些并行前缀算法的这个问题，这些算法可以根据其每个元素索引[1]的数字的一组公共排列来表示，表示为Index-Digit（ID）算法。具体来说，我们的策略已被应用于为快速傅里叶变换（FFT）算法开发灵活的多级（MS）算法(MS-ID-英尺)和三对角系统解算器(MS-ID-TS公司)在GPU上。由此产生的实现结构紧凑，性能优于其他著名和常用的最先进的库，在以下方面的性能提高了1.47倍NVIDIA的复杂的袖口，与相比高达33.2倍NVIDIA的 海关对于实际数据三对角系统。

索引术语

在GPU上解决索引数字算法的大问题：FFT和三对角系统解算器

索引项已通过自动分类分配给内容。

建议

有效的CPU-GPU协同计算解决subs-t-sum问题

异构CPU-GPU系统是加速计算密集型应用程序的一种强有力的方法，例如subs-t-sum问题。许多用于解决该问题的并行算法已经在图形处理单元GPU上实现。然而，这些GPU。。。
阅读更多信息
为CUDA GPU体系结构设计高效的索引数字算法

现代图形处理单元（GPU)以相对较低的成本提供非常高的计算能力。然而，为GPU（全球生产单位）通常需要额外的时间和精力，即使对于经验丰富的程序员来说也是如此。在这项工作中，我们。。。
阅读更多信息
线性指派问题的GPU加速匈牙利算法

线性分配是运筹学中最基本的问题之一。在GPU集群上对匈牙利式算法进行了创造性的并行化。增强路径搜索步骤的高效并行化。16亿的大问题。。。
阅读更多信息

登录选项

检查您是否可以通过登录凭据或您的机构访问本文。

完全访问权限

获取此文章

其他指标
查看文章指标

文章指标
- 6
  引文总数
  查看引文
- 0
  总下载次数
- 下载次数（过去12个月）0
- 下载次数（最近6周）0
其他指标
查看作者指标
引用人
查看全部

在GPU上解决索引数字算法的大问题：FFT和三对角系统解算器

电气电子工程师学会计算机期刊

摘要

引用人

索引术语

建议

有效的CPU-GPU协同计算解决subs-t-sum问题

为CUDA GPU体系结构设计高效的索引数字算法

线性指派问题的GPU加速匈牙利算法

评论

登录选项

完全访问权限

发布于

赞助商

合作中

出版商

出版历史

限定符

会议

资金来源

其他指标

文章指标

其他指标

引用人

数字版

解说词

在GPU上解决索引数字算法的大问题：FFT和三对角系统解算器

电气电子工程师学会计算机期刊

摘要

引用人

索引术语

建议

有效的CPU-GPU协同计算解决subs-t-sum问题

为CUDA GPU体系结构设计高效的索引数字算法

线性指派问题的GPU加速匈牙利算法

评论

登录选项

完全访问权限

发布于

赞助商

合作中

出版商

出版历史

限定符

会议

资金来源

文章指标

其他指标

数字版

共享此出版物链接

在社交媒体上分享