跳到主要内容
研究论文

在GPU上解决索引数字算法的大问题:FFT和三对角系统解算器

出版:2018年1月1日出版历史
跳过抽象节

摘要

当前图形处理单元(GPU)能够在科学应用中获得高计算性能。然而,程序员必须为这些体系结构使用合适的并行算法,并且通常必须在实现中考虑优化技术,以实现所述性能。对于直接适用于CUDA GPU共享内存的有限大小问题,有许多有效的建议,但是,很少有GPU建议能够针对超过共享内存存储容量的大问题设计高效算法。在这项工作中,我们提出了一种调优策略,用于解决一些并行前缀算法的这个问题,这些算法可以根据其每个元素索引[1]的数字的一组公共排列来表示,表示为Index-Digit(ID)算法。具体来说,我们的策略已被应用于为快速傅里叶变换(FFT)算法开发灵活的多级(MS)算法(MS-ID-英尺)和三对角系统解算器(MS-ID-TS公司)在GPU上。由此产生的实现结构紧凑,性能优于其他著名和常用的最先进的库,在以下方面的性能提高了1.47倍NVIDIA的复杂的袖口,与相比高达33.2倍NVIDIA的 海关对于实际数据三对角系统。

索引术语

  1. 在GPU上解决索引数字算法的大问题:FFT和三对角系统解算器
        索引项已通过自动分类分配给内容。

        建议

        评论

        登录选项

        检查您是否可以通过登录凭据或您的机构访问本文。

        登录

        完全访问权限

        • 发布于

          封面图片IEEE计算机汇刊
          电气电子工程师学会计算机期刊 第67卷第1期
          2018年1月
          143页
          国际标准编号:0018-9340
          期刊目录

          版权所有©2018

          出版商

          IEEE计算机学会

          美国

          出版历史

          • 出版:2018年1月1日

          限定符

          • 研究论文