用于深度学习的高效SpMM加速器:Sparkle及其自动生成器
摘要
工具书类
建议
HARP:稀疏矩阵乘法加速器的硬件伪调试 MICRO’23:第56届IEEE/ACM微体系结构国际研讨会论文集 由于使用的压缩格式,通用稀疏矩阵矩阵乘法(SpGEMM)是一种内存绑定工作负载。 为了最小化输入矩阵的数据移动,提出了外部产品加速器。 由于这些加速器访问输入。。。 SPADE:用于SpMM和SDDMM的灵活且可扩展的加速器 ISCA’23:第50届计算机体系结构年度国际研讨会论文集 稀疏矩阵密集矩阵乘法(SpMM)和采样密集矩阵密集矩阵乘法(SDDMM)内核的广泛使用使它们成为硬件加速的候选对象。 然而,这些内核的加速器设计面临两个主要问题。。。
评论
信息和贡献者
问询处
发布于
出版商
出版历史记录
检查更新
作者标记
限定符
研究文章