短纸

免费访问

iSpLib：一个使用自动调整稀疏运算加速图形神经网络的库

作者：
Saidul Hoque Anik先生

美国印第安纳州布卢明顿印第安纳大学智能系统工程系

美国印第安纳州布卢明顿印第安纳大学智能系统工程系

0000-0001-9573-4581
查看个人资料

,
普拉纳夫·巴德

美国印第安纳州布卢明顿印第安纳大学智能系统工程系

美国印第安纳州布卢明顿印第安纳大学智能系统工程系

0009-0007-4053-5850
查看个人资料

,
罗希特·甘帕

美国印第安纳州布卢明顿印第安纳大学智能系统工程系

美国印第安纳州布卢明顿印第安纳大学智能系统工程系

0009-0008-2877-8427
查看个人资料

,
阿里夫·阿扎德

美国印第安纳州布卢明顿印第安纳大学智能系统工程系

美国印第安纳州布卢明顿印第安纳大学智能系统工程系

0000-0003-1332-8630
查看个人资料

作者信息和声明

WWW’24：ACM 2024年网络会议相关会议记录2024年5月第778–781页https://doi.org/10.1145/3589335.3651528

出版：2024年5月13日出版历史

WWW’24：ACM 2024年网络会议相关会议记录

第778–781页

摘要

图神经网络（GNN）训练和推理中的核心计算通常映射到稀疏矩阵运算，例如稀疏密集矩阵乘法（SpMM）。这些稀疏操作很难通过手动调整进行优化，因为它们的性能在很大程度上取决于输入图、GNN模型和计算平台的稀疏性。为了应对这一挑战，我们提出了iSpLib，这是一个基于PyTorch的C++库，配备了自动调整的稀疏操作。iSpLib通过支持缓存的反向传播（backpropagation）加速了GNN培训，该反向传播将中间矩阵存储在本地缓存中。该库提供了一个用户友好的Python插件，使用户可以利用我们的优化PyTorch操作，即用即用，只需两行额外代码即可实现任何现有的基于线性代数的流行GNN（图形卷积网络、图形SAGE、图形推理网络等）的PyTorch实现。我们证明，与CPU上等效的PyTorch 2.1.0和PyTorch Geometric 2.4.0实现相比，iSpLib的总体训练速度提高了27倍。我们的图书馆在\hrefhttps://github.com/HipGraph/iSpLib https://github.com/HipGraph/iSpLib网站\脚注\hrefhttps://doi.org/10.5281/zenodo.10806511 https://doi.org/10.5281/zenodo.10806511 .

补充材料

5733.mp4马力

补充视频

英里4

34.3 MB

下载

工具书类

岑玉国、侯振宇、王燕、陈启斌、罗益珍、姚兴成、曾敖涵、郭世光、张鹏、戴国浩等，2021年。CogDL：用于深入学习图形的广泛工具包。arXiv预印本arXiv:2103.00959，第7卷，第8卷（2021）。谷歌学者
马蒂亚斯·费伊（Matthias Fey）和简·埃里克·伦森（Jan Eric Lenssen）。2019.使用PyTorch Geometric快速学习图形表示。arXiv预印arXiv:1903.02428（2019）。谷歌学者
威尔·汉密尔顿（Will Hamilton）、应志涛（Zhitao Ying）和朱尔·莱斯科维奇（Jure Leskovec）。2017年。大型图形的归纳表示学习。神经信息处理系统进展，第30卷（2017年）。谷歌学者
胡玉伟、叶子浩、王敏杰、于佳丽、大正、穆丽、张正、张志如和王毅达。2020年。特征图：图形神经网络系统的灵活高效后端。SC20：高性能计算、网络、存储和分析国际会议。IEEE，1-13。谷歌学者交叉引用
托马斯·基普夫（Thomas N Kipf）和马克斯·威林（Max Welling）。2016.图卷积网络半监督分类。arXiv预印arXiv:1609.02907（2016）。谷歌学者
达米莎·莱纳多拉（Damitha Lenadora）、维马什·萨提亚（Vimarsh Sathia）、杰拉西莫斯·格罗吉安尼斯（Gerasimos Gerogannis）、塞里夫·耶西尔（Serif Yesil）、约塞普·托雷拉斯（Josep Torrellas）和查里。2023.GNN加速的输入敏感密集稀疏基本成分。arXiv预印arXiv:2306.15155（2023）。谷歌学者
邱胜浩、梁佑、王征。2021.优化图神经网络的稀疏矩阵乘法。在并行计算语言和编译器国际研讨会上。施普林格，101-117。谷歌学者
Khaledur Rahman先生、Majedul Haque Sujon和Ariful Azad。FusedMM：用于图形嵌入和图形神经网络的统一sddmm-spmm内核。2021年IEEE国际并行和分布式处理研讨会（IPDPS）。IEEE，256-266。谷歌学者交叉引用
锈迹斑斑。[编号，日期]。GitHub-rusty1s/pytorch_sparse:优化Autograd稀疏矩阵操作的pytorch扩展库。https://github.com/rusty1/pytorch_sparse谷歌学者
王敏杰。2019.深度图形库：实现高效、可扩展的图形深度学习。在ICLR关于图和流形表示学习的研讨会上。谷歌学者
Xu Keyyulu、Hu Weihua、Jure Leskovec和Stefanie Jegelka。2018年。图形神经网络的功能有多强大？arXiv预印arXiv:1810.00826（2018）。谷歌学者
叶子浩、赖瑞航、邵俊茹、陈天奇和吕塞泽。2023.SparseTIR：深度学习中稀疏编译的可组合抽象。第28届ACM编程语言和操作系统体系结构支持国际会议论文集，第3卷。660--678.谷歌学者数字图书馆

索引术语

iSpLib:一个使用自动调整稀疏运算加速图神经网络的库

建议

MaxK-GNN：用于加速图形神经网络训练的极快GPU内核设计
ASPLOS’24：第29届ACM编程语言和操作系统体系结构支持国际会议记录，第2卷

在加速深度神经网络训练方面，图形处理单元（GPU）已成为主流平台。GPU在图形神经网络（GNN）上面临着巨大的挑战，例如工作负载不平衡和内存访问不规则。。。
阅读更多信息
基于NMF的深度神经网络方法加速反向传播算法
智能系统的知识管理和获取
摘要
反向传播（BP）是深度神经网络（DNN）训练中使用最广泛的算法，也是事实上的标准算法。然而，BP算法通常需要大量的计算时间，这仍然是一个主要问题。。。
阅读更多信息
使用多个图形处理单元加速迭代线性解算器

在本文中，我们使用多个图形处理单元GPU开发、研究和实现了迭代线性解算器和预处理器。加速稀疏矩阵-向量SpMV乘法、线性解算器和预条件器的技术。。。
阅读更多信息

登录选项

检查您是否可以通过登录凭据或您的机构访问本文。

完全访问权限

获取此出版物

发布于
WWW’24：ACM 2024年网络会议相关会议记录
2024年5月
1928页
国际标准图书编号：9798400701726
内政部：10.1145/3589335
总主席：
大圣蔡
新加坡国立大学
,
Chong-Wah Ngo村
新加坡管理大学
,
会议主席：
罗伊·卡韦·李
新加坡科技与设计大学
,
课程主席：
拉维库玛
谷歌
,
哈迪·W·劳
新加坡管理大学
版权所有©2024 ACM
如果复制品不是为了盈利或商业利益而制作或分发的，并且复制品的第一页载有本通知和完整引文，则允许免费制作本作品的全部或部分数字或硬拷贝以供个人或课堂使用。必须尊重作者以外的其他人对本作品组成部分的版权。允许用信用证进行摘要。要以其他方式复制或重新发布，在服务器上发布或重新发布到列表，需要事先获得特定许可和/或付费。从请求权限[电子邮件保护].
赞助商
合作中
出版商
计算机协会
美国纽约州纽约市
出版历史
- 出版：2024年5月13日
权限
请求有关此文章的权限。
请求权限

检查更新
徽章
- 可用工件/v1.1
作者标记
自动识别
自整定
反向传播
图形神经网络
并行计算
稀疏稠密矩阵乘法
限定符
- 短纸
会议

接受率
总体验收率1,899属于8,196提交文件，23%
资金来源
其他指标
查看文章指标

文章指标
- 0
  引文总数
  查看引文
- 32
  总下载次数
- 下载次数（过去12个月）32
- 下载次数（最近6周）32
其他指标
查看作者指标
引用人
本出版物尚未被引用

PDF格式

以PDF文件查看或下载。

PDF格式

电子阅读器

使用eReader联机查看。

电子阅读器

iSpLib：一个使用自动调整稀疏运算加速图形神经网络的库

WWW’24：ACM 2024年网络会议相关会议记录

摘要

补充材料

工具书类

引用人

索引术语

建议

MaxK-GNN：用于加速图形神经网络训练的极快GPU内核设计

基于NMF的深度神经网络方法加速反向传播算法

使用多个图形处理单元加速迭代线性解算器

评论