A Scalable and Energy Efficient GPU Thread Map for m-Simplex Domains

Navarro, Cristóbal A.; Quezada, Felipe A.; Bustos, Benjamin; Hitschfeld, Nancy; Kindelan, Rolando

计算机科学>分布式、并行和集群计算

arXiv:2208.11617（cs）

【于2022年8月24日提交(第1版)，最新修订日期：2022年9月12日（本版本，第3版）]

标题：一种适用于m-Simplex域的可扩展且节能的GPU线程映射

作者：克里斯托巴尔·纳瓦罗,菲利佩·克扎达,本杰明·布斯托斯,南希·希施费尔德,罗兰多·金德兰

查看PDF

摘要：这项工作为$m$-simplex域提出了一种新的GPU线程映射，它可以根据维度调整其加速比，并且与其他最先进的方法相比，它具有节能性。这项工作的主要贡献是：i）针对正则正交单形域建立了新的块空间映射$\mathcal{H}:\mathbb{Z}^m\mapsto\mathbb{Z}^m$，并从资源使用的角度进行了分析，以及ii）根据边界盒方法的加速比和能量效率（单位为每秒瓦特的元件数）进行的实验评估。分析结果表明，$\mathcal{H}$对$2$和$3$-simples的潜在加速比分别为$2倍$和$6倍$。实验评估表明，$\mathcal{H}$对于$2$-simples具有竞争力，对于不同的测试，其加速比达到$1.2\倍\sim2.0\倍，这与最快的最新方法不相上下。对于$3$-simplices$\mathcal{H}$，它的加速比达到$1.3\倍\sim6.0\倍$，是所有加速比中最快的。将$\mathcal{H}$扩展到更高维的$m$-simplices是可行的，并且具有潜在的加速能力，可以扩展到$m！$给出了参数$r和\beta$的正确选择，它们分别是缩放因子和复制因子。就能耗而言，尽管$\mathcal{H}$是能耗最高的产品之一，但它的持续时间很短，因此是最节能的方法之一。最后，分析了Tensor和Ray Tracing Cores的进一步改进，给出了利用它们的见解。这项工作的结果表明，$\mathcal{H}$是一个可扩展且节能的映射，当GPU应用程序需要处理$m$-simplex域（如元胞自动机或PDE模拟）时，它可以提高GPU应用的效率。

评论：	13页
学科：	分布式、并行和集群计算（cs.DC）; 离散数学（cs.DM）
引用为：	arXiv:2208.11617[cs.DC]
	（或 arXiv:2208.11617v3[直流电]对于此版本）
	https://doi.org/10.48550/arXiv.2208.11617

提交历史记录

发件人：Cristobal A.Navarro[查看电子邮件]
[第1版]2022年8月24日星期三15:39:21 UTC（2005 KB）
[版本2]2022年8月26日星期五01:01:40 UTC（2005 KB）
[v3]2022年9月12日星期一12:55:33 UTC（6971 KB）

计算机科学>分布式、并行和集群计算

标题：一种适用于m-Simplex域的可扩展且节能的GPU线程映射

提交历史记录

访问纸张：

参考文献和引文

书签

书目和引文工具

与本文相关的代码、数据和媒体

演示

推荐和搜索工具

arXivLabs：与社区合作者合作的实验项目

计算机科学>分布式、并行和集群计算

标题：一种适用于m-Simplex域的可扩展且节能的GPU线程映射

提交历史记录

访问纸张：

参考文献和引文

BibTeX格式的引文

书签

书目和引文工具

与本文相关的代码、数据和媒体

演示

推荐和搜索工具

arXivLabs：与社区合作者合作的实验项目