计算机科学>分布式、并行和集群计算
标题: 一种适用于m-Simplex域的可扩展且节能的GPU线程映射
摘要: 这项工作为$m$-simplex域提出了一种新的GPU线程映射,它可以根据维度调整其加速比,并且与其他最先进的方法相比,它具有节能性。 这项工作的主要贡献是:i)针对正则正交单形域建立了新的块空间映射$\mathcal{H}:\mathbb{Z}^m\mapsto\mathbb{Z}^m$,并从资源使用的角度进行了分析, 以及ii)根据边界盒方法的加速比和能量效率(单位为每秒瓦特的元件数)进行的实验评估。 分析结果表明,$\mathcal{H}$对$2$和$3$-simples的潜在加速比分别为$2倍$和$6倍$。 实验评估表明,$\mathcal{H}$对于$2$-simples具有竞争力,对于不同的测试,其加速比达到$1.2\倍\sim2.0\倍,这与最快的最新方法不相上下。 对于$3$-simplices$\mathcal{H}$,它的加速比达到$1.3\倍\sim6.0\倍$,是所有加速比中最快的。 将$\mathcal{H}$扩展到更高维的$m$-simplices是可行的,并且具有潜在的加速能力,可以扩展到$m!$ 给出了参数$r和\beta$的正确选择,它们分别是缩放因子和复制因子。 就能耗而言,尽管$\mathcal{H}$是能耗最高的产品之一,但它的持续时间很短,因此是最节能的方法之一。 最后,分析了Tensor和Ray Tracing Cores的进一步改进,给出了利用它们的见解。 这项工作的结果表明,$\mathcal{H}$是一个可扩展且节能的映射,当GPU应用程序需要处理$m$-simplex域(如元胞自动机或PDE模拟)时,它可以提高GPU应用的效率。