×

cuTT公司

swMATH ID: 19961
软件作者: Antti-Pekka Hynninen,Dmitry I.Lyakh
描述: cuTT:用于CUDA兼容GPU的高性能张量转置库。我们介绍了CUDA张量转置(cuTT)库,该库使用开普勒及以上体系结构为NVIDIA GPU实现高性能张量转位。cuTT通过(a)使用两个GPU优化的转置算法实现了高性能,这两个算法都使用共享内存缓冲区以减少全局内存访问分散,以及(b)使用线程并行算法计算张量元素的内存位置。我们在张量秩从2到12的各种基准上评估了cuTT的性能,并表明cuTT性能与张量秩次无关,并且它的性能并不比基于代码生成的方法差。我们通过实现一个分析性GPU性能模型,开发了一个启发式方案,用于选择张量转置算法的最佳参数,该模型可以在运行时使用,而无需进行性能测量或分析。最后,通过将cuTT集成到张量代数库TAL-SH中,我们显著减少了张量收缩中的张量转置开销,使算术密集型张量收缩的开销低至1%。
主页: https://arxiv.org/abs/1705.01598
相关软件: TTC公司;袖口;FFTW公司;CUDA公司
引用于: 0个文档