TTC公司 swMATH ID: 15828 软件作者: 保罗·斯普林格(Paul Springer)、阿拉文德·桑卡兰(Aravind Sankaran)、保罗·比安蒂内西(Paolo Bientinesi) 描述: TTC:一个用于多种体系结构的张量变换编译器。我们考虑了任意维度张量的换位问题,并描述了TTC,一个开源的领域专用并行编译器。TTC生成优化的并行C++/CUDA C代码,实现了系统峰值内存带宽的很大一部分。TTC在多个体系结构中表现出高性能,包括基于现代AVX的系统(如Intel Haswell、AMD Steamroller)、Intel的Knights Corner以及不同的基于CUDA的GPU,如NVIDIA的开普勒和Maxwell体系结构。我们报告了TTC在由外部C++编译器生成的有意义的基线实现上的加速;结果表明,特定于域的编译器可以显著优于通用编译器:例如,与基于Haswell和Knights Corner体系结构的英特尔最新C++编译器相比,TTC的加速比分别高达8倍和32倍。我们还展示了TTC对多个领先维度的支持,使其成为生成性能关键型封装函数的合适候选者,这些函数是无处不在的BLAS 3例程的核心。 主页: http://arxiv.org/abs/1607.01249 关键词: 张量转置编译器;编译器 相关软件: BLIS公司;高功率晶体管;算法862;张量工具箱;P3DFFT公司;FFTW公司;CUDA公司;MKL公司;坦索拉布;MADNESS公司;艾根;TensorFlow公司;铜DNN;8月;算法679;爆破;自旋求和;首席财务官;袖口;立方英尺 引用于: 6文件 标准条款 1出版物描述软件,包括1出版物以zbMATH为单位 年份 TTC:张量转置的高性能编译器。 Zbl 1484.68045号保罗·施普林格;杰夫·哈蒙德。;Paolo Bientinesi,保罗 2017 全部的 前5名9位作者引用 4 Paolo Bientinesi,保罗 三 马修斯,Devin A。 三 保罗·施普林格 1 Rasmus兄弟 1 杰夫·哈蒙德。 1 黄建宇 1 拉尔斯·卡尔森 1 克里斯托斯·帕萨拉斯 1 范德盖恩,罗伯特·亚历山大 2篇连载文章中引用 4 ACM数学软件汇刊 2 SIAM科学计算杂志 在4个字段中引用 6 数值分析(65-XX) 三 线性代数和多线性代数;矩阵理论(15-XX) 1 计算机科学(68至XX) 1 量子理论(81-XX) 按年份列出的引文