造币厂

Mint:用带注释的C在3D模板方法中实现CUDA的性能。我们提出了Mint,一个编程模型,使非专家可以享受手工编码的CUDA的性能优势,而不必纠结于细节。铸币厂的目标模具方法,这是一个重要的科学应用类。我们已经用一个源到源代码转换器实现了Mint编程模型,它从传统的C源代码生成优化的cudac。译者依靠注释来指导高水平的翻译。杂注集小,模型简洁。然而,Mint能够提供与精心手工优化的CUDA相竞争的性能。我们发现,对于一组广泛使用的模板内核,Mint在200系列NVIDIA gpu上实现了从积极优化的CUDA获得的80%的性能。我们的优化针对的是三维内核,它提供了一系列令人生畏的优化。

这个软件也是同行评审按日记帐汤姆斯.


zbMATH中的参考文献(参考文献6条)

显示结果1到6,共6个。
按年份排序(引用)

  1. 阿赫塔尔,穆罕默德·纳维德;杜拉德、穆罕默德·哈尼夫;乌斯曼,安妮拉;Mughal,Muhammad Abid:在GPU上求解3D Laplace方程的有效内存访问模式(2018)
  2. 卢瑟,大卫J。;杰米,萨蒂娅P。;Sandham,Neil D.:自动源代码生成框架OpenSBLI中的激波/边界层交互作用(2018)
  3. 张伟群;阿尔格伦,安;白天,马库斯;阮、谭;沙尔夫,约翰;Unat,Didem:BoxLib with Tilling:自适应网格细化软件框架(2016)ioport公司
  4. 马拉斯,T。;黑格。;L taief,H。;斯坦格尔,H。;韦林,G。;Keyes,D.:用于优化模板更新的多核优化波前菱形块(2015)
  5. 莫铁强;Li,Renfa:GPGPU模板计算的新内存映射机制(2015)
  6. 阮、谭;赫芬布洛克,丹尼尔;奥伯格,杰森;卡斯特纳,瑞安;Baden,Scott:一种基于软件的动态翘曲调度方法GPU上的Viola-Jones人脸检测算法(2013)ioport公司