推力

推力是一个基于标准模板库(STL)的面向CUDA的C++模板库。通过简单的并行程序设计,可以实现复杂的并行程序设计,从而减少复杂的程序设计难度,可读源代码。通过用这些高级抽象来描述您的计算,您可以让push自由地选择最有效的实现。因此,推力可以用于CUDA应用程序的快速原型设计(程序员的生产力最为重要),以及在健壮性和绝对性能至关重要的生产中。


zbMATH参考文献(51篇文章引用)

显示第1到第20个结果,共51个。
按年份排序(引用)
  1. Auer,Ekaterina;Rauh,Andreas;Kersten,Julia:基于实验的协同系统GPU参数识别(2020)
  2. Berenger Bramas:TBFMM:C++通用并行快速多极方法库(2020)不是zbMATH
  3. Reguly,István Z.;Mudalige,Gihan R.:计算流体力学应用的生产力、性能和可移植性(2020年)
  4. Mojtaba Mozaffar;Ndip Agbor,Ebot;Lin,Stephen;Wagner,Gregory J.;Ehmann,Kornel;Cao,Jian:使用图形处理单元对基于金属粉末的添加剂制造过程进行显式有限元分析的加速策略(2019年)
  5. Tim Besard,Valentin Churavy,Alan Edelman,Bjorn De Sutter:异构和分布式平台的快速软件原型(2019)不是zbMATH
  6. Zaspel,Peter:多核处理器上(\mathcalH)-矩阵的算法模式(2019)
  7. Alan Hylton,Gregory Henselman Petrusek,Janche Sang,Robert Short:调整计算持久同源包的性能(2018)阿尔十四
  8. Gremse,Felix;Küpper,Kerstin;Naumann,Uwe:多核心架构上基于行合并的高效内存稀疏矩阵乘法(2018)
  9. Kikinzon,Evgeny;Shashkov,Mikhail;Garimella,Rao:在多材料单元中建立网格拓扑:稳健和精确多材料模拟的使能技术(2018)
  10. Sweezy,Jeremy E.:用于GPU上全球通量计数的蒙特卡罗体积射线投射估计器(2018)
  11. Zanella,R.;Porta,F.;Ruggiero,V.;Zanetti,M.:通过二阶函数的数值最小化实现图像分割的串行和并行方法(2018年)
  12. Aisa,Mohamed;Verstraete,Tom;Vuik,Cornelis:面向面向GPU的结构化网格显式和隐式CFD模拟比较(2017)
  13. Jambunathan,Revati;Levin,Deborah A.:采用混合MPI-CUDA八叉树DSMC方法模拟多孔介质流动的高级并行化策略(2017)
  14. Li,Ang;Serban,Radu;Negrut,Dan:GPU卡上线性系统并行解的分裂方法分析(2017)
  15. Peter Wittek和Shi Gao、Ik Lim和Li Zhao:somoclu:一个高效的自组织地图并行库(2017)不是zbMATH
  16. Cuvelier,François;Japhet,Caroline;Scarela,Gilles:用向量语言组装有限元矩阵的有效方法(2016)
  17. Rupp,Karl;Tillet,Philippe;Rudolf,Florian;Weinbub,Josef;Morhammer,Andreas;Grasser,Tibor;Jüngel,Ansgar;Selberherr,Siegfried:多核和多核架构的ViennaCL线性代数库(2016)
  18. 《分层空间探索》(Mary Sheel,2016年版);Joensr《并行空间设计》(GPR)中的Mary Sheel,2016年)
  19. 戴尔顿,史蒂文;奥尔森,卢克;贝尔,内森:优化GPU的稀疏矩阵矩阵乘法(2015)
  20. Gorlatch,Sergei;Steuwer,Michel:面向多核系统的高级编程(2015)ioport公司