推力

推力是一个基于标准模板库(STL)的面向CUDA的C++模板库。通过与CUDA C完全互操作的高级接口,您可以用最少的编程工作量实现高性能的并行应用程序。Thrust提供了丰富的数据并行原语集合,如扫描、排序和缩减,这些元素可以组合在一起,以简洁的方式实现复杂的算法,可读源代码。通过用这些高级抽象来描述您的计算,您可以让push自由地选择最有效的实现。因此,推力可以用于CUDA应用程序的快速原型设计(程序员的生产力最为重要),以及在健壮性和绝对性能至关重要的生产中。


zbMATH中的参考文献(参考 50篇文章 引用)

显示第1到第20个结果,共50个。
按年份排序(引用)
  1. Auer,Ekaterina;Rauh,Andreas;Kersten,Julia:基于实验的协同系统GPU参数识别(2020)
  2. Reguly,István Z.;Mudalige,Gihan R.:计算流体力学应用的生产力、性能和可移植性(2020年)
  3. Mojtaba Mozaffar;Ndip Agbor,Ebot;Lin,Stephen;Wagner,Gregory J.;Ehmann,Kornel;Cao,Jian:使用图形处理单元对基于金属粉末的添加剂制造过程进行显式有限元分析的加速策略(2019年)
  4. Tim Besard,Valentin Churavy,Alan Edelman,Bjorn De Sutter:异构和分布式平台的快速软件原型(2019)不是zbMATH
  5. Zaspel,Peter:多核处理器上(\mathcalH)-矩阵的算法模式(2019)
  6. Alan Hylton,Gregory Henselman Petrusek,Janche Sang,Robert Short:调整计算持久同源包的性能(2018)阿尔十四
  7. Gremse,Felix;Küpper,Kerstin;Naumann,Uwe:多核心架构上基于行合并的高效内存稀疏矩阵乘法(2018)
  8. Kikinzon,Evgeny;Shashkov,Mikhail;Garimella,Rao:在多材料单元中建立网格拓扑:稳健和精确多材料模拟的使能技术(2018)
  9. Sweezy,Jeremy E.:用于GPU上全球通量计数的蒙特卡罗体积射线投射估计器(2018)
  10. Zanella,R.;Porta,F.;Ruggiero,V.;Zanetti,M.:通过二阶函数的数值最小化实现图像分割的串行和并行方法(2018年)
  11. Aisa,Mohamed;Verstraete,Tom;Vuik,Cornelis:面向面向GPU的结构化网格显式和隐式CFD模拟比较(2017)
  12. Jambunathan,Revati;Levin,Deborah A.:采用混合MPI-CUDA八叉树DSMC方法模拟多孔介质流动的高级并行化策略(2017)
  13. 拉丹线性系统分解法(2017;拉丹线性系统分析)
  14. Peter Wittek和Shi Gao、Ik Lim和Li Zhao:somoclu:一个高效的自组织地图并行库(2017)不是zbMATH
  15. Cuvelier,François;Japhet,Caroline;Scarela,Gilles:用向量语言组装有限元矩阵的有效方法(2016)
  16. Rupp,Karl;Tillet,Philippe;Rudolf,Florian;Weinbub,Josef;Morhammer,Andreas;Grasser,Tibor;Jüngel,Ansgar;Selberherr,Siegfried:多核和多核架构的ViennaCL线性代数库(2016)
  17. 《分层空间探索》(Mary Sheel,2016年版);Joensr《并行空间设计》(GPR)中的Mary Sheel,2016年)
  18. 戴尔顿,史蒂文;奥尔森,卢克;贝尔,内森:优化GPU的稀疏矩阵矩阵乘法(2015)
  19. Gorlatch,Sergei;Steuwer,Michel:面向多核系统的高级编程(2015)ioport公司
  20. 尼古拉斯·P·贝利,特朗德·S·英格布里格森,杰斯珀·施密特·汉森,阿诺·A·维尔霍斯特,拉丝·波林,克莱尔·A·莱马尔罕,安德烈亚斯·E·奥尔森,安德烈亚斯·K·巴赫尔,洛伦佐·科斯蒂格利奥拉,乌尔夫·R·佩德森,海因·拉森,杰佩·C·迪尔,Thomas B.Schroder:RUMD:一个通用的分子动力学软件包,优化后利用GPU硬件减少到几千个粒子(2015)阿尔十四