推力

推力是一个基于标准模板库(STL)的面向CUDA的C++模板库。通过与CUDA C完全互操作的高级接口,您可以用最少的编程工作量实现高性能的并行应用程序。Thrust提供了丰富的数据并行原语集合,如扫描、排序和缩减,这些元素可以组合在一起,以简洁的方式实现复杂的算法,可读源代码。通过用这些高级抽象来描述您的计算,您可以让push自由地选择最有效的实现。因此,推力可以用于CUDA应用程序的快速原型设计(程序员的生产力最为重要),以及在健壮性和绝对性能至关重要的生产中。


zbMATH中的参考文献(参考文献53条)

显示第1到第20个结果,共53个。
按年份排序(引用)
  1. 东、昭南;格奥尔古利斯,艾曼纽H。;Kappas,Thomas:GPU加速多面体网格上的间断Galerkin方法(2021)
  2. 叶卡捷琳娜;安德烈劳亚斯;Kersten,Julia:基于实验的协同系统GPU参数辨识(2020)
  3. Berenger Bramas:TBFMM:C++通用并行快速多极方法库(2020)不是zbMATH
  4. 龙,沁园;Mei,Gang:GScan:在图形处理单元上计算二维凸包的并行Graham扫描算法(2020)
  5. 通常,是伊斯特万州。;Mudalige,Gihan R.:计算流体力学应用的生产力、性能和可移植性(2020)
  6. 莫扎法尔,莫吉塔巴;Ndip Agbor,Ebot公司;林,斯蒂芬;瓦格纳,格雷戈里J。;埃曼,科内尔;曹健:使用图形处理单元对基于金属粉末的添加剂制造过程进行显式有限元分析的加速策略(2019年)
  7. Tim Besard,Valentin Churavy,Alan Edelman,Bjorn De Sutter:异构和分布式平台的快速软件原型(2019)不是zbMATH
  8. Zaspel,Peter:多核处理器上(\mathcalH)-矩阵的算法模式(2019)
  9. Alan Hylton,Gregory Henselman Petrusek,Janche Sang,Robert Short:调整计算持久同源包的性能(2018)阿尔十四
  10. 格雷姆,费利克斯;Küpper,克尔斯廷;Naumann,Uwe:多核心架构上通过行合并实现的内存高效稀疏矩阵矩阵乘法(2018)
  11. 基金松,叶夫根尼;沙什科夫,米哈伊尔;Garimella,Rao:在多材料单元中建立网格拓扑:稳健和精确多材料模拟的使能技术(2018)
  12. Sweezy,Jeremy E.:用于GPU上全球通量计数的蒙特卡罗体积射线投射估计器(2018)
  13. 萨内拉,R。;波尔塔,F。;鲁吉罗,V。;Zanetti,M.:通过二阶函数的数值最小化实现图像分割的串行和并行方法(2018)
  14. 艾萨,穆罕默德;维斯特雷特,汤姆;Vuik,Cornelis:面向面向GPU的结构化网格显式和隐式CFD模拟比较(2017)
  15. 贾姆布纳坦,革命;Levin,Deborah A.:使用混合MPI-CUDA八叉树DSMC方法模拟多孔介质流动的高级并行化策略(2017)
  16. 李安;塞尔维亚语,拉杜语;Negrut,Dan:GPU卡上线性系统并行解的分裂方法分析(2017)
  17. Peter Wittek和Shi Gao、Ik Lim和Li Zhao:somoclu:一个高效的自组织地图并行库(2017)不是zbMATH
  18. 卡维利埃,弗朗索瓦;贾斐特,卡罗琳;Scarella,Gilles:用向量语言组装有限元矩阵的有效方法(2016)
  19. 鲁普,卡尔;蒂莱,菲利普;鲁道夫,弗洛里安人;温布,约瑟夫;莫哈默,安德烈亚斯;格拉瑟,提博;安格尔,安格尔;Selberherr,Siegfried:多核和多核体系结构的ViennaCL线性代数库(2016)
  20. 斯文森,博乔尔;牛顿,瑞安R。;Sheeran,Mary:GPU上分层数据并行设计空间探索语言(2016)