推力

推力是基于标准模板库(STL)的CUDA的C++模板库。推力允许您通过与CUDA完全互操作的高级接口,以最小的编程努力实现高性能并行应用程序。C.Purt提供了丰富的数据并行原语集合,如扫描、排序和还原,它们可以组合在一起,以简洁地实现复杂的算法。可读源代码。通过用这些高级抽象描述你的计算,你可以自由地选择推力来自动选择最有效的实现。因此,推力可以用于CUDA应用程序的快速原型化,其中程序员生产率最重要,以及在生产中,鲁棒性和绝对性能是至关重要的。


ZBMaCT中的参考文献(40篇文章中引用)

显示结果1至20的40。
按年份排序(引文
  1. Auer,Ektina;Ruh,安德烈亚斯;KoSTEN,朱丽亚:基于实验的合作系统GPU参数识别(2020)
  2. Muthalige,Gihan R.:计算流体力学应用的生产率、性能和可移植性(2020)
  3. Tim Besard、Valentin Churavy、Alan Edelman、Bjorn De Sutter:异构和分布式平台的快速软件原型(2019)不是ZB数学
  4. Alan Hylton,Gregory Henselman Petrusek,金川生,Robert Short:调整计算持久同调软件包的性能(2018)阿西夫
  5. Gremse,菲利克斯;Ku Ppple,克斯廷;Nouman,UWE:在多核体系结构上通过行合并的存储器有效稀疏矩阵矩阵乘法(2018)
  6. 斯威齐,Jeremy E.:全球体积通量的蒙特卡洛体积光线投射估计器(GPU)(2018)
  7. Zanella,R;波尔塔,F.RuGielo,V.萨内蒂,M.:用二阶函数的数值最小化进行图像分割的串行和并行方法(2018)
  8. Aissa,穆罕默德;VistaTead,汤姆;Vuik,CureleIs:走向GPU感知的结构化网格上显式和隐式CFD模拟的比较(2017)
  9. 李,Ang;塞尔班,拉杜;Negrut,丹:GPU卡上线性系统并行解的分裂方法分析(2017)
  10. Peter Wittek和Shi Gao和IK LIM和Li Zhao:SOMOCLU:一个高效的自组织映射并行库(2017)不是ZB数学
  11. CuVielver,弗兰Sou-OIS;Japhet,卡洛琳;Scarella,吉尔斯:矢量语言中有限元矩阵的一种有效组装方法(2016)
  12. 鲁普,卡尔;Tillet,菲利普;鲁道夫,弗洛里安;WeiBub,Josef;Morhammer,安德烈亚斯;Graser-Tibor;Junngel.,PoT;SelBeer-Hr,SieFrime:VinAcl多代数和多核体系结构的线性代数库(2016)
  13. 博·斯文松,Bo Joel;牛顿,Ryan R.;Sheeran,玛丽:分层数据并行设计语言GPU(2016)
  14. 达尔顿,史提芬;奥尔森,卢克;贝尔,弥敦:优化GPU的稀疏矩阵乘法(2015)
  15. Gorlatch,谢尔盖;Stuuver,米歇尔:面向多核系统的高级程序设计(2015)
  16. Nicholas P. Bailey,Trond S. Ingebrigtsen,Jesper Schmidt Hansen,Arno A. Veldhorst,Lasse Bohling,Claire A. LemarchandThomas B. Schroder:RUMD:一个通用的分子动力学包,优化利用GPU硬件到几千个粒子(2015)阿西夫
  17. Roberto Casarin;Stefano Grassi;Francesco Ravazzolo;Herman van Dijk:高效密度组合的并行序贯蒙特卡罗方法:DECO MATLAB工具箱(2015)不是ZB数学
  18. Serbun,RADU;Melz,丹尼尔;李,Ang;StangululsCu,Ilinca;JaykuMar,Paramsothy;Negrut,丹:基于GPU的预处理Newton Krylov solver,用于柔性多体动力学(2015)
  19. Wong,J.;KuHL,E.;Dave,E.:一种新的稀疏矩阵矢量乘法图形处理单元算法,用于有限元问题(2015)
  20. Ahnert,卡斯滕;Demidov,丹尼斯;Mulansky,马里奥:GPU上求解常微分方程(2014)