库布拉斯

CUBLAS库是基于NVIDIA®CUDA的BLAS(基本线性代数子程序)的实现运行时。它允许用户访问NVIDIA图形处理单元(GPU)的计算资源,但不能跨多个GPU自动并行。要使用CUBLAS库,应用程序必须在GPU内存空间中分配所需的矩阵和向量,用数据填充它们,调用所需CUBLAS函数序列,然后将结果从GPU内存空间上载回主机。CUBLAS库还提供了从GPU写入和检索数据的助手函数。


zbMATH参考文献(78篇文章引用)

显示第1到第20个结果,共78个。
按年份排序(引用)
  1. Bosner,Nela:广义矩阵特征值算法的四个矩阵的并行化简(2021)
  2. Ahrens,Peter;Demmel,James;Nguyen,Hong Diep:高效可重复浮点求和算法(2020)
  3. Bartelt,M.;Klöckner,O.;Dietzsch,J.;Groß,M.:具有变分积分器的各向异性模拟的高阶空间和时间有限元。高效GPU实施的应用(2020年)
  4. Huang,Jianyu;Yu,Chenhan D.;Geijn,Robert A.van de:Strassen算法重新加载到GPU上(2020)
  5. Kang,Homin;Kwon,Hyuck Chan;Kim,Duksu:HPMaX:使用CPU和GPU的异构并行矩阵乘法(2020)
  6. Ko Seyoon Ko,Hua Zhou,Jin Zhou,Joong Ho-Won:DistStat.jl:Julia(2020)中面向高性能统计计算环境的统一编程阿尔十四
  7. 王晓辉,熊颖,杨伟,王明轩,李磊:一个用于序列处理和生成的高性能推理库(2020)阿尔十四
  8. Bernaschi,Massimo;Carrozzo,Mauro;Franceschini,Andrea;Janna,Carlo:图形处理单元上的动态模式分解稀疏近似逆预处理器(2019)
  9. Berrone,S.;D'Auria,A.;Vicini,F.:使用GPGPU对离散裂缝网络进行快速和稳健的流动模拟(2019年)
  10. Cheng,Xuan;Zeng,Ming;Lin,Jinpeng;Wu,Zizhao;Liu,Xinguo:点集的有效(L俬0)重采样(2019)
  11. 高性能科学计算概论(2019)
  12. Defez,Emilio;Ibáñez,Javier;Peinado,Jesús;Sastre,Jorge;Alonso Jordá,Pedro:基于新Hermite近似计算矩阵余弦的高效精确算法(2019年)
  13. 杜成汉;邱,易鹏;王伟忠:光子结构频域分析的压缩分层Schur算法(2019)
  14. Flegar,Goran;Scheidegger,Florian;Novaković,Vedran;Mariani,Giovani;Tomás,Andres E.;Malossi,A.Cristiano I.;Quintana Orti,Enrique s.:FloatX:定制浮点运算的C++库(2019年)
  15. Jaber J.Hasbestan,INAC Senocak:PittPack:一个开源的Poisson方程求解器,用于使用加速器进行极端规模计算(2019年)阿尔十四
  16. Li,Ruipeng;Xi,Yuanzhe;Erlandson,Lucas;Saad,Yousef:特征值切片库(EVSL):算法、实现和软件(2019)
  17. Sastre,Jorge;Ibánez,Javier;Alonso Jordá,Pedro;Peinado,Jesús;Defez,Emilio:矩阵余弦计算的快速泰勒多项式评估(2019年)
  18. Tim Besard,Valentin Churavy,Alan Edelman,Bjorn De Sutter:异构和分布式平台的快速软件原型(2019)不是zbMATH
  19. van den Berg,E.:海洋张量包(2019)不是zbMATH
  20. 吴荣腾;谢晓红:基于基本列块统一分配策略的异构并行LU分解算法(2019)