• OCCA公司

  • 引用15篇文章[sw18538]
  • 倍数线程语言。目前支持OCCA装置OpenMP、OpenCL和库达...
  • 塞尔玛

  • 引用9篇文章[sw12960]
  • 基于库达并使用POSIX线程来管理倍数计算设备. 使用最近发布的。。。
  • 返回n

  • 引用2篇文章【sw26580】
  • 包括我们自己的fast的递归神经网络库达内核;多维LSTM(仅限GPU,在那里。。。大数据集;工作分配倍数 设备; 灵活快速的体系结构允许。。。
  • NMF mGPU

  • 1条引用[sw26273]
  • 执行线性代数运算。关于分离设备低板内存,大数据集。。。针对不同的现有库达架构。最后,NMF mGPU还提供。。。利用的版本倍数GPU设备通过MPI(消息传递接口)标准。。。
  • 特写++

  • 1条引用[sw17487]
  • 接口是NVIDIA的计算统一设备建筑(库达)图书馆。但是,移植现有代码。。。用户编写在上执行的内核倍数核心,以单一指令的形式。。。
  • 粒子列阵

  • 1条引用[sw12634]
  • 数据分布倍数记忆设备. 用户只需要学习一个统一的。。。分布式内存共享(G全局阵列),GPU(库达)和manycore(麦克的OpenMP卸载。。。
  • 引用2篇文章[sw08231号]
  • 基于计算统一的配对装置建筑(库达)编程模型。它实现了并行点算法。。。尤其是传统的基于蒙哥马利的多精度乘法. 在128位安全级别,EAGL。。。测试GPU上的配对计算装置,以及在𝔽...
  • 弯刀

  • 1条引用[sw35950]
  • 高性能矩阵-乘法(GEMM)在所有级别和范围内库达. 它包含了策略。。。线宽、经宽、块宽,以及装置-宽基元可以被专门化和调整。。。
  • 赛马会

  • 1条引用[sw28757]
  • 库达使用共享内存的应用程序。库达应用程序、用共享\限定符声明的存储。。。此数据正被访问倍数线程并行,错误的程序假设可能导致。。。共享内存。有关支持的体系结构,请参阅支持的设备...
  • 阿多-C

  • 引用244篇文章[sw00019]
  • ADOL-C:C/C++的自动微分。我们呈现。。。
  • 拉帕克

  • 在1649篇文章中引用[sw00503]
  • LAPACK是用Fortran 90编写的,它提供。。。
  • LSQR

  • 引用372篇文章[sw00530]
  • 算法583:LSQR:稀疏线性方程组和最小。。。
  • R

  • 参考8836篇文章[sw00771]
  • 是一种统计语言和环境。。。