• ff

  • 引用5篇文章[sw23393]
  • 相同的过程或来自倍数R要利用的进程平行性. 多种终结器选择。。。即使是大数据集,例如虚拟矩阵不接触一个字节的转置。。。
  • 变色龙

  • 引用3篇文章[sw30065]
  • 架构。Chameleon是一个提供平行执行BLAS/LAPACK操作的算法充分利用。。。架构:笔记本电脑,许多核心节点,CPU,GPU,倍数节点。例如,变色龙可以。。。精度)80 TFlop/s矩阵秩序。。。
  • 波斯基

  • 1条引用[sw30963]
  • 平行优化的稀疏内核接口库。这个平行优化稀疏内核接口(pOSKI)库。。。稀疏矩阵,如稀疏矩阵-矩阵-矢量-乘法(SpMV)。pOSKI的目标是单处理器和多核。。。
  • 安培

  • 1条引用[sw36411]
  • 条件。更新由一个扩充的矩阵刚度方程的公式化,以维持。。。每个时间步。随着变化的累积倍数模拟时间步进,增广解算法使十个。。。利用稀疏性、记忆化和并行化导致正在计算更新。。。刚度系数的非零矩阵. 三种金属切削变形的结果。。。
  • 算法898

  • 引用4篇文章[sw20167]
  • 斯特拉森·温诺格拉德矩阵 乘法以及“四个俄罗斯人的方法乘法“(M4室。。。𝔽 2是逻辑异或,并且乘法是合乎逻辑的,因此是一个机器词。。。元素𝔽 2英寸平行:64最多一个CPU周期平行添加。。。
  • 垃圾邮件包

  • 1条引用[sw13998]
  • 稀疏近似的实现矩阵 乘法(SpAMM)算法在文献[1]中介绍,并进一步。。。提供矩阵数据类型,以及矩阵产品,显示线性缩放计算。。。为串行执行而编译或平行在具有OpenMP功能的共享内存系统上执行。。。
  • tpSpMV

  • 1条引用[sw38268号]
  • 乘法多核体系结构的内核。稀疏矩阵-矢量乘法(SpMV)是一个重要的。。。通过按行排列的稀疏行(CSR)格式并行化是最流行的方向之一。。。
  • PCIT公司

  • 1条引用[sw30365]
  • 与信息论(PCIT)有关联矩阵. PCIT算法识别有意义的相关性。。。倍数计算核心,只需在具有has的计算机上运行PCIT倍数核心和。。。检测多核环境并磨合平行不需要重写你的。。。
  • 格拉弗

  • 1条引用[sw35259]
  • 探索表演的机会平行低硬件和能源成本的模拟操作。。。算法可以用稀疏表示矩阵矢量乘法(SpMV),它可以有效地执行。。。核心图的计算是稀疏的矩阵GEs格式(ReRAM Crossbar)。基于向量/矩阵的。。。独特的机会来实现平行性以前所未有的能源效率和低硬件成本。。。
  • 科德尔

  • 1条引用[sw23691]
  • 基本核,如稀疏核矩阵-矢量乘法(SpMV)对于解决日益严重的。。。开发可利用的细粒平行性和内存带宽。在本文中,我们建议。。。挡块(翘曲)同时应对不规则矩阵结构。我们设计了一个轻量级的索引压缩。。。
  • 沙姆

  • 1条引用[sw38552]
  • 稀疏线性代数方程组倍数右侧向量。图书馆专门。。。高斯-塞德尔和切比雪夫迭代法。这个并行化使用MPI+POSIX共享内存实现。。。构建多重网格的已知hypre库矩阵等级制度。XAMG自己的实现。。。提供扩展功能来解决倍数右手边向量。。。
  • 夏甲

  • 1条引用[sw02336]
  • 这个想法的例子。首先,我们画画平行线满足可寻址的记忆。第二,我们展示。。。扩展映射邻接关系的思想矩阵图形到硬件的表示。。。块,用于存储和切换倍数一个常规架构的上下文。建议的电路。。。
  • 戈夫姆

  • 1条引用[sw38979]
  • 矢量乘法在NlogN甚至N时间,其中N是矩阵大小。压缩。。。方案属于层次结构族矩阵近似方法。特别是,它概括了。。。矩阵条目。既不包括几何信息(即点坐标)也不知道矩阵条目。。。此外,我们还引入了共享内存平行分层方案矩阵减少。。。
  • DistStat.jl公司

  • 1条引用[sw36529]
  • 水平并行化为了有效地使用倍数群集中的节点。。。提供大规模非负向应用矩阵因式分解、多维标度和1-正则化Cox比例。。。
  • 阿多-C

  • 引用244篇文章[sw00019]
  • ADOL-C:C/C++的自动微分。我们呈现。。。
  • 公理

  • 引用172篇文章[sw00063]
  • 公理是一个通用的计算机代数系统。。。