超级矩阵

SuperMatrix:一个多线程的分块算法运行时调度系统。本文描述了SuperMatrix,一个为SMP和/或多核架构并行化矩阵操作的运行时系统。我们使用这个系统来演示在高抽象级别描述的代码如何在这样的体系结构上获得高性能,同时对库程序员完全隐藏并行性。这些操作被视为数据块的关键单元。该实现透明地排列所需的操作,内部跟踪依赖关系,然后利用超标量微体系结构的无序执行技术执行操作。这种关注点的分离允许库开发人员实现算法,而不必考虑问题的并行化方面。不同的调度操作的启发式方法可以在运行时系统中实现,独立于将操作排队的代码。在一个16 CPU的ccNUMA Itanium2服务器上收集的结果显示了出色的性能。


zbMATH参考文献(参考 6篇文章 参考)

显示结果1到6,共6个。
按年份排序(引用)

  1. Van Zee,Field G.;Van de Geijn,Robert A.:BLIS:快速实例化BLAS功能的框架(2015)
  2. George Bosilca;Aurelien Bouteiller;Danalis,Anthony;Herault,Thomas;Lemarinier,Pierre;Dongarra,Jack:用于高性能计算的通用分布式DAG引擎(2012)ioport公司
  3. Igual,Francisco D.;Chan,Ernie;Quintana Orti,Enrique S.;Quintana Orti,Gregorio;Van De Geijn,Robert A.;Van Zee,Field G.:火焰方法:从密集线性代数算法到高性能多加速器实现(2012)ioport公司
  4. Agullo,Emmanuel;Bouwmeester,Henricus;Dongarra,Jack;Kurzak,Jakub;Langou,Julien;Rosenberg,Lee:多核体系结构上对称正定矩阵的有效矩阵反演(2011)
  5. Milani,Cleber Roberto;Kolberg,Mariana;Fernandes,Luiz Gustavo:在多核体系结构上用验证计算求解密集区间线性系统(2011)
  6. Quintana Orí,Gregorio;Quintana Ortí,Enrique S.;Van De Geijn,Robert A.;Van Zee,Field G.;Chan,Ernie:线程级并行的分块编程矩阵算法(2009)