柚木

PUMMA:分布式内存并发计算机上的并行通用矩阵乘法算法。本文描述了分布式内存并发计算机上的并行通用矩阵乘法算法(PUMMA)。PUMMA包不仅包括非转置矩阵乘法例程C=AB、 但也有转置乘法例程C=ATB、 C=ABT,C=ATBT,用于块循环数据分布。对于各种处理器配置和块大小,这些例程都能有效地执行。PUMMA一起提供了与3级BLAS例程xGEMM相同的功能。文中给出了这些例程的并行实现细节,并给出了在英特尔Touchstone Delta计算机上运行的结果。


zbMATH中的参考文献(参考文献11条)

显示结果1到11,共11个。
按年份排序(引用)

  1. 沙茨,马丁D。;范德盖恩,罗伯特A。;杰克·鲍尔森:《并行矩阵乘法:系统之旅》(2016)
  2. 科萨罗。;马拉齐纳,D。;Marino,Z.:基于小波的并行亚式期权定价过程(2015)
  3. 金正汉;艾尔德豪斯;阿扬·J·弗里金斯。H、 。;内迪亚,西尔维亚五世。;van Steenhoven,Anton A.:用于非反应性分子动力学模拟的基于EEM的硅水和硅水壁电位的开发(2014)
  4. 奥肯塔尔,T。;巴德尔,M。;哈克尔,T。;服务提供商örl,A。;Waldherr,K.:量子控制问题中的矩阵指数和并行前缀计算(2010)
  5. Choi,Jaeyoung:PoLAPACK:带算法块的并行因子分解例程(2001)
  6. D'Azevedo,爱德华多;Jack Dongarra:并行核心外scaLAPACK LU、QR和Cholesky因式分解例程的设计与实现(2001)
  7. 蒂内蒂,费尔南多;奎亚诺,安东尼奥;德朱斯蒂,阿曼多;Luque,Emilio:工作站异构网络与并行矩阵乘法(2001)
  8. Choi,jeeyoung:一种新的分布式并行并行矩阵乘法算法(1998)
  9. 崔在勇;唐加拉,杰克J。;Walker,David W.:分布式内存并发计算机上的并行矩阵转置算法(1995)
  10. 周,C.-C。;邓永福。;李,G。;Wang,Y.:分布式内存MIMD体系结构上矩阵乘法的并行化Strassen方法(1995)
  11. 沃尔夫·冯·古登堡,Jürgen:验证计算用并行线性代数库的设计(1995)