总结

在本文中,我们给出了一个直接的,高效的,可扩展的通用矩阵乘法运算的实现。这些算法比以前发布的方法简单得多,产生更好的性能,并且需要更少的工作空间。文中给出了MPI实现,以及在Intel Paragon系统上的性能结果。


zbMATH参考文献(参考 30篇文章

显示第20到第30个结果。
按年份排序(引用)
  1. Gorman,Christopher;Chávez,Gustavo;Ghysels,Pieter;Mary,Théo;Rouet,François Henry;Li,Xiaoye Sherry:无矩阵层次半可分结构中自适应随机抽样的鲁棒准确停止准则(2019年)
  2. Huang,Jianyu;Matthews,Devin A.;van de Geijn,Robert A.:Strassen张量收缩算法(2018)
  3. Azad,Ariful;Ballard,Grey;Buluç,Aydin;Demmel,James;Grigori,Laura;Schwartz,Oded;Toledo,Sivan;Williams,Samuel:在稀疏矩阵矩阵乘法中利用多个级别的并行性(2016)
  4. Ballard,Grey;Siefert,Christopher;Hu,Jonathan:减少代数多重网格中稀疏矩阵乘法的通信成本(2016)
  5. Beliakov,Gleb;Matiyasevich,Yuri:使用任意精度算法计算行列式和子式的并行算法(2016)
  6. Bock,Nicolas;Challacombe,Matt;Kalé,Laxmikant V.:强标度极限下(\mathcalO(N))电子结构的解算器(2016)
  7. Rouet,François Henry;Li,Xiaoye S.;Ghysels,Pieter;Napov,Artem:使用随机化实现密集层次半可分离矩阵计算的分布式内存包(2016)
  8. Schatz,Martin D.;van de Geijn,Robert A.;Poulson,Jack:《并行矩阵乘法:系统旅程》(2016)
  9. Ballard,G.;Carson,E.;Demmel,J.;Hoemmen,M.;Knight,N.;Schwartz,O.:数值线性代数的通信下限和优化算法(2014)
  10. Bock,Nicolas;Challacombe,Matt:衰减矩阵的优化稀疏近似矩阵乘法(2013)
  11. Buluç,Aydin;Gilbert,John R.:并行稀疏矩阵矩阵乘法和索引:实现和实验(2012)
  12. layout和Gao layout;layout;layout;layout;layout;layout;layout;Layoun;Layoun;Layoun;Layoun;Layoun;Layoun;Layoun;Layoun;Layoun;Layoun;Layoun;layout;layout;layout;layout;layout;layout;layout;layout;Layouioport公司
  13. Buluç,Aydın;Gilbert,John:稀疏矩阵矩阵乘法的新思想(2011)
  14. Nishtala,Rajesh;Zheng,Yili;Hargrove,Paul H.;Yelick,Katherine A.:为分区全局地址空间编程模型调整集体通信(2011)ioport公司
  15. Auckenthaler,T.;Bader,M.;Huckle,T.;Spörl,A.;Waldherr,K.:量子控制问题中的矩阵指数和并行前缀计算(2010)
  16. Gunnels,Jon;Lee,Jon;Margulies,Susan:用于非线性组合优化的并行结构的高效高精度矩阵代数(2010)
  17. Kalinov,Alexey:测量异构并行系统的可伸缩性(2006)
  18. Kalinov,A.Ya.:异构并行系统的可伸缩性(2006)
  19. El Qawasmeh,Eyas;Al Ayyoub,Abdel Elah;Abu Ghazaleh,Nayef:工作站集群上的快速矩阵乘法(2004)
  20. Hunold,S.;Rauber,T.;Rünger,G.:基于多处理器任务的层次矩阵矩阵乘法(2004)