总结

在本文中,我们给出了一个直接的,高效的,可扩展的通用矩阵乘法运算的实现。这些算法比以前发布的方法简单得多,产生更好的性能,并且需要更少的工作空间。文中给出了MPI实现,以及在Intel Paragon系统上的性能结果。


zbMATH中的参考文献(参考文献30篇文章)

显示第1到第20个结果,共30个。
按年份排序(引用)
  1. 戈尔曼,克里斯托弗;中国á韦斯,古斯塔沃;盖瑟尔,彼得;玛丽,Théo;鲁埃,弗兰ç奥斯·亨利;Li,Xiaoye Sherry:无矩阵分层半可分结构中自适应随机抽样的鲁棒精确停止准则(2019)
  2. 黄建宇;马修斯,德文A。;van de Geijn,Robert A.:Strassen张量收缩算法(2018)
  3. 阿扎德,阿里夫;巴拉德,灰色;布鲁ç, 艾丁;德梅尔,詹姆斯;格里戈里,劳拉;施瓦茨,奥德;托莱多,湿婆;Williams,Samuel:在稀疏矩阵矩阵乘法中利用多个级别的并行性(2016)
  4. 巴拉德,灰色;希弗特,克里斯托弗;Hu,Jonathan:减少代数多重网格中稀疏矩阵乘法的通信成本(2016)
  5. 贝里亚科夫,格雷布;Matiyasevich,Yuri:使用任意精度算法计算行列式和子式的并行算法(2016)
  6. 伯克,尼古拉斯;迦勒库姆,马特;卡尔é, Laxmikant V.:强标度极限下(\mathcalO(N))电子结构的解算器(2016)
  7. 鲁埃,弗兰ç奥斯·亨利;李小叶。;盖瑟尔,彼得;Napov,Artem:使用随机化实现密集层次半可分离矩阵计算的分布式内存包(2016)
  8. 沙茨,马丁D。;范德盖恩,罗伯特A。;杰克·鲍尔森:《并行矩阵乘法:系统之旅》(2016)
  9. 巴拉德,G。;卡森E。;德梅尔,J。;霍曼,M。;奈特,N。;Schwartz,O.:数值线性代数的通信下限和优化算法(2014)
  10. 伯克,尼古拉斯;Challacombe,Matt:衰减矩阵的优化稀疏近似矩阵乘法(2013)
  11. 布鲁ç, 艾丁;Gilbert,John R.:并行稀疏矩阵矩阵乘法与索引:实现与实验(2012)
  12. 青达、青露;高晓阳;克里希纳穆尔西,斯里兰;鲍姆加特纳,杰拉尔德;拉马努贾姆,J。;Sadayappan,P.:经验性能模型驱动的张量收缩表达式的数据布局优化和库调用选择(2012)ioport公司
  13. 布鲁ç, 艾德ın;吉尔伯特,约翰:稀疏矩阵矩阵乘法的新思想(2011)
  14. 尼什塔拉,拉杰什;郑伊犁;哈格罗夫,保罗H。;Yelick,Katherine A.:为分区全局地址空间编程模型调整集体通信(2011)ioport公司
  15. 奥肯塔尔,T。;巴德尔,M。;哈克尔,T。;服务提供商örl,A。;Waldherr,K.:量子控制问题中的矩阵指数和并行前缀计算(2010)
  16. 甘尼斯,约翰;李,乔恩;Margulies,Susan:非线性组合优化并行结构的高效高精度矩阵代数(2010)
  17. Kalinov,Alexey:测量异构并行系统的可伸缩性(2006)
  18. 卡里诺夫,A。Ya.:异构并行系统的可扩展性(2006)
  19. 埃尔卡瓦斯梅,埃亚斯;阿尤布,阿卜杜勒·埃拉;Abu Ghazaleh,Nayef:工作站集群上的快速矩阵乘法(2004)
  20. 亨诺德,S。;劳伯,T。;Rünger,G.:基于多处理器任务的分层矩阵矩阵乘法(2004)