×

在分布式内存MIMD体系结构上并行Strassen的矩阵乘法。 (英语) Zbl 0839.68093号

摘要:我们提出了一种基于Strassen方法的分布式内存MIMD体系结构上矩阵乘法的并行方法。我们在56节点Intel Paragon上进行的计时测试表明,Strassen方法的潜力在系统级实现,复杂度为(4.7M^{2.807}),而不是早期几项工作所关注的节点级。当处理器数是7的幂时,并行效率几乎是完美的。并行化的Strassen方法似乎总是比复杂度为2M^3的传统矩阵乘法更快,并且在系统级结合了BMR方法和Ring方法。速度增益取决于矩阵阶数\(M:20\%\)对于\(M\约1000\)和大于\(100\%\。

MSC公司:

68T20型 人工智能背景下的问题解决(启发式、搜索策略等)
68M99型 计算机系统组织
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Golub,G.H。;Van Loan,C.F.,《矩阵计算》(1989),约翰霍普金斯大学出版社:约翰霍普金大学出版社,马里兰州巴尔的摩·Zbl 0733.65016号
[2] 潘,V.,我们如何加快矩阵乘法?,SIAM评论,26,393-415(1984)·Zbl 0563.65028号
[3] 斯特拉森,V.,高斯消去不是最优的,数值。数学。,13, 354-356 (1969) ·Zbl 0185.40101号
[4] 科珀史密斯,D。;Winograd,S.,《通过算术级数进行矩阵乘法》(1987年第十九届ACM计算理论年会论文集),1-6
[5] Winograd,S.,关于多项式快速乘法的一些评论,(Traub,J.,《顺序和并行数值算法的复杂性》(1973),学术出版社,181-196·Zbl 0273.65033号
[6] 游,S.-T。;Lu,Y.Y.,将对称矩阵特征值问题简化为矩阵乘法,SIAM科学计算杂志,14,121-144(1993)·Zbl 0771.65019号
[7] 加里凡,K.A。;普莱蒙斯,R.J。;Sameh,A.H.,密集线性代数计算的并行算法,SIAM Rev.,32,54-135(1990)·Zbl 0697.65010号
[8] Manber,U.,《算法导论》(1989),Addison-Wesley:Addison-Whesley Reading,MA·Zbl 0825.68397号
[9] Bailey,D.,CRAY-2上的超高速矩阵乘法,SIAM J.Sci。统计师。计算。,9, 603-607 (1988) ·Zbl 0644.65030号
[10] 比约斯塔德,P。;Manne,F。;瑟瑞克,T。;Vajteršic,M.,SIMD计算机上的高效矩阵乘法,SIAM J.Ana。申请。,13, 386-401 (1992) ·Zbl 0757.65050号
[11] D.Scott,英特尔公司超级计算机系统部门专用通信,俄勒冈州比弗顿(1994年3月)。;D.Scott,Intel Corporation超级计算机系统部私人通信,俄勒冈州比弗顿(1994年3月)。
[12] Choi,J。;Dongarra,J.J。;Walker,D.W.,PUMMA:分布式内存并发计算机上的并行通用矩阵乘法算法(技术报告TM-12252(1993年8月),橡树岭国家实验室)·Zbl 0874.68129号
[13] 福克斯公司。;嘿,A.I。;Otto,S.,超立方体上的矩阵算法I:矩阵乘法,并行计算,4,17(1987)·Zbl 0632.65043号
[14] Huss-Lederman,S。;曹,A。;雅各布森,E.M。;Zhang,G.,Intel Touchstone Delta上的矩阵乘法(技术报告:TR-93-101(1994年2月),SRC)
[15] Kuck&Associates,《CLASSPACK基础数学库用户指南》(1992年12月),Kuck&Associates:Kuck&Assistances Champaign,IL
[16] 福克斯,G.C。;约翰逊,医学硕士。;Lyzenga,G。;Otto,S.W。;沙门,J。;Walker,D.,(解决并行处理器上的问题,第1卷(1988),通用技术和正则问题,Prentice-Hall:通用技术和常规问题,Preentice-Hall Englewood Cliffs,NJ)
[17] Higham,N.J.,利用3级BLAS中的快速矩阵乘法,ACM Trans。数学软件,16112-115(1990)·兹比尔0900.65118
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。