×

兹马思-数学第一资源

分布式存储器MIMD结构上矩阵乘法的并行化Strassen方法。(英语) Zbl 0839.68093
摘要:在Strassen方法的基础上,我们提出了一种分布式存储MIMD体系结构上矩阵乘法的并行方法。我们的时序测试在一个56节点的Intel Paragon上进行,展示了Strassen方法在系统级的潜力实现,其复杂度为\(4.7M^{2.807}),而不是之前几项工作所关注的节点级别。当处理器数为7的幂次时,并行效率几乎达到完美。在系统级,并行化Strassen方法总是比复杂度为2M^3的传统矩阵乘法方法与BMR方法和环方法相结合。对于\(M\约1000\),速度增益取决于矩阵阶数\(M:20\%\),对于\(M\大约5000\),速度增益大于\(100\%\)。
理学硕士:
68吨20 人工智能环境下的问题解决(启发式、搜索策略等)
68M99 计算机系统组织
软件:
柚木;类包
PDF格式 BibTeX公司 XML 引用
全文: 多伊
参考文献:
[1] 戈鲁布,G.H。;范洛恩,C.F.,矩阵计算(1989),约翰霍普金斯大学出版社巴尔的摩,医学博士·Zbl 0733.65016
[2] 潘,V.,我们如何加速矩阵乘法?,《暹罗评论》,26393-415,(1984)·Zbl 0563.65028
[3] Strassen,V.,高斯消去不是最优的。数学,13354-356,(1969)·Zbl 0185.40101
[四] 铜匠D。;温诺格拉德,S.,《算术级数的矩阵乘法》,第1-6页
[5] 韦诺格拉德,S.关于多项式快速乘法的一些注记,(),181-196
[6] 邱,S.-T。;吕,Y.Y.,将对称矩阵特征值问题化为矩阵乘法,暹罗科学计算杂志,14121-144,(1993)·Zbl 0771.65019
[7] 加里文,K.A。;普莱蒙,R.J。;Sameh,A.H.,稠密线性代数计算的并行算法,暹罗出版社,32,54-135,(1990)·Zbl 0697.65010
[8] Manber,U.,《算法导论》(1989),Addison-Wesley Reading,MA
[9] Bailey,D.,CRAY-2上的超高速矩阵乘法,暹罗J。科学。统计学家。计算机,9603-607,(1988)·Zbl 0644.65030
[10] 比约斯塔,P。;曼恩,F。;瑟勒维克,T。;Vajteršic,M.,SIMD计算机上的有效矩阵乘法,暹罗J。肛门。申请书,13386-401,(1992年)·Zbl 0757.65050
[11] D。斯科特,私人通信,英特尔公司超级计算机系统部,比佛顿,俄勒冈州,(1994年3月)。
[12] 崔,J。;东加拉,J.J。;(,《并行矩阵乘法:并行矩阵计算机上的并行算法》)·Zbl 0874.68129
[13] 福克斯,G.C。;嘿,A.I。;Otto,S.,超立方体上的矩阵算法I:矩阵乘法,并行计算,4,17,(1987)·零担0632.65043
[14] 胡斯·莱德曼,S。;曹,A。;雅各布森,E.M。;Zhang,G.,intel touchstone delta上的矩阵乘法,()
[15] Kuck and Associates,CLASSPACK basic math library用户指南(1992年12月),伊利诺伊州香槟市Kuck&Associates
[16] 福克斯,G.C。;约翰逊,文学硕士。;莱森加,G。;奥托,西南。;萨尔蒙,J。;沃克,D.,()
[17] Higham,N.J.,利用3级BLAS中的快速矩阵乘法,ACM trans。数学软件,16112-115,(1990)·Zbl 0900.65118
此参考列表基于出版商或数字数学图书馆提供的信息。它的项被试探性地匹配到zbMATH标识符,并且可能包含数据转换错误。它试图尽可能准确地反映原始论文中列出的参考文献,而不要求匹配的完整性或精确性。