跳到主要内容
文章
免费访问

一组三级基本线性代数子程序

出版:1990年3月1日出版历史
跳过抽象节

摘要

本文描述了对基本线性代数子程序集的一个扩展。这些扩展的目标是矩阵-向量运算,它应该为高性能计算机提供高效且可移植的算法实现

工具书类

  1. 1BARRON,D.W.和SWINNERTON-DYER,H.P.F.使用磁带存储求解联立线性方程组。计算。J.3(1960),28-33。谷歌学者谷歌学者
  2. 2BERRY,M.、GALLIVAN,K.、HARROD,W.、JALBY,W.,LO,S.、MEIER,U.、PHILIPPE,B.和SAMEH,A.CEDAR系统上的并行算法。1986年CSRD报告581。谷歌学者谷歌学者
  3. BISCHOF,C.和VAN LOAN,C.Householder矩阵乘积的WY表示。SIAM J.科学。明星。计算。8,1(1987年1月),s2-s13。谷歌学者谷歌学者
  4. 4BRONLUND,O.E.,AND JOHNSEN,T.QR-分块矩阵的乘积化。计算。方法。申请。机械。《工程》,第3卷,第153-172页,1974年。谷歌学者谷歌学者
  5. 5BUCHER,I.,AND JORDAN,T.在带有辅助固态存储设备的矢量计算机上使用的线性代数程序。《偏微分方程计算机方法的进展》,R.Vichnevetsky和R.Stepleman,编辑:IMACS,1984年,546-550。谷歌学者谷歌学者
  6. 6CALAHAN,D.A.基于CRAY-2的面向块的局部内存线性方程解:单处理器算法。《并行处理国际会议论文集》(1986年8月)。IEEE计算机学会出版社,纽约,1986年。谷歌学者谷歌学者
  7. 7CARNEVALI,P.,RADICATI DI BROZOLO,G.,ROBERT,Y.,AND SGUAZZERO,P.。在IBM 3090向量多处理器上高效实现高斯消去和Householder缩减算法的Fortran实现。IBM ECSEC Rep.ICE-00121987。谷歌学者谷歌学者
  8. 8CHARTRES,B.将Jacobi和Givens方法应用于带有磁带备份存储的计算机。悉尼大学科技报告81960年。谷歌学者谷歌学者
  9. 9DAVE,A.K.和DUFF,I.S.CRAY-2上的稀疏矩阵计算。并行计算。5(1987年7月),55-64。谷歌学者谷歌学者
  10. 10DEMMEL,J.、DONGARRA,J.J.、DU CROZ,J.,GREENBAUM,A.、HAMMARLING,S.和SORENSEN,D.高性能计算机线性代数库开发说明书。阿贡国家实验室代表ANL-MCS-TM-971987年9月。谷歌学者谷歌学者
  11. 11DIETRICH,G.超矩阵Householder QR分解的新公式。计算。方法。附录I。机械。工程9(1976),273-280。谷歌学者谷歌学者
  12. 12DODSON,D.和LEWIS,J.关于基本线性代数子程序扩展的问题。ACM SIGNUM新闻。20, 1 (1985), 2-18.谷歌学者谷歌学者
  13. 13DONGARRA,J.J.、BUNCH,J.、MOLER,C.和STEWART,G.LINPACK用户指南。宾夕法尼亚州费城SIAM,1979年。谷歌学者谷歌学者
  14. 14DONGARRA,J.J.、DuCRoz,J.、HAMMARLING,S.和HANSON,R.一组扩展的Fortran基本线性代数子程序。ACM事务处理。数学。柔和。14,i(1988年3月),1-17。谷歌学者谷歌学者
  15. 15DONGARRA,J.J.、DuCRoz,Z.、HAMMARLING,S.和HANSON,R.一组扩展的Fortran基本线性代数子程序:模型实现和测试程序。ACM事务处理。数学。柔和。14,I(1988年3月),18-32。谷歌学者谷歌学者
  16. 16DONGARRA,J.J.、DuCRoz,J.、DUFF,I.S.和HAMMARLING,S.一组三级基本线性代数子程序:模型实现和测试程序。本期,第18-37页。谷歌学者谷歌学者
  17. 17DONGARRA,J.J.和DUFF,I.S.高级架构计算机。田纳西大学众议员CS-89-90,1989年11月。谷歌学者谷歌学者
  18. 18DONGARRA,J.J.、GUSTAVSON,F.和KARP,A.在向量流水线机器上实现稠密矩阵的线性代数算法。SIAM第26版,第1版(1984年),第91-112页。谷歌学者谷歌学者
  19. 19DONGARRA,J.J.、HAMMARLING,S.和SORENSEN,O.C.。矩阵的块化简为压缩形式,用于特征值计算。阿贡国家实验室代表ANL-MCS-TM-991987年9月。谷歌学者谷歌学者
  20. 20DONGARRA,J.J.和HEWITT,T.在CRAY X-MP-4上使用多任务处理实现密集线性代数。J.计算。申请。数学。27 (1989), 215-227.谷歌学者谷歌学者
  21. 21DONGARRA,J.J.和SORENSEN,D.C.高性能计算机上的线性代数。《并行计算学报》85,U.Schendel,Ed.North Holland,Amsterdam,1986,113-136。谷歌学者谷歌学者
  22. 22DuCRoz,J.、NUGENT,S.、REID,J.和TAYLOR,D.在分页虚拟存储中求解大型完整的线性方程组。ACM事务处理。数学。柔和。7, 4 (1981), 527-536.谷歌学者谷歌学者
  23. 23DUFF,I.S.稀疏高斯消去中的全矩阵技术。《数值分析学报》,邓迪1981年,数学讲义912。Springer-Verlag,纽约,1981年,71-84。谷歌学者谷歌学者
  24. 24GALLIVAN,K.、JALBV,W.和MEIER,U。BLAS3在具有分层内存的并行处理器上的线性代数中的使用。SIAM J.科学。星星。计算。1987年11月8日至6日,1079-1084。谷歌学者谷歌学者
  25. 25GEORGE,A.和RASHWAN,S.求解有限元系统的辅助存储方法。SIAM J.科学。星星。计算。6,4(1985年10月),882-910。谷歌学者谷歌学者
  26. 26IBM。工程和科学子程序库。计划5668-8631986年。谷歌学者谷歌学者
  27. 27LAWSON,C.、HANSON,R.KINCAID,D.和KROGH,F.Fortran使用的基本线性代数子程序。ACM事务处理。数学。柔和。5 (1979), 308-323.谷歌学者谷歌学者
  28. 28LAWSON,C.、HANSON,R.、KINCAID,D.和KROGH,F.算法539:Fortran使用的基本线性代数子程序。ACM事务处理。数学。柔和。5 (1979), 324-325.谷歌学者谷歌学者
  29. 29MCKELLAR,A.C.,AND COFFMAN,E.G.,JR.分页存储器系统的矩阵组织和矩阵运算。Commun公司。ACM 12,3(1969),153-165。谷歌学者谷歌学者
  30. 30ROBERT,Y.和SGUAZZERO,P.LU分解算法及其在IBM 3090向量多处理器上的高效Fortran实现。IBM ECSEC报告ICE-00061987。谷歌学者谷歌学者
  31. 31SCHRIEBER,R.模块设计规范(1.0版)。SAXPY Computer Corp.,加利福尼亚州桑尼维尔圣杰罗尼莫路255号,邮编940861986。谷歌学者谷歌学者
  32. 32SCHRIEBER,R.和PARLETT,B.块反射器:理论和计算。SIAM J.数字。分析。25,1(1988年2月),189-205。谷歌学者谷歌学者

索引术语

  1. 一组三级基本线性代数子程序

            建议

            评论

            查亚·古维茨

            FORTRAN基本线性代数子程序(即1级BLAS)的原始集合包括向量运算[1];随后添加了第2级BLAS中的例程,以提供矩阵-向量运算[2]。本文建议添加一组3级BLAS,用于执行矩阵-矩阵运算。1级和2级BLAS已被数学编程社区采用为基本例程,用作软件开发的构建块。BLAS的高效机器代码实现可以利用特定的硬件功能,从而显著提高计算速度。使用BLAS可提供便携性和易维护性。建议的3级BLAS特别适合在具有内存层次结构的计算机和使用并行处理器的机器上进行编程。对于这些类型的计算机,如果将矩阵划分为块,并且对块执行矩阵-矩阵运算,则计算效率最高。在支持并行处理的体系结构上,可以并行执行不同块上的操作。建议纳入第3级BLAS的操作包括:矩阵-矩阵乘积、对称矩阵和Hermetian矩阵的秩-k和秩-2k更新、矩形矩阵与三角形矩阵的乘积,以及求解具有多个右手边的三角方程组。这些例程提供给四种不同的FORTRAN数据类型:实数、双精度、复数和双复数。本文描述了子程序的命名约定和调用序列,它们通常遵循二级BLAS中使用的约定。作者讨论了选择将纳入3级BLAS的操作时使用的推理。本文最后讨论了三级BLAS在求解数值线性代数问题中的应用,即子矩阵(块)运算。示例说明了如何使用第3级BLAS将Cholesky因子分解作为块算法来实现。

            访问计算机文献的关键评论在这里

            成为评论员计算评论。

            评论

            登录选项

            检查您是否可以通过登录凭据或您的机构访问本文。

            登录

            完全访问权限

            • 发布于

              数学软件上的封面图像ACM事务
              ACM数学软件汇刊 第16卷第1期
              1990年3月
              109页
              国际标准编号:0098-3500
              EISSN公司:1557-7295
              内政部:10.1145/77626
              期刊目录

              版权所有©1990 ACM

              出版商

              计算机协会

              美国纽约州纽约市

              出版历史

              • 出版:1990年3月1日
              发布于汤姆斯第16卷第1期

              权限

              请求有关此文章的权限。

              请求权限

              检查更新

              限定符

              • 文章

            PDF格式

            以PDF文件查看或下载。

            PDF格式

            电子阅读器

            使用eReader联机查看。

            电子阅读器