跳到主要内容
10.5555/1775059.1775062指导程序文章/章节视图摘要出版物页面会议记录acm-pubtype公司
第条

下一个LAPACK和ScaLAPACKs库的招股说明书

作者信息和声明
出版:2006年6月18日出版历史

摘要

计划发布广泛使用的LAPACK和ScaLAPACK-数值线性代数库的新版本。根据正在进行的用户调查(www.netlib.org/lapack-dev)和许多人的研究,我们提出了以下改进:更快的算法,包括更好的数值方法、内存层次优化、并行性和自动性能调整,以适应新的体系结构;更精确的算法,包括更好的数值方法,以及使用额外的精度;扩展功能,包括更新和降级、新特征问题等,并将更多的LAPACK放入ScaLAPACK中;改进了易用性,例如通过多语言的友好界面。为了实现这些目标,我们还依赖于更好的软件工程技术和许多机构合作者的贡献。

工具书类

  1. Steele,A.等人:Fortress语言规范,版本0.707,research.sun.com/projects/plrg/forttles0707.pdf谷歌学者谷歌学者
  2. Andersen,B.S.,Wazniewski,J.:填充存储中矩阵的Cholesky因式分解的递归公式。ACM事务处理。数学。柔软。27(2),214-244(2001年)。谷歌学者谷歌学者数字图书馆数字图书馆
  3. 安德森,E.:LAPACK3E(2003),http://www.netlib.org/lapack3e谷歌学者谷歌学者
  4. Ashcraft,C.,Grimes,R.G.,Lewis,J.G.:精确对称不定线性方程求解器。SIAM J.矩阵分析。申请。20(2), 513-561 (1998).谷歌学者谷歌学者数字图书馆数字图书馆
  5. Bailey,D.、Demmel,J.、Henry,G.、Hida,Y.、Iskandar,J.,Kahan,W.、Kang,S.、Kapur,A.、Li,X.、Martin,M.、Thompson,B.、Tung,T.、Yoo,D.:扩展和混合精度BLAS的设计、实施和测试。ACM事务处理。数学。柔软。28(2), 152-205 (2002).谷歌学者谷歌学者数字图书馆数字图书馆
  6. Barker,V.、Blackford,S.、Dongarra,J.、Du Croz,J.,Hammarling,S.,Marinova,M.、Wasniewski,J.和Yalamov,P.:LAPACK95用户指南。SIAM(2001),http://www.netlib.org/lapack95谷歌学者谷歌学者数字图书馆数字图书馆
  7. Barlow,J.,Bosner,N.,Drmač,Z.:一种新的稳定双对角归约算法(2004),www.cse.psu.edu/~Barlow/fastbidag.ps谷歌学者谷歌学者
  8. Benner,P.、Mehrmann,V.、Sima,V.,Van Huffel,S.、Varga,A.:SLICOT-系统和控制理论中的子程序库。应用与计算控制、信号与电路1499-539(1999)。谷歌学者谷歌学者
  9. Bientinisi,P.,Dhillon,I.S.,van de Geijn,R.:基于多个相对稳健表示的稠密对称矩阵的并行特征解算器。技术报告TR-03-26,德克萨斯大学计算机科学系(2003)。谷歌学者谷歌学者
  10. Bini,D.,Eidelman,Y.,Gemignani,L.,Gohberg,I.:酉矩阵秩-1扰动的Hessenberg矩阵的快速QR算法。意大利比萨大学数学系报告1587(2005),网址:http://www.dm.unipi.it/~gemignani/papers/begg.ps谷歌学者谷歌学者
  11. Bischof,C.H.,Lang,B.,Sun,X.:对称频带缩减框架。ACM事务处理。数学。柔软。26(4), 581-601 (2000).谷歌学者谷歌学者数字图书馆数字图书馆
  12. Blackford,L.S.、Choi,J.、Cleary,A.、Demmel,J.,Dhillon,I.、Dongarra,J.J.、Hammarling,S.、Henry,G.、Petitet,A.、Stanley,K.、Walker,D.W.、Whaley,R.C.:Scalapack原型软件。Netlib,橡树岭国家实验室(1997年)。谷歌学者谷歌学者
  13. Blackford,L.S.、Demmel,J.、Dongarra,J.,Duff,I.、Hammarling,S.、Henry,G.、Heroux,M.、Kaufman,L.、Lumsdaine,A.、Petitet,A.、Pozo,R.、Remington,K.、Whaley,R.C.:一组更新的基本线性代数子程序(BLAS)。ACM事务处理。数学。柔软。,28(2)(2002年6月)。谷歌学者谷歌学者数字图书馆数字图书馆
  14. Blackford,L.S.、Demmel,J.、Dongarra,J.,Duff,I.、Hammarling,S.、Henry,G.、Heroux,M.、Kaufman,L.、Lumsdaine,A.、Petitet,A.、Pozo,R.、Remington,K.、Whaley,R.C.、Maany,Z.、Krough,F.、Corliss,G.,Hu,C.、Keafott,B.、Walster,W.、Gudenberg,J.W.v.:基本线性代数子程序技术(BLAST)论坛标准。实习生。J.高性能计算。15(3-4) (2001).谷歌学者谷歌学者
  15. Blackford,S.、Corliss,G.、Demmel,J.、Dongarra,J.,Duff,I.、Hammarling,S.,Henry,G.,Heroux,M.、Hu,C.、Kahan,W.、Kaufman,L.、Kearfott,B.、Krogh,F.、Li,X.、Maany,Z.、Petitet,A.、Pozo,R.、Remington,K.、Walster,W.,Whaley,C.、Gudenberg,J.W.v.、Lumsdaine,A.:基本线性代数子程序技术(BLAST)论坛标准。实习生。J.高性能计算。15(3-4),305(2001),另请访问www.netlib.org/blast-forum/谷歌学者谷歌学者
  16. Braman,K.,Byers,R.,Mathias,R.:多移位QR算法。第一部分:保持重点明确的轮班和3级绩效。SIAM J.矩阵分析。申请。23(4), 929-947 (2001).谷歌学者谷歌学者数字图书馆数字图书馆
  17. Braman,K.,Byers,R.,Mathias,R.:多移位QR算法。第二部分:激进的早期通货紧缩。SIAM J.矩阵分析。申请。23(4), 948-973 (2001).谷歌学者谷歌学者数字图书馆数字图书馆
  18. Callahan,D.,Chamberlain,B.,Zima,H.:Cascade高生产力语言。参见:第九届高级并行编程模型和支持环境国际研讨会(HIPS 2004),第52-60页。IEEE Computer Society Press,Los Alamitos(2004),www.gwu.edu/~upc/publications/productivity.pdf谷歌学者谷歌学者交叉引用交叉引用
  19. Cantonnet,F.,Yao,Y.,Zahran,M.,El-Ghazawi,T.:UPC语言的生产力分析。In:IPDPS 2004 PMEO研讨会(2004),www.gwu.edu/~upc/publications/productivity.pdf谷歌学者谷歌学者交叉引用交叉引用
  20. Chandrasekaran,S.,Gu,M.:带状加半可分线性方程组的快速稳定算法。SIAM J.矩阵分析。申请。25(2), 373-384 (2003).谷歌学者谷歌学者数字图书馆数字图书馆
  21. CLAPACK:LAPACK用C表示,http://www.netlib.org/clapack/谷歌学者谷歌学者
  22. Coarfa,C.,Dotsenko,Y.,Mellor-Crummey,J.,Chavarria-Miranda,D.,Contonnet,F.,El-Ghazawi,T.,Mohanti,A.,Yao,Y.:全球地址空间语言的评估:Co-Array Fortran和统一并行C.In:Proc。第十届ACM SIGPLAN研讨会。《原理与实践与并行编程》(PPoPP 2005),纽约ACM出版社(2005),www.hipersoft.rice.edu/caf/publications/index.html谷歌学者谷歌学者数字图书馆数字图书馆
  23. Davies,P.,Higham,N.J.:计算矩阵函数的Schur-Parlett算法。SIAM J.矩阵分析。申请。25(2), 464-485 (2003).谷歌学者谷歌学者数字图书馆数字图书馆
  24. Demmel,J.,Hida,Y.,Kahan,W.,Li,X.S.,Mukherjee,S.,Riedy,E.J.:超精密迭代求精的误差界。ACM TOMS 32(2),325-351(2006)。谷歌学者谷歌学者数字图书馆数字图书馆
  25. Dhillon,I.S.:O中三对角矩阵条件数的可靠计算(n个)时间。SIAM J.矩阵分析。申请。19(3), 776-796 (1998).谷歌学者谷歌学者数字图书馆数字图书馆
  26. Dongarra,J.、Bunch,J.,Moler,C.、Stewart,G.W.:LINPACK用户指南。宾夕法尼亚州费城SIAM(1979年)。谷歌学者谷歌学者
  27. Dongarra,J.、D'Azevedo,E.:并行核心外ScaLAPACK LU、QR和Cholesky因式分解例程的设计和实现。田纳西州诺克斯维尔市田纳西大学计算机科学系技术报告CS-97-347(1997年1月),http://www.netlib.org/lapack/lawns/lawn118.ps谷歌学者谷歌学者
  28. Dongarra,J.,Hammarling,S.,Walker,D.:并行核心外LU分解的关键概念。田纳西州诺克斯维尔市田纳西大学计算机科学系技术报告CS-96-324(1996年4月),www.netlib.org/lapack/lawns/lawn110.ps谷歌学者谷歌学者
  29. Dongarra,J.,Pozo,R.,Walker,D.:Lapack++:高性能线性代数面向对象扩展的设计概述。收录:超级计算93,IEEE计算机学会出版社,Los Alamitos(1993),math.nist.gov/lapack++谷歌学者谷歌学者数字图书馆数字图书馆
  30. Dongarra,J.J.,Duff,I.S.,Sorensen,D.C.,van der Vorst,H.A.:高性能计算机的数值线性代数。宾夕法尼亚州费城SIAM(1998年)。谷歌学者谷歌学者
  31. Dongarra,J.J.、Luszczek,P.、Petitet,A.:LINPACK基准:过去、现在和未来。并发计算:实际。专家。15, 803-820 (2003).谷歌学者谷歌学者交叉引用交叉引用
  32. Dopico,F.M.,Molera,J.M.,Moro,J.:对称特征值问题的正交高相对精度算法。暹罗。《矩阵分析杂志》。申请。25(2), 301-351 (2003).谷歌学者谷歌学者数字图书馆数字图书馆
  33. Drmać,Z.,Veselic,K.:新的快速准确的Jacobi SVD算法。萨格勒布大学数学系技术报告(2004年)。谷歌学者谷歌学者
  34. Duff,I.S.,Vömel,C.:密集矩阵和稀疏矩阵的增量范数估计。位42(2),300-322(2002)。谷歌学者谷歌学者数字图书馆数字图书馆
  35. Elmroth,E.,Gustavson,F.,Jonsson,I.,Kágström,B.:密集矩阵库软件的递归分块算法和混合数据结构。SIAM评论46(1),3-45(2004)。谷歌学者谷歌学者交叉引用交叉引用
  36. f2c:Fortran到C转换器,http://www.netlib.org/f2c谷歌学者谷歌学者
  37. Fulton,C.,Howell,G.,Demmel,J.,Hammarling,S.:使用BLAS 2.5运算符的Cache-efficient双向对角化,第28页(2004年)(进行中)。谷歌学者谷歌学者
  38. Golub,G.,Van Loan,C.:矩阵计算,第三版。约翰·霍普金斯大学出版社,巴尔的摩(1996)。谷歌学者谷歌学者数字图书馆数字图书馆
  39. Graham,S.,Snir,M.,Patterson,C.(编辑):加速:超级计算的未来。国家研究委员会(2005年)。谷歌学者谷歌学者
  40. Granat,R.,Jonsson,I.,Kågström,B.:结合显式和递归分块求解分散内存平台中的三角Sylvester型矩阵方程。摘自:Danalotto,M.、Vanneschi,M.和Laforenza,D.(编辑)Euro-Par 2004。LNCS,第3149卷,第742-750页。斯普林格,海德堡(2004)。谷歌学者谷歌学者
  41. 格罗瑟,B.:Ein paraller und hochgenauer O(n个 2)算法für die bidagonale Singulärwertzerlegung。德国伍珀塔尔大学博士论文(2001年)。谷歌学者谷歌学者
  42. Gunnels,J.A.,Gustavson,F.G.,Henry,G.M.,van de Geijn,R.A.:FLAME:形式线性代数方法环境。ACM事务处理。数学。柔软。27(4), 422-455 (2001).谷歌学者谷歌学者数字图书馆数字图书馆
  43. Hargreaves,G.I.:计算线性时间内三对角矩阵和对角-plus可分矩阵的条件数。提交的技术报告,英国曼彻斯特大学数学系(2004年)。谷歌学者谷歌学者
  44. Higham,N.J.:半定矩阵的Cholesky分解分析。摘自:Cox,M.G.,Hammarling,S.(eds.)《可靠数值计算》,第9章,第161-186页。牛津大学克拉伦登出版社(1990年)。谷歌学者谷歌学者
  45. 高效计算系统(hpcs),http://www.highproductivity.org谷歌学者谷歌学者
  46. IEEE二进制浮点运算标准修订版(2002年),grouper.IEEE.org/groups/754谷歌学者谷歌学者
  47. JLAPACK:Java中的LAPACK,http://icl.cs.utk.edu/f2j谷歌学者谷歌学者
  48. Jonsson,I.,Kágström,B.:求解三角系统的递归分块算法。单侧耦合Sylvester型矩阵方程。ACM事务处理。数学。软件28(4),392-415(2002)。谷歌学者谷歌学者数字图书馆数字图书馆
  49. Jonsson,I.,Kágström,B.:求解三角系统的递归分块算法。二、。双面广义Sylvester和Lyapunov矩阵方程。ACM事务处理。数学。软件28(4),416-435(2002)。谷歌学者谷歌学者数字图书馆数字图书馆
  50. Kágström,B.,Kressner,D.:具有侵略性早期通货紧缩的QZ算法的多移位变量。SIAM J.矩阵分析。申请。29(1), 199-227 (2006).谷歌学者谷歌学者数字图书馆数字图书馆
  51. LAPACK贡献者网页,http://www.netlib.org/lapack-dev/contributions.html谷歌学者谷歌学者
  52. Li,X.S.、Demmel,J.W.、Bailey,D.H.、Henry,G.、Hida,Y.、Iskandar,J.、Kahan,W.、Kang,S.Y.、Kapur,A.、Martin,M.C.、Thompson,B.J.、Tung,T.、Yoo,D.J.:扩展和混合精度BLAS的设计、实施和测试。ACM事务处理。数学。柔软。28(2), 152-205 (2002).谷歌学者谷歌学者数字图书馆数字图书馆
  53. Menon,V.,Pingali,K.:向左看,向右看,再向左看:分形符号分析在线性代数代码重组中的应用。国际并行计算杂志。32(6), 501-523 (2004).谷歌学者谷歌学者数字图书馆数字图书馆
  54. Nishtala,R.、Chakrabarti,K.、Patel,N.、Sanghavi,K.,Demmel,J.、Yelick,K.和Brewer,E.:MPI中集体通信的自动调谐。附:SIAM并行程序会议海报。,旧金山,www.cs.berkeley.edu/~rajeshn/poster_draft_6.ppt谷歌学者谷歌学者
  55. Numrich,R.,Reid,J.:并行编程的Co-array Fortran。Fortran论坛,17(1998)。谷歌学者谷歌学者数字图书馆数字图书馆
  56. OSKI:优化的稀疏内核接口,http://bebop.s.berkeley.edu/oski/谷歌学者谷歌学者
  57. Parlett,B.N.,Dhillon,I.S.:正交特征向量和相对间隙。SIAM J.矩阵分析。申请。25(3), 858-899 (2004).谷歌学者谷歌学者数字图书馆数字图书馆
  58. Parlett,B.N.,Vömel,C.:粘合矩阵的紧簇和通过多个相对稳健的表示计算正交特征向量的缺点。加州大学伯克利分校(2004)(准备中)。谷歌学者谷歌学者
  59. Ralha,R.:单侧还原为双对角形式。Lin.Alg。申请。358, 219-238 (2003).谷歌学者谷歌学者交叉引用交叉引用
  60. 萨拉斯瓦特:实验语言X10的报告,v0.41。IBM Research技术报告(2005)。谷歌学者谷歌学者
  61. Slapničar,I.:高精度对称特征值分解和双曲奇异值分解。线性代数。申请。358, 387-424 (2002).谷歌学者谷歌学者交叉引用交叉引用
  62. Strazdins,P.E.:并行矩阵分解的前瞻和算法分块技术的比较。《国际并行分配系统网络杂志》4(1),26-35(2001)。谷歌学者谷歌学者
  63. Tisseur,F.,Meerbergen,K.:二次特征值问题综述。SIAM评论43234-286(2001)。谷歌学者谷歌学者数字图书馆数字图书馆
  64. TNT:模板数字工具包,http://math.nist.gov/tnt谷歌学者谷歌学者
  65. Vadhiyar,S.S.、Fagg,G.E.、Dongarra,J.:建立一个准确的集体沟通模型。实习生。J.高性能Comp。申请。,性能调整专题18(1),159-167(2004)。谷歌学者谷歌学者数字图书馆数字图书馆
  66. Vandebril,R.,Van Barel,M.,Mastronardi,M.:半可分矩阵的隐式QR算法,用于计算对称矩阵的特征分解。报告TW 367,计算机科学系,K.U.鲁汶,比利时鲁汶(2003)。谷歌学者谷歌学者
  67. Vuduc,R.,Demmel,J.,Bilmes,J.:自动性能调整的统计模型。收件人:实习生。Conf.计算。《科学》(2001年5月)。谷歌学者谷歌学者数字图书馆数字图书馆
  68. R.C.Whaley,J.Dongarra:ATLAS WWW主页,http://www.netlib.org/atlas网站/谷歌学者谷歌学者
  69. Whaley,R.C.,Petitet,A.,Dongarra,J.:软件和ATLAS项目的自动经验优化。并行计算27(1-2),3-25(2001)。谷歌学者谷歌学者数字图书馆数字图书馆
  70. Willems,P.:个人沟通(2006)。谷歌学者谷歌学者
  71. Yelick,K.、Semenzato,L.、Pike,G.、Miyamoto,C.、Liblit,B.、Krishnamurthy,A.、Hilfinger,P.、Graham,S.、Gay,D.、Colella,P.和Aiken,A.:Titanium:一种性能卓越的爪哇方言。并发:实践与经验10825-836(1998)。谷歌学者谷歌学者交叉引用交叉引用

建议

评论

登录选项

检查您是否可以通过登录凭据或您的机构访问本文。

登录

完全访问权限

  • 发布于

    封面图片指南会议记录
    第八届应用并行计算国际会议论文集:科学计算的最新进展
    2006年6月
    1191页
    国际标准图书编号:3540757546

    出版商

    Springer-Verlag公司

    柏林,海德堡

    出版历史

    • 出版:2006年6月18日

    限定符

    • 第条