×

算法1019:一种基于任务的多移位QR/QZ算法,具有积极的早期放气功能。 (英语) Zbl 07500125号


MSC公司:

65-XX岁 数值分析
PDF格式BibTeX公司 XML格式引用
全文: 内政部 链接

参考文献:

[1] Adlerborn,B.、Kágström,B.和Kressner,D.,2014年。分布式存储HPC系统的并行QZ算法。SIAM J.科学。计算36,5(2014年9月),C480-C503。数字对象标识代码:10.1137/140954817·Zbl 1307.65039号
[2] Augonnet,C.、Thibault,S.、Namyst,R.和Wacrenier,P.-A.,2011年。StarPU:异构多核架构上任务调度的统一平台。同意。公司-实际。E.23,2(2011年1月),187-198。doi:10.1002/cpe.1631
[3] Bai,Z.和Demmel,J.,1989年。关于Hessenberg多移位QR迭代的块实现。《国际高速计算杂志》1,1(1989),97-112。doi:10.1142/S0129053389000068·兹比尔0726.65035
[4] Bai,Z.和Demmel,J..1993年。关于交换实Schur形式的对角块。线性代数应用。186(1993年6月),73-95。doi:10.1016/0024-3795(93)90286-W·Zbl 0783.65030号
[5] Braman,K.、Byers,R.和Mathias,R.,2002a。多移位QR算法。第一部分:保持重点明确的轮班和3级绩效。SIAM J.矩阵分析。申请23,4(2002),929-947。doi:10.1137/S0895479801384573·Zbl 1017.65031号
[6] Braman,K.、Byers,R.和Mathias,R.,2002b。多移位QR算法。第二部分。严重的早期通货紧缩。SIAM J.矩阵分析。申请23,4(2002),948-973。doi:10.1137/S0895479801384585·Zbl 1017.65032号
[7] Byers,R.,2007年。LAPACK 3.1 xHSEQR:具有积极早期通货紧缩的小凸起多移位QR算法的调整和实现说明。第187页。
[8] Dongarra,J.、Gates,M.、Haidar,A.、Kurzak,J.,Luszczek,P.、Tomov,S.和Yamazaki,I.,2014年。使用GPU加速数值密集线性代数计算。《使用GPU进行数值计算》,Kindratenko,V.(Ed.)。斯普林格。doi:10.1007/978-3-319-06548-9_1·Zbl 1317.65078号
[9] Dongarra,J.和Whaley,R.C.,1997年。BLACS用户指南。第94页。
[10] 弗朗西斯,J.G.F.,1961年。QR变换是LR变换的一个统一模拟——第1部分。计算。J.4,3(1961年1月),265-271。doi:10.1093/comjnl/4.3.265·Zbl 0104.34304号
[11] Fukaya,T.、Imamura,T..和Yamamoto,Y.,2018年。稠密矩阵计算性能建模案例研究:K计算机上特征Exa特征解算器中的三对角化。2018年IEEE国际并行和分布式处理研讨会(IPDPSW)。1113-1122. doi:10.1109/IPDPSW.2018.00171
[12] Golub,G.H.和Van Loan,C.F.,1996年。矩阵计算(第4版)。约翰斯·霍普金斯大学出版社,马里兰州巴尔的摩·Zbl 0865.65009号
[13] Granat,R.、Kågström,B.、Kressner,D.和Shao,m.,2015年a。ALGORITHM 953:用于带有积极早期放气的多移位QR算法的并行库软件。ACM事务处理。数学。软件41,4(2015年10月),1-23。doi:10.1145/2699471·Zbl 1347.65070号
[14] Granat,R.、Kágström,B.、Kressner,D.和Shao,m.,2015b。ALGORITHM 953:具有积极早期收缩的多移位QR算法的并行库软件-电子附录:性能模型推导。ACM事务处理。数学。软件41,4(2015年10月)。doi:10.1145/2699471·Zbl 1347.65070号
[15] Hernandez,V.、Roman,J.E.和Vidal,V.,2005年。SLEPc:用于解决特征值问题的可扩展且灵活的工具包。ACM事务处理。数学。软件31,3(2005年9月),351-362。数字对象标识代码:10.1145/1089014.1089019·Zbl 1136.65315号
[16] 海姆,D.J.和海姆,N.J.,1998年。结构向后误差和广义特征值问题的条件。SIAM J.矩阵分析。申请20,2(1998),493-512。doi:10.1137/S0895479896313188·Zbl 0935.65032号
[17] Kágström,B..1993年。正则矩阵对(A,B)的广义实Schur型特征值重排序的直接方法。《大规模和实时应用的线性代数》,Moonen,M.S.、Golub,G.H.和Moor,B.L.R.De(编辑)。施普林格荷兰,多德雷赫特,195-218。doi:10.1007/978-94-015-8196-7_11
[18] Karlsson,L.、Eljammaly,M.和Myllykoski,M.,2019年。D6.5自动调谐技术评估。技术报告。瑞典乌梅大学计算科学系,瑞典乌梅SE-901 87。
[19] Karlsson,L.、Kressner,D.和Lang,B.,2014年。多移位QR算法中的最优压缩凸链。ACM事务处理。数学。Softw.40,2,第12条(2014年2月),15页。doi:10.1145/2559986·Zbl 1305.65122号
[20] Mikkelsen,C.C.Kjelgaard,Myllykoski,M.,Adlerborn,B.,Karlsson,L.和KágströM,B..2017年。D2.5:特征值问题求解器。技术报告。瑞典乌梅大学计算科学系,瑞典乌梅SE-901 87。
[21] Marek,A.,Blum,V.,Johanni,R.,Havu,V.、Lang,B.、Auckenthaler,T.、Heinecke,A.、Bungartz,H.-J.和Lederer,H.,2014年。ELPA库:用于电子结构理论和计算科学的可扩展并行特征值解决方案。物理学杂志:凝聚态Matter26,21(2014年5月),201-213。doi:10.1088/0953-8984/26/21/213201
[22] Myllykoski,M.,2018年。一种基于任务的算法,用于对实Schur形式的矩阵特征值进行重新排序。《并行处理与应用数学》,PPAM 2017(,第10777卷),Wyrzykowski,R.,Dongarra,J.,Deelman,E.和Karczewski,K.(编辑)。施普林格国际出版公司,207-216。doi:10.1007/978-319-78024-5_19
[23] 密利可斯基,M.,2020年。基于任务的Schur Reduction,N=20000,共享内存,28核。https://www.youtube.com/watch?v=VPHL0m2tmgI。 ·Zbl 07500125号
[24] Myllykoski,M.、Karlsson,L.、KágströM,B.、Eljammaly,M.,Pranesh,S.和Zounon,M.。2018年。D2.6:特征值问题求解器原型软件。技术报告。乌梅大学和曼彻斯特大学。
[25] Myllykoski,M.和Mikkelsen,C.C.Kjelgard。2020年b月。StarNEig简介-用于解决非对称特征值问题的基于任务的库。《并行处理与应用数学》,PPAM 2019(第12043卷),Wyrzykowski,R.,Deelman,E.,Dongarra,J.和Karczewski,K.(编辑)。施普林格自然瑞士公司,70-81。数字对象标识代码:10.1007/978-3-030-43229-47
[26] Myllykoski,M.和Mikkelsen,C.C.Kjelgard。2020a年。基于任务、GPU加速的健壮库,用于解决密集非对称特征值问题。同意。公司-实际。E.(2020年8月)。doi:10.1002/cpe.5915
[27] Myllykoski,M.、Mikkelsen,C.C.Kjelgard、Karlsson,L.和KágströM,B.,2017年。实数Schur形式矩阵重排序的基于任务的并行算法。NLAFET工作说明WN-11。另见报告UMINF 17.11,瑞典乌梅大学计算科学系,SE-901 87 Umeá。
[28] Myllykoski,M.、Mikkelsen,C.C.Kjelgard,Schwarz,A.和KágströM,B.2019a。D2.7:非对称问题的特征值求解器。技术报告。瑞典乌梅大学计算科学系,瑞典乌梅SE-901 87。
[29] Myllykoski,M.、Mikkelsen,C.C.Kjelgaard、Schwarz,A.、Karlsson,L.和KágströM,B..2019b。StarNEig:用于解决密集非对称特征值问题的基于任务的库。https://nlafet.github.io/StarNEig/。
[30] Poulson,J.、Marker,B.、van de Geijn,R.A.、Hammond,J.R.和Romero,N.A.,2013年。Elemental:分布式内存密集矩阵计算的新框架。ACM事务处理。数学。Softw.39,2,第13条(2013年2月),24页。doi:10.1145/2427023.2427030·Zbl 1295.65137号
[31] Quintana Ortí,G.和van de Geijn,R.,2006年。提高还原成Hessenberg形式的性能。ACM Trans。数学。软件32,2(2006年6月),180-194。doi:10.1145/1141885.1141887·Zbl 1365.65094号
[32] Steel,T.、Camps,D.、Meerbergen,K.和Vandebril,R.,2020年。一种具有激进早期通货紧缩的多移位多极理性QZ方法·Zbl 1467.65032号
[33] Thibault,S.,2018年。异构平台上基于任务编程的运行时系统。波尔多大学生活习惯。
[34] Tomov,S.和Dongarra,J.,2009年。通过基于GPU的混合计算加速简化为上Hessenberg形式。技术报告。LAWN第219页·Zbl 1214.65020号
[35] Watkins,D.和Elsner,L.,1994年。广义特征值问题的分解理论和凸包变换算法。SIAM J.矩阵分析。申请日期:943-967年7月3日(1994年7月)。doi:10.1137/S089547989122377X·Zbl 0808.65027号
[36] Yarkhan,A.、Kurzak,J.、Luszczek,P.和Dongarra,J.,2017年。将PLASMA数字库移植到OpenMP标准。《国际并行程序杂志》45,3(2017年6月),612-633。doi:10.1007/s10766-016-0441-6
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。