拉斐尔·罗德里格斯-桑切斯;桑德拉·卡塔兰;何塞·赫雷罗。;恩里克·金塔纳·奥尔蒂。;Tomás,Andrés E。 对称特征值问题和奇异值分解的双边紧带形式约简中的Look-ahead。 (英语) Zbl 1415.65090号 数字。算法 80,编号2,635-660(2019). 摘要:我们通过幺正相似变换将对称特征值问题的解简化为紧带形式,并计算奇异值分解(SVD)。具体来说,在第一种情况下,我们重新讨论了对称带形的约简,而在第二种情况下我们提出了一种类似的替代方法,将原始矩阵转换为(非对称)带形,取代产生三角带输出的传统约简方法。在这两种情况下,我们描述了标准的基于三级基本线性代数子程序(BLAS)的算法变体,这些程序通过look-ahead进行了增强,以克服面板因式分解带来的性能瓶颈。此外,我们的解决方案采用了与目标带宽不同的算法块大小,说明了此决策的重要性能优势。最后,我们证明了SVD的另一种紧凑频带形式是在相应的约简过程中引入有效的前瞻性策略的关键。 MSC公司: 2015财年65 矩阵特征值和特征向量的数值计算 65楼30 其他矩阵算法(MSC2010) 2005年5月 并行数值计算 关键词:紧带形式的双边化简;长得像个脑袋;对称特征值问题;奇异值分解 软件:SBR工具箱;BLIS公司;LAPACK公司;PMRRR公司;BLAS公司;电气MRRR PDF格式BibTeX公司 XML格式引用 \textit{R.Rodríguez-Sánchez}等人,数字。算法80,No.2,635--660(2019;Zbl 1415.65090) 全文: 内政部 arXiv公司 链接 参考文献: [1] Aliaga,J.I.,Alonso,P.,Badía,J.M.,Chacn,P..,Davidović,D.,López-Blanco,J.R.,Quintana-Ortyí,E.S.:用于多核架构和图形处理器上大分子功能运动模拟的快速带-krylov特征解算器。J.计算。物理学。309(附录C),314-323(2016)·Zbl 1352.65200号 ·doi:10.1016/j.jcp.2016.01.007 [2] Anderson,E.、Bai,Z.、Blackford,L.S.、Demmel,J.、Dongarra,J.J.、Du Croz,J.、Hammarling,S.、Greenbaum,A.、McKenney,A.、Sorensen,D.C.:洛杉矶警察局用户指南,第3版。SIAM(1999)·Zbl 0934.65030号 [3] Ballard,G.、Demmel,J.、Grigori,L.、Jacquelin,M.、Knight,N.、Nguyen,H.D.:从高肌QR重建户主向量。J.并行分布式组件。85, 3-31 (2015) ·doi:10.1016/j.jpdc.2015.06.003 [4] Bientinesi,P.,Igual,F.D.,Kressner,D.,Petschow,M.,Quintana-ortí,E.S.:多线程架构上对称特征值问题的压缩形式。并发组件:实际。实验23(7),694-707(2011)·doi:10.1002/cpe.1680 [5] Bischof,C.H.,Lang,B.,Sun,X.:算法807:连续频带缩减的SBR工具箱软件。ACM事务处理。数学。柔软。26(4), 602-616 (2000) ·Zbl 1365.65104号 ·数字对象标识代码:10.1145/365723.365736 [6] Buttari,A.,Langou,J.,Kurzak,J.,Dongarra,J.:一类用于多核架构的并行平铺线性代数算法。并行计算。35(1), 38-53 (2009) ·doi:10.1016/j.parco.2008.10.02 [7] Castaldo,A.M.、Whaley,R.C.、Samuel,S.:使用并行缓存分配缩放LAPACK面板操作。ACM事务处理。数学。柔软。39(4), 22:1-22:30 (2013) ·Zbl 1295.65135号 ·doi:10.1145/2491491.2491492 [8] Catalȧn,S.,Herrero,J.R.,Quintana-ortí,E.S.,Rodríguez-Sa \775;nchez,R.,van de Geijn,R.A.:可延展线程级线性代数库的一个案例:具有部分枢轴的LU因式分解。CoRR,arXiv:1611.06365(2016) [9] Davidović,D.,Quintana-Ortií,E.S.:应用OOC技术将GPU上的超大对称特征值问题简化为凝聚形式。摘自:第20届欧洲微观并行、分布式和基于网络的处理会议记录——2012年PDP,第442-449页(2012年) [10] Davis,T.A.,Rajamanickam,S.:算法8xx:PIRO BAND,用于频带缩减的流水线平面旋转。ACM事务处理。数学。柔软。提交 [11] Dhillon,I.S.,Parlett,B.N.,Vömel,C.:MRRR算法的设计和实现。ACM事务处理。数学。柔和。32(4),533-560(2006)·Zbl 1230.65046号 ·doi:10.1145/1186785.1186788 [12] Dongarra,J.J.,Du Croz,J.,Hammarling,S.,Duff,I.:一组三级基本线性代数子程序。ACM事务处理。数学。柔和。16(1), 1-17 (1990) ·Zbl 0900.65115号 ·数字对象标识代码:10.1145/77626.79170 [13] Dongarra,J.J.,Croz,J.D.,Hammarling,S.,Hanson,R.J.:FORTRAN基本线性代数子程序的扩展集。ACM事务处理。数学。柔和。14 (1), 1-17 (1988) ·Zbl 0639.65016号 ·数字对象标识代码:10.1145/42288.42291 [14] Fernando,K.V.,Parlett,B.N.:精确奇异值和微分QD算法。数字。Mathematik 67(2),191-229(1994)·Zbl 0814.65036号 ·doi:10.1007/s002110050024 [15] Golub,G.H.,Van Loan,C.F.:《矩阵计算》,第三版。约翰·霍普金斯大学出版社,巴尔的摩(1996)·Zbl 0865.65009号 [16] Grosser,B.,Lang,B.:双向形式的有效并行约简。并行计算。25(8), 969-986 (1999) ·Zbl 1062.65503号 ·doi:10.1016/S0167-8191(99)00041-1 [17] Gu,M.,Eisenstat,S.C.:双对角SVD的分治算法。SIAM J.矩阵分析。申请。16(1), 79-92 (1995) ·Zbl 0821.65019号 ·doi:10.1137/S0895479892242222 [18] Haidar,A.,Ltaief,H.,Dongarra,J.:使用聚集的细粒度和存储软件内核将对称特征值问题并行简化为浓缩形式。2011年高性能计算、网络、存储和分析国际会议(SC),第1-11页(2011) [19] Haidar,A.,Kurzak,J.,Luszczek,P.:一种改进的并行奇异值算法及其在多核硬件中的实现。摘自:《高性能计算、网络、存储和分析国际会议论文集》,SC'13,第90:1-90:12页。ACM,纽约(2013) [20] Moldaschl,M.,Gansterer,W.N.:对称带矩阵特征解算器的比较。科学。计算。程序。90(PA),55-66(2014)·doi:10.1016/j.scico.2014.01.005 [21] Petschow,M.,Peise,E.,Bientinesi,P.:稠密厄米特特征问题的高性能求解器。SIAM J.科学公司。35(1),C1-C22(2013)·Zbl 1264.65054号 ·数字对象标识代码:10.1137/10848803 [22] Quintana-Orti,G.,Quintana-Ortí,E.S.,van de Geijn,R.A.,van Zee,F.G.,Chan,E.:线程级并行的编程矩阵算法。ACM事务处理。数学。柔和。36(3), 14:1-14:26 (2009) ·Zbl 1364.65105号 ·doi:10.1145/1527286.1527288 [23] Strazdins,P.:并行矩阵分解的前瞻和算法块技术的比较。技术报告TR-CS-98-07,澳大利亚国立大学计算机科学系堪培拉0200 ACT,澳大利亚(1998) [24] Van Zee,F.G.、Smith,T.M.、Marker,B.、Low、T.M.,Van De Geijn,R.A.、Igual,F.D.、Smelyanskiy,M.、Zhang,X.、Kistler,M.,Austel,V.、Gunnels,J.A.、Killough,L.:BLIS框架:可移植性实验。ACM事务处理。数学。柔和。42(2), 12:1-12:19 (2016) ·doi:10.1145/2755561 此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。