兹沃尼米尔·布亚诺维奇;拉尔斯·卡尔森;丹尼尔·克雷斯纳 基于Householder的Hessenberg-三角形约简算法。 (英语) Zbl 1431.65041号 SIAM J.矩阵分析。申请。 39,第3期,1270-1294(2018). 作者摘要:用于计算矩阵束(a-lambda B)的特征值和特征向量的QZ算法要求首先将矩阵简化为Hessenberg-三角形(HT)形式。当前选择的HT约简方法完全依赖于Givens旋转,这些旋转部分累加成小的密集矩阵,然后使用矩阵乘法例程应用这些矩阵。然而,总触发器计数的一个非零部分仍必须作为从左到右交替应用的重叠Givens旋转序列来执行。与此计算模式相关的许多数据依赖性导致处理器的使用效率低下,并使得难以以可扩展的方式并行化算法。因此,在本文中,我们引入了一种完全不同的方法,该方法完全依赖于部分积累到(紧凑)WY表示中的(大型)Householder反射器。尽管新算法比最先进的算法需要更多的浮点运算,但对真实数据和合成数据的大量实验表明,即使在顺序设置中,它仍然具有竞争力。新算法被认为具有更好的并行可伸缩性,这一想法得到了早期使用多线程BLAS的小规模实验的部分支持。并行公式的设计和评估是未来的工作。审核人:魏汝旭(成都) 引用于三文件 MSC公司: 2015财年65 矩阵特征值和特征向量的数值计算 15A22号机组 矩阵铅笔 15A23型 矩阵的因式分解 65年20月 数值算法的复杂性和性能 关键词:迭代精化;Hessenberg-三角形约化;外壳反射器 引文:Zbl 1157.65348号 软件:mctoolbox软件;ELPA公司;有长椅的 PDF格式BibTeX公司 XML格式引用 \textit{Z.Bujanović}等人,SIAM J.矩阵分析。申请。39,第3号,1270--1294(2018;Zbl 1431.65041) 全文: 内政部 arXiv公司 参考文献: [2] B.Adlerborn、L.Karlsson和B.K\aagstrom,基于波前调度的分布式一级Hessenberg-三角化简,《技术报告UMINF 16.10》,瑞典Ume\aa大学计算科学系,Ume\aa,2016年。 [3] B.Adlerborn、B.K\ragstro¨m和D.Kressner,分布式存储HPC系统的并行QZ算法,SIAM J.科学。计算。,36(2014),第C480–C503页·Zbl 1307.65039号 [4] T.Auckenthaler、V.Blum、H.-J.Bungartz、T.Huckle、R.Johanni、L.Kra¨mer、B.Lang、H.Lederer和P.Willems,电子结构计算中部分对称特征值问题的并行求解,并行计算。,37(2011),第783–794页。 [5] P.Bientinesi、F.D.Igual、D.Kressner、M.Petschow和E.S.Quintana-Orti©,多线程结构对称特征值问题的压缩形式《并发计算实践经验》,23(2011),第694-707页。 [6] C.H.Bischof、B.Lang和X.Sun,对称频带缩减框架,ACM变速器。数学。《软件》,26(2000),第581-601页·Zbl 1365.65103号 [7] C.H.Bischof和C.F.Van Loan,Householder矩阵乘积的({W}{Y})表示,SIAM J.科学。统计师。计算。,8(1987),第S2-S13页·Zbl 0628.65033号 [8] K.Braman、R.Byers和R.Mathias,多移位(QR)算法。二、。严重的早期通货紧缩,SIAM J.矩阵分析。申请。,23(2002),第948–973页·Zbl 1017.65032号 [9] Z.Buyanović、L.Karlsson和D.Kressner,基于家庭成员的Hessenberg三角化简算法, 2017. ·兹比尔1431.65041 [10] Y.Chahlaoui和P.Van Dooren,线性定常动力系统模型降阶的基准示例集合,SLICOT工作说明2002-2,2002。 [11] J.J.Dongarra、D.C.Sorensen和S.J.Hammarling,特征值计算中矩阵的块化简,J.计算。申请。数学。,27(1989),第215-227页·Zbl 0679.65025号 [12] G.H.Golub和C.F.Van Loan,矩阵计算第四版,约翰霍普金斯大学数学研究生。科学。,约翰·霍普金斯大学出版社,马里兰州巴尔的摩,2013年·Zbl 1268.65037号 [13] R.Granat、B.K\aagstrom和D.Kressner,混合分布式存储HPC系统的一种新的并行(QR)算法,SIAM J.科学。计算。,32(2010年),第2345-2378页·Zbl 1216.65044号 [14] A.Haidar、H.Ltaief和J.Dongarra,使用聚合细粒度和存储软件内核并行化简为压缩形式的对称特征值问题,《2011年高性能计算、网络、存储和分析国际会议论文集》,纽约,ACM,2011年,第8:1–8:11页。 [15] A.Haidar、R.Solca、M.Gates、S.Tomov、T.Schulthess和J.Dongarra,电子结构计算中广义特征问题的前沿混合多GPU算法《超级计算》,J.Kunkel、T.Ludwig和H.Meuer主编,《计算讲义》。科学。7905,柏林施普林格出版社,2013年,第67-80页。 [16] M.Heinkenschloss、D.C.Sorensen和K.Sun,一类广义系统的平衡截断模型约简及其在Oseen方程中的应用,SIAM J.科学。计算。,30(2008),第1038–1063页·Zbl 1216.76015号 [17] N.J.Higham,数值算法的准确性和稳定性第二版,SIAM,费城,2002年·Zbl 1011.65010号 [18] A.Ilchmann和T.Reis编辑。,微分代数方程中的测量。四、,不同。阿尔盖布。埃克。论坛,施普林格,商会,2017·Zbl 1369.65004号 [19] B.K\aagstroím和D.Kressner,具有激进早期放气的QZ算法的多移位变体,SIAM J.矩阵分析。申请。,29(2006),第199-227页·Zbl 1137.65017号 [20] B.K\aagstróm、D.Kressner、E.S.Quintana-Ortí和G.Quintana-Ortí,重访Hessenberg-三角形简化的块算法BIT,48(2008),第563–584页·Zbl 1157.65348号 [21] L.Karlsson和B.K\aagstrom,共享内存体系结构上Hessenberg形式的并行两阶段简化,并行计算。,37(2011),第771-782页·Zbl 1248.65043号 [22] L.Karlsson和B.K\aagstrom,使用共享内存有效地将块Hessenberg形式简化为Hessenbeg形式,摘自《2010年PARA会议录:应用并行和科学计算》,《计算讲义》。科学。7134,柏林施普林格出版社,2012年,第258-268页。 [23] J.G.Korvink和B.R.Evgenii,Oberwolfach基准集合《大尺度系统降维》,P.Benner、V.Mehrmann和D.C.Sorensen编辑,Lect。注释计算。科学。工程45,施普林格,柏林,2005年,第311-316页;也可从获取。 [24] C.B.Moler和G.W.Stewart,广义矩阵特征值问题的一种算法,SIAM J.数字。分析。,10(1973年),第241-256页·Zbl 0253.65019号 [25] G.Quintana-Ortié和R.van de Geijn,改进Hessenberg形式约简的性能,ACM变速器。数学。软件,32(2006)·Zbl 1365.65094号 [26] R.Schreiber和C.F.Van Loan,Householder变换乘积的存储有效的({W}{Y})表示,SIAM J.科学。统计师。计算。,10(1989年),第53-57页·Zbl 0664.65025号 [27] D.S.Watkins,无限特征值存在下QZ算法的性能,SIAM J.矩阵分析。申请。,22(2000),第364–375页·Zbl 0969.65029号 此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。