内拉·博斯纳;拉尔斯·卡尔森 平行和非均匀\(m\)-Hessenberg-三角约化。 (英语) Zbl 1355.65047号 SIAM J.科学。计算。 39,第1号,C29-C47(2017). 小结:(m\)-Hessenberg-triangular-triangular(mHTT)约简是将三个矩阵同时正交化简为压缩形式。例如,它在求解各种控制理论问题中产生的移位线性系统中有应用。提出了一种新的异构CPU/GPU mHTT简化实现,并针对现有的CPU实现进行了评估。该算法将计算密集型矩阵-矩阵乘法卸载到GPU,并在CPU上保留内存密集型且具有复杂控制流的内部循环。实验表明,在具有2倍8个CPU内核和一个GPU的系统上,异构实现可以优于现有的CPU实现。未来的开发应该侧重于提高CPU计算的可伸缩性。 引用于1文件 MSC公司: 65平方英尺 线性系统和矩阵反演的直接数值方法 15A21号机组 规范形式、约简、分类 关键词:\(m\)-Hessenberg-三角形式;求解移位线性系统;吉文斯旋转;异构CPU/GPU实现;数值示例;算法;矩阵-矩阵乘法 软件:SLICOT公司;BLAS公司;LAPACK公司;CUBLAS公司 PDF格式BibTeX公司 XML格式引用 \textit{N.Bosner}和\textit{L.Karlsson},SIAM J.Sci。计算。39,第1号,C29--C47(2017;Zbl 1355.65047) 全文: 内政部 参考文献: [1] K.Ahuja、E.de Sturler、S.Gugercin和E.R.Chang,{回收BiCG及其在模型还原中的应用},SIAM J.Sci。计算。,34(2012年),第A1925-A1949页·Zbl 1253.65040号 [2] E.Anderson、Z.Bai、C.Bischof、L.S.Blackford、J.Demmel、J.Dongarra、J.Du Croz、A.Greenbaum、S.Hammarling、A.McKenney和D.Sorensen,《拉帕克用户指南》,第三版,SIAM,费城,1999年·Zbl 0934.65030号 [3] N.Bosner,{同时简化为m-Hessenberg-三角形形式的高效算法},BIT,55(2015),第677-703页·Zbl 1326.65036号 [4] N.Bosner,Z.Buyanović和Z.Drmač,{\it高效广义Hessenberg形式和应用},ACM Trans。数学。软件,39(2013),19·兹比尔1295.65038 [5] S.Gugercin、A.C.Antoulas和C.Beattie,大型线性动力系统的模型简化},SIAM J.矩阵分析。申请。,30(2008年),第609-638页·Zbl 1159.93318号 [6] B.K\aagstroím,D.Kressner,E.S.Quintana-Ortií,and G.Quintana-Ortié,{\it Blocked algorithms for the reduction to the Hessenberg-triangular form reviewed},BIT,48(2008),pp.563-584·Zbl 1157.65348号 [7] B.Lang,{在基于旋转的算法中使用第(3)级BLAS},SIAM J.Sci。计算。,19(1998年),第626-634页·Zbl 0912.65032号 [8] G.S.Miminis和C.C.Paige,{时不变线性系统极点配置算法},国际。《控制杂志》,35(1982),第341-354页·Zbl 0478.93022号 [9] Netlib,{\it BLAS(基本线性代数子程序)},(2015)。 [10] Niconet,{它是SLICOT:系统和控制理论中的子程序库},(2016)。 [11] NVIDIA,{it CUBLAS Library DU-\(06702-001_v 7.0\),《用户指南》},(2015)。 [12] C.C.Paige,{与计算可控性相关的数值算法的特性},IEEE Trans。自动化。控制,26(1981),第130-138页·Zbl 0463.93024号 [13] S.Tomov、R.Nath和J.Dongarra,{通过基于GPU的混合计算加速上Hessenberg、三对角和双对角形式的简化},并行计算。,36(2010年),第645-654页·Zbl 1214.65020号 此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。