×

平行和非均匀\(m\)-Hessenberg-三角约化。 (英语) Zbl 1355.65047号

小结:(m\)-Hessenberg-triangular-triangular(mHTT)约简是将三个矩阵同时正交化简为压缩形式。例如,它在求解各种控制理论问题中产生的移位线性系统中有应用。提出了一种新的异构CPU/GPU mHTT简化实现,并针对现有的CPU实现进行了评估。该算法将计算密集型矩阵-矩阵乘法卸载到GPU,并在CPU上保留内存密集型且具有复杂控制流的内部循环。实验表明,在具有2倍8个CPU内核和一个GPU的系统上,异构实现可以优于现有的CPU实现。未来的开发应该侧重于提高CPU计算的可伸缩性。

MSC公司:

65平方英尺 线性系统和矩阵反演的直接数值方法
15A21号机组 规范形式、约简、分类
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] K.Ahuja、E.de Sturler、S.Gugercin和E.R.Chang,{回收BiCG及其在模型还原中的应用},SIAM J.Sci。计算。,34(2012年),第A1925-A1949页·Zbl 1253.65040号
[2] E.Anderson、Z.Bai、C.Bischof、L.S.Blackford、J.Demmel、J.Dongarra、J.Du Croz、A.Greenbaum、S.Hammarling、A.McKenney和D.Sorensen,《拉帕克用户指南》,第三版,SIAM,费城,1999年·Zbl 0934.65030号
[3] N.Bosner,{同时简化为m-Hessenberg-三角形形式的高效算法},BIT,55(2015),第677-703页·Zbl 1326.65036号
[4] N.Bosner,Z.Buyanović和Z.Drmač,{\it高效广义Hessenberg形式和应用},ACM Trans。数学。软件,39(2013),19·兹比尔1295.65038
[5] S.Gugercin、A.C.Antoulas和C.Beattie,大型线性动力系统的模型简化},SIAM J.矩阵分析。申请。,30(2008年),第609-638页·Zbl 1159.93318号
[6] B.K\aagstroím,D.Kressner,E.S.Quintana-Ortií,and G.Quintana-Ortié,{\it Blocked algorithms for the reduction to the Hessenberg-triangular form reviewed},BIT,48(2008),pp.563-584·Zbl 1157.65348号
[7] B.Lang,{在基于旋转的算法中使用第(3)级BLAS},SIAM J.Sci。计算。,19(1998年),第626-634页·Zbl 0912.65032号
[8] G.S.Miminis和C.C.Paige,{时不变线性系统极点配置算法},国际。《控制杂志》,35(1982),第341-354页·Zbl 0478.93022号
[9] Netlib,{\it BLAS(基本线性代数子程序)},(2015)。
[10] Niconet,{它是SLICOT:系统和控制理论中的子程序库},(2016)。
[11] NVIDIA,{it CUBLAS Library DU-\(06702-001_v 7.0\),《用户指南》},(2015)。
[12] C.C.Paige,{与计算可控性相关的数值算法的特性},IEEE Trans。自动化。控制,26(1981),第130-138页·Zbl 0463.93024号
[13] S.Tomov、R.Nath和J.Dongarra,{通过基于GPU的混合计算加速上Hessenberg、三对角和双对角形式的简化},并行计算。,36(2010年),第645-654页·Zbl 1214.65020号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。