×

用于计算病态矩阵QR分解的移位Cholesky QR。 (英语) Zbl 1434.65041号

摘要:Cholesky QR算法是计算tall-skiny矩阵(X\in\mathbb{R}^{m\次n})的QR分解的一种有效的通信最小化算法,其中\(m\ggn)。不幸的是,它本质上是不稳定的,并且当矩阵处于病态时,它经常会崩溃。最近的工作[山本Y.Yamamoto等,ETNA,Electron。事务处理。数字。分析。44, 306–326 (2015;Zbl 1330.65049号)]确定可以通过重复该算法两次(称为CholeskyQR)来修复不稳定性。然而,CholeskyQR(2)的适用性仍然受到Gram矩阵(X^{top}X)的Cholesky因式分解完成的要求的限制,这意味着它并不总是适用于2-范数条件数(kappa_2(X))大致大于(mathbf u^{-1/2})的矩阵(X),其中是单位舍入。在本文中,我们通过对计算出的Gram矩阵引入移位,将适用性扩展到(kappa_2(X)=mathcal{O}(mathbfu^{-1}),以保证Cholesky因式分解(R^{top}R=a^{top{a+sI\)在数值上成功。我们证明了计算的\(AR^{-1}\)具有大约以\(\mathbf u^{-1/2}\)为界的条件数,为此CholeskyQR\(2)安全地计算了QR因子分解,得到了正交性\(\Vert Q^{\top}Q-I\Vert_2\)和残差\(\Vert a-QR\Vert_F/\Vert a\Vert_F\)的计算\(Q\),两者的阶数均为\(\mathbf u\)。因此,我们基本上通过运行Cholesky QR三次来获得所需的QR分解。我们对所得算法shiftedCholeskyQR3进行了广泛的分析,以揭示其优异的数值稳定性。shiftedCholeskyQR3算法也具有高度的并行性,在处理斜内积时也适用且有效。我们通过实验证明了我们的发现,在实验中我们比其他方法取得了显著的加速。

MSC公司:

65层22 数值线性代数中的不适定性和正则化问题
15年23日 矩阵的因式分解
2015财年65 矩阵特征值和特征向量的数值计算
15甲18 特征值、奇异值和特征向量
65克50 舍入误差
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Z.Bai、J.Demmel、J.Dongarra、A.Ruhe和H.van der Vorst,《代数特征值问题求解模板:实用指南》,SIAM,费城,2000年·Zbl 0965.65058号
[2] R.Car和M.Parrinello,分子动力学和密度泛函理论的统一方法,物理学。修订稿。,55(1985),第2471-2474页,https://doi.org/10.103/PhysRevLett.55.2471。
[3] I.Daubechies、R.DeVore、M.Fornasier和C.S.Gu¨ntu¨rk,稀疏恢复的迭代重加权最小二乘最小化,Comm.Pure Appl。数学。,63(2010),第1-38页·Zbl 1202.65046号
[4] T.A.Davis和Y.Hu,佛罗里达大学稀疏矩阵收集,ACM Trans。数学。软质。,38(2011),第1:1-1:25页,https://doi.org/10.1145/2049662.2049663。 ·Zbl 1365.65123号
[5] J.Demmel,《关于Cholesky中的浮点错误》,《技术报告14》,LAPACK工作说明,1989年。
[6] J.Demmel、L.Grigori、M.Hoemmen和J.Langou,通信最优并行和顺序QR和LU因子分解,SIAM J.Sci。Comp,34(2012),第A206-A239页,https://doi.org/10.1137/080731992。 ·Zbl 1241.65028号
[7] T.Fukaya、R.Kannan、Y.Nakatsukasa、Y.Yamamoto和Y.Yanagisawa,计算病态矩阵QR因式分解的移位CholeskyQR,预印本,arXiv:1809.110852018,https://arxiv.org/abs/1809.11085。 ·Zbl 1434.65041号
[8] T.Fukaya、Y.Nakatsukasa、Y.Yanagisawa和Y.Yamamoto,CholeskyQR(2):大型并行系统上计算高阶奇异QR分解的一种简单且避免通信的算法,收录于《大型系统可伸缩算法最新进展第五次研讨会论文集》,IEEE出版社,2014年,第31-38页。
[9] L.Giraud、J.Langou、M.Rozložniík和J.Eshof,经典gram-schmidt正交化过程的舍入误差分析,数值。数学。,101(2005),第87-100页·Zbl 1075.65060号
[10] G.H.Golub、V.Loan和C.F.,《矩阵计算》,第四版,约翰霍普金斯大学出版社,巴尔的摩,2013年·Zbl 1268.65037号
[11] N.J.Higham,《数值算法的准确性和稳定性》,第2版,SIAM,费城,2002年·Zbl 1011.65010号
[12] A.Imakura和Y.Yamamoto,使用非标准内积高效实现修改的Gram-Schmidt正交化,日本工业和应用数学杂志,2019年,https://doi.org/10.1007/s13160-019-00356-4。 ·Zbl 1436.65046号
[13] R.Kannan,使用位图格式的高效稀疏矩阵多向量乘法,第20届IEEE高性能计算国际会议(HiPC’13),2013年12月,第286-294页,https://doi.org/10.109/HiPC.2013.6799135。
[14] R.Kannan,《结构分析中的数值线性代数问题》,曼彻斯特大学数学学院博士论文,2014年。
[15] B.R.Lowery和J.Langou,斜内积QR因子分解的稳定性分析,预印本,arXiv:1401.5171,2014,https://arxiv.org/abs/1401.5171。
[16] M.Mohiyuddin、M.Hoemmen、J.Demmel和K.Yelick,《稀疏矩阵求解器中通信最小化》,载于《高性能计算网络、存储和分析会议论文集》,SC'09,美国纽约州纽约市,2009年,美国计算机学会,第36:1-36:12页,https://doi.org/10.1145/1654059.1654096。
[17] 多精度计算工具箱。Advanpix,东京,http://www.advanpix.com。
[18] M.Rozložni-k,M.Tŭma,A.Smoktunowicz和J.Kopal,《非标准内积正交化方法的数值稳定性》,BIT(2012),第1-24页·Zbl 1259.65069号
[19] S.M.Rump和T.Ogita,超快速线性系统验证解决方案,J.Compute。申请。数学。,199(2007),第199-206页·兹比尔1108.65020
[20] A.Stathopoulos和K.Wu,具有恒定同步要求的块正交化程序,SIAM J.Sci。Comp,23(2002),第2165-2182页·Zbl 1018.65050号
[21] S.Toledo和E.Rabani,使用核心外滤波器对角化方法进行的超大电子结构计算,J.Compute。物理。,180(2002),第256-269页·Zbl 0995.81549号
[22] L.N.Trefethen和D.Bau,《数值线性代数》,SIAM,费城,1997年·Zbl 0874.65013号
[23] Y.Yamamoto、Y.Nakatsukasa、Y.Yanagisawa和T.Fukaya,CholeskyQR2算法的舍入误差分析,电子。事务处理。数字。Anal,44(2015),第306-326页·Zbl 1330.65049号
[24] I.Yamazaki、S.Tomov和J.Dongarra,混合精度Cholesky QR分解及其对多GPU多核CPU的案例研究,SIAM J.Sci。计算。,37(2015),第C307-C330页·Zbl 1320.65046号
[25] Y.Yanagisawa、T.Ogita和S.Oishi,精确逆Cholesky因式分解的改进算法,非线性理论及其应用,IEICE,5(2014),第35-46页·Zbl 1309.65032号
此参考列表基于出版商或数字数学图书馆提供的信息。它的项目与zbMATH标识符启发式匹配,并且可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。