×

住户QR因子分解与柱旋转随机化(HQRRP)。 (英语) Zbl 1365.65070号

摘要:在Householder QR因式分解中添加列旋转时的一个基本问题是,只有大约一半的计算可以根据高性能矩阵-矩阵乘法进行计算,这大大限制了所谓的阻塞算法所带来的好处。本文描述了一种通过随机投影选择轴向量组的技术。证明了对于(m×n)矩阵,该方法的渐近浮点计数为(2mn^2-(2/3)n^3),与最佳经典无阻塞Householder QR分解算法(有或无枢轴)的渐近浮点数相同。实验表明,当在具有多个内核的现代CPU上执行时,相对于LAPACK中的geqp3函数,速度加速接近一个数量级。此外,实验表明,随机数据透视选择策略的质量与经典数据透视策略的质量大致相同。所描述的算法是在开源许可证下提供的,可以与LAPACK或libflame一起使用。

MSC公司:

65平方英尺 线性系统和矩阵反演的直接数值方法
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] B.K.Alpert,混合高斯梯形求积规则,SIAM J.Sci。计算。,20(1999),第1551-1584页·Zbl 0933.41019号
[3] E.Anderson、Z.Bai、C.Bischof、L.S.Blackford、J.Demmel、J.J.Dongarra、J.D.Croz、S.Hammarling、A.Greenbaum、A.McKenney和D.Sorensen,《拉帕克用户指南》,第三版,SIAM,费城,1999年·Zbl 0934.65030号
[4] C.Bischof和C.Van Loan,{\it Householder矩阵乘积的WY表示},SIAM J.Sci。统计师。计算。,8(1987年),第s2-s13页·Zbl 0628.65033号
[5] C.H.Bischof和G.Quintana-Ortić,{\it Algorithm{\it 782}:稠密矩阵的秩揭示QR分解的代码},ACM Trans。数学。《软件》,24(1998),第254-257页·Zbl 0932.65034号
[6] C.H.Bischof和G.Quintana-Ortií,{计算等级揭示稠密矩阵的QR分解},ACM Trans。数学。《软件》,24(1998),第226-253页·Zbl 0932.65033号
[7] J.J.Dongarra、J.Du Croz、S.Hammarling和I.Duff,{\it三级基本线性代数子程序集},ACM Trans。数学。《软件》,16(1990),第1-17页·Zbl 0900.65115号
[8] J.J.Dongarra、I.S.Duff、D.C.Sorensen和H.A.van der Vorst,《在向量和共享内存计算机上求解线性系统》,SIAM,费城,1991年·Zbl 0770.65009号
[9] P.Drineas、R.Kannan和M.W.Mahoney,{矩阵的快速蒙特卡罗算法。II.计算矩阵的低秩近似},SIAM J.Compute。,36(2006),第158-183页·Zbl 1111.68148号
[10] J.Duersch和M.Gu,{使用随机抽样的真实BLAS-3性能QRCP},预印本,2015年。
[11] C.Eckart和G.Young,《一个矩阵与另一个低阶矩阵的近似》,《心理学》,第1期(1936年),第211-218页·JFM 62.1075.02标准
[12] A.Frieze、R.Kannan和S.Vempala,{寻找低阶近似的快速蒙特卡罗算法},J.ACM,51(2004),第1025-1041页·Zbl 1125.65005号
[13] G.H.Golub和C.F.Van Loan,《矩阵计算》,第三版,约翰霍普金斯大学出版社,巴尔的摩,1996年·Zbl 0865.65009号
[14] K.Goto和R.A.Geijn,《高性能矩阵乘法的解剖学》,ACM Trans。数学。《软件》,34(2008),第12页·Zbl 1190.65064号
[15] K.Goto和R.A.van de Geijn,{\it On Reduce TLB Misses in Matrix Multipalization},技术报告CS-TR-02-55,德克萨斯大学奥斯汀分校计算机科学系,2002年。
[16] M.Gu和S.C.Eisenstat,计算强秩揭示QR因式分解的高效算法,SIAM J.Sci。计算。,17(1996),第848-869页·Zbl 0858.65044号
[17] J.A.Gunnels、F.G.Gustavson、G.M.Henry和R.A.van de Geijn,{火焰:形式线性代数方法环境},ACM Trans。数学。《软件》,27(2001),第422-455页·Zbl 1070.65522号
[18] N.Halko、P.-G.Martinsson和J.A.Tropp,《寻找具有随机性的结构:构造近似矩阵分解的概率算法》,SIAM Rev.,53(2011),第217-288页·Zbl 1269.65043号
[21] T.Joffrain、T.M.Low、E.S.Quintana-Ortií、R.van de Geijn和F.G.van Zee,《累积户主转换》,重访},ACM Trans。数学。《软件》,32(2006),第169-179页·兹比尔1365.65106
[22] W.Kahan,{\it数值线性代数},Canad。数学。布尔,9(1966),第757-801页·Zbl 0236.65025号
[23] E.Liberty、F.Woolfe、P.-G.Martinsson、V.Rokhlin和M.Tygert,《矩阵低阶近似的随机算法》,Proc。国家。阿卡德。科学。美国,104(2007),第20167-20172页·Zbl 1215.65080号
[24] M.W.Mahoney,{矩阵和数据的随机算法},Found。《机器学习趋势》,3(2011),第123-224页·Zbl 1232.68173号
[25] P.Martinsson,{\it Blocked Rank-Leveling Gr Factorisions:How Randomized Sampling Can Be Used to Avoid Single-Vector Pivoting},预印本,2015年。
[26] P.-G.Martinsson、V.Rokhlin和M.Tygert,{矩阵逼近的随机算法},耶鲁大学计算机科学系耶鲁CS研究报告YALEU/DCS/RR-1361,2006年·Zbl 1210.65095号
[27] {\f5 P.-G.Martinson、V.Rokhlin和M.Tygert,}{\f5矩阵分解的随机算法}{\f5,Appl。计算。哈蒙。分析。,30(2011),第47-68页·Zbl 1210.65095号
[28] P.-G.Martinsson和S.Voronin,{高效计算矩阵秩揭示因子分解的随机分块算法},SIAM J.Sci。计算。,38(2016),第S485-S507页·兹比尔1352.65095
[29] J.Poulson、B.Marker、R.A.van de Geijn、J.R.Hammond和N.A.Romero,{元素:分布式内存密集矩阵计算的新框架},ACM Trans。数学。软质。,39(2013),第13页·Zbl 1295.65137号
[30] E.S.Quintana、G.Quintata、X.Sun和R.van de Geijn,《并行矩阵反演注记》,SIAM J.Sci。计算。,22(2001),第1762-1771页·Zbl 0991.65029号
[31] G.Quintana-Ortié,X.Sun,和C.H.Bischof,{\it A BLAS-{\it 3}版的QR因式分解与列旋转},SIAM J.Sci。计算。,19(1998),第1486-1494页·Zbl 0912.65034号
[32] R.Schreiber和C.Van Loan,{it Householder转换产品的存储效率WY表示},SIAM J.Sci。统计师。计算。,10(1989年),第53-57页·Zbl 0664.65025号
[33] G.Stewart,《矩阵算法卷:基本分解》,SIAM,费城,1998年·Zbl 0910.65012号
[34] F.G.Van Zee,《自由火焰:完整参考》,(2012年)。
[35] F.G.Van Zee、E.Chan、R.Van de Geijn、E.S.Quintana Ortí和G.Quintana Ortí,用于密集矩阵计算的libflame库,IEEE Comput。科学。《工程》,11(2009),第56-62页·Zbl 1364.65105号
[36] F.G.Van Zee和R.A.Van de Geijn,《BLIS:快速实例化BLAS功能的框架》,ACM Trans。数学。软件,41(2015)·Zbl 1347.65054号
[37] S.Voronin和P.Martinsson,{基于插值分解的CUR分解算法},2014。
[38] D.P.Woodruff,《作为数值线性代数工具的草图绘制》,预印本,2014年·Zbl 1316.65046号
[39] X.Zhang,Q.Wang,Y.Zhang{龙芯处理器上的模型驱动3级BLAS性能优化,《第18届并行和分布式系统国际会议论文集》,IEEE计算机学会,2012年,第684-691页。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。