医学硕士Iwen。;翁,B.W。 一种用于大型网络上聚集数据分析的分布式增量SVD算法。 (英语) Zbl 1349.15041号 SIAM J.矩阵分析。申请。 37,第4期,1699-1718(2016). 摘要:本文表明,矩阵的奇异值分解可以用层次方法有效地构造。证明了当输入矩阵A的秩已知时,该算法可以恢复输入矩阵的奇异值和左奇异向量。此外,该分层算法可用于恢复最大奇异值和有界误差的左奇异向量。此外,该方法对于原始矩阵项的舍入误差或损坏是稳定的。数值实验验证了所提算法和并行成本分析。 引用于11文件 MSC公司: 15A23型 矩阵的因式分解 65层20 超定系统伪逆的数值解 关键词:奇异值分解;低阶近似;分布式计算;增量SVD 软件:Hadoop公司;精密路径指示器;MAGMA公司;血浆;MLlib(MLlib);阿帕奇火花;火花 PDF格式BibTeX公司 XML格式引用 \textit{M.A.Iwen}和\textit{B.W.Ong},SIAM J.矩阵分析。申请。37,第4号,1699--1718(2016;Zbl 1349.15041) 全文: 内政部 arXiv公司 参考文献: [1] E.Agullo、J.Demmel、J.Dongarra、B.Hadri、J.Kurzak、J.Langou、H.Ltaief、P.Luszczek和S.Tomov,《新兴建筑的数值线性代数:等离子体和岩浆项目》,J.Phys。Conf.序列号。,180 (2009), 012037, . [2] W.K.Allard、G.Chen和M.Maggioni,《数据集的多尺度几何方法II:几何多分辨率分析》,应用。计算。哈蒙。分析。,32(2012),第435-462页·Zbl 1242.42038号 [3] C.G.Baker、K.A.Gallivan和P.Van Dooren,计算优势奇异子空间的{低秩增量方法},线性代数应用。,436(2012),第2866-2888页·Zbl 1241.65036号 [4] L.Balzano和S.J.Wright,{\it On GROUSE and incremental SVD},《IEEE第五届多传感器自适应处理计算进展国际研讨会论文集》,2013年,第1-4页。 [5] M.Brand,{薄奇异值分解的快速低阶修正},线性代数应用。,415(2006),第20-30页·Zbl 1088.65037号 [6] S.Browne、J.Dongarra、N.Garner、G.Ho和P.Mucci,《现代处理器性能评估的便携式编程接口》,国际高性能计算杂志。申请。,14(2000),第189-204页。 [7] J.R.Bunch和C.P.Nielsen,{更新奇异值分解},数值。数学。,31(1978),第111-129页·Zbl 0421.65028号 [8] J.R.Bunch、C.P.Nielsen和D.C.Sorensen,{对称特征问题的秩一修正},Numer。数学。,31(1978),第31-48页·Zbl 0369.65007号 [9] E.Chan、M.Heimlich、A.Purkayastha和R.van de Geijn,《集体沟通:理论、实践和经验》,《并行计算》。实践经验,19(2007),第1749-1783页。 [10] L.De Lathauwer、B.De Moor和J.Vandewalle,《多重线性奇异值分解》,SIAM J.Matrix Ana。申请。,21(2000),第1253-1278页·Zbl 0962.15005号 [11] R.D.Degroat,{\it非迭代子空间跟踪},IEEE Trans。信号处理。,40(1992年),第571-577页。 [12] J.Demmel、L.Grigori、M.Hoemmen和J.Langou,{it通信-最优并行和序列QR和LU因式分解},SIAM J.Sci。计算。,34(2012),第A206-A239页·兹比尔1241.65028 [13] G.Golub和W.Kahan,{计算矩阵的奇异值和伪逆},J.SIAM Ser。B数字。分析。,2(1965),第205-224页·Zbl 0194.18201号 [14] G.H.Golub,{一些修正的矩阵特征值问题},SIAM Rev.,15(1973),第318-334页·Zbl 0254.65027号 [15] M.Gu和S.C.Eisenstat,{降低奇异值分解},SIAM J.矩阵分析。申请。,16(1995),第793-810页·Zbl 0828.65039号 [16] M.Gu、Stanley、S.C.Eisenstat和I.O,{更新奇异值分解的稳定快速算法},技术报告,耶鲁大学,1994年·Zbl 0807.65029号 [17] A.Haidar,J.Kurzak和P.Luszczek,{一种改进的并行奇异值算法及其在多核硬件中的实现},《高性能计算、网络、存储和分析国际会议论文集》,纽约,ACM,2013年,第90:1-90:12页。 [18] N.Halko、P.G.Martinsson和J.A.Tropp,《寻找具有随机性的结构:构造近似矩阵分解的概率算法》,SIAM Rev.,53(2011),第217-288页·Zbl 1269.65043号 [19] R.A.Horn和C.R.Johnson,《矩阵分析的主题》,剑桥大学出版社,英国剑桥,1994年·Zbl 080115001号 [20] E.R.Jessup和D.C.Sorensen,《计算矩阵奇异值分解的并行算法》,SIAM J.matrix Ana。申请。,15(1994年),第530-548页·Zbl 0797.65037号 [21] I.T.Jolliffe,{主成分分析},第二版,Springer Ser。统计学。,Springer-Verlag,纽约,2002年·Zbl 1011.62064号 [22] T.G.Kolda、G.Ballard和W.N.Austin,《大尺度科学数据的平行张量压缩》,桑迪亚国家实验室,2015年。 [23] 郭敬通和赵浩,{增量特征分解},《ICANN学报》,2003年,第270-273页。 [24] 李毅,{论增量式稳健子空间学习},模式识别,37(2004),第1509-1518页·Zbl 1070.68591号 [25] F.Liu和F.Seinstra,{\it Adaptive parallel householder bidagonalization},摘自《2009年Euro-Par并行处理》,H.Sips、D.Epema和H.-X.Lin编辑,《计算讲义》。科学。5704,柏林施普林格,2009年,第821-833页。 [26] F.Liu和F.J.Seinstra,{\it-GPU-based parallel householder bidagonalization},《第19届ACM高性能分布式计算国际研讨会论文集》,纽约,ACM,2010年,第288-291页。 [27] H.Ltaief、P.Luszczek和J.Dongarra,{在同质多核体系结构上使用tile算法的高性能双对角约简},ACM Trans。数学。《软件》,39(2013),第16:1-6:22页·Zbl 1295.65145号 [28] P.Ma、M.W.Mahoney和B.Yu,《算法杠杆的统计视角》,J.Mach。学习。第16号决议(2015年),第861-911页·Zbl 1337.62164号 [29] X.Meng、J.K.Bradley、B.Yavuz、E.R.Sparks、S.Venkataraman、D.Liu、J.Freeman、D.B.Tsai、M.Amde、S.Owen、D.Xin、R.Xin、M.J.Franklin、R.Zadeh、M.Zaharia和A.Talwalkar,{it MLlib:Apache Spark}中的机器学习,CoRR,abs/1505.068072015·Zbl 1360.68697号 [30] M.Moonen、P.V.Dooren和J.Vandewalle,《子空间跟踪的奇异值分解更新算法》,SIAM J.Matrix Ana。申请。,13(1992),第1015-1038页·Zbl 0759.65017号 [31] I.V.Oseledets,{张量-应变分解},SIAM J.科学。计算。,33(2011),第2295-2317页·Zbl 1232.15018号 [32] D.Skoc̆aj和A.Leonardis,子空间的增量和鲁棒学习,图像视觉计算。,26(2008),第27-38页。 [33] G.W.Stewart,《子空间跟踪的更新算法》,IEEE Trans。信号处理。,40(1992),第1535-1541页。 [34] W.Řeh \rur \780»ek,{自然语言处理中语义分析的可伸缩性},马萨诸塞大学博士论文,2011年。 [35] T.White,《Hadoop:最终指南》,O’Reilly Media,加利福尼亚州塞瓦斯托波尔,2009年。 [36] M.Zaharia、M.Chowdhury、T.Das、A.Dave、J.Ma、M.McCauley、M.J.Franklin、S.Shenker和I.Stoica,{\it Resilient distributed datasets:A fault-to-tolerant abstration for in-memory cluster computing},《第九届USENIX网络系统设计与实现会议论文集》,加利福尼亚州伯克利,USENIX-协会,2012年,第2-2页。 [37] M.Zaharia、M.Chowdhury、M.J.Franklin、S.Shenker和I.Stoica,{\it Spark:带工作集的集群计算},《第二届USENIX云计算热点会议论文集》,加利福尼亚州伯克利,USENIX协会,2010年,第10-10页。 [38] H.Zha和H.D.Simon,关于潜在语义索引中的更新问题,SIAM J.Sci。计算。,21(1999),第782-791页·Zbl 0952.65034号 [39] H.Zhao,P.C.Yuen,J.T.Kwok,{一种新的增量主成分分析及其在人脸识别中的应用},IEEE Trans。Systems Man Cybernet。B、 36(2006),第873-886页。 此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。