阿明·埃夫特哈里;格雷戈里·昂吉;劳拉·巴尔扎诺;迈克尔·沃金。 从不完整数据中进行流式主成分分析。 (英语) Zbl 1441.62159号 J.马赫。学习。物件。 20,第86号论文,62页(2019年). 摘要:线性子空间模型在计算科学中普遍存在,尤其适用于由于隐私问题或采样限制而经常不完整的大型数据集。因此,一个关键问题是从计算复杂性和存储量两方面开发一种有效的算法,从不完整数据中高效地检测低维线性结构。本文提出了一种流子空间估计算法,称为基于部分项插值的子空间导航(SNIPE),该算法有效地处理不完整数据块,以估计潜在的子空间模型。在每次迭代中,SNIPE都会找到最适合新数据块的子空间,但仍与之前的估计值接近。我们证明了SNIPE是一个求解基本非凸矩阵完成问题的流式解算器,无论初始化如何,它都全局收敛到该程序的一个稳定点,并且收敛是局部线性的,具有很高的概率。我们还发现,SNIPE在我们的数值模拟中显示出最先进的性能。 引用于2文件 MSC公司: 62小时25分 因子分析和主成分;对应分析 62D10号 缺少数据 62-08 统计问题的计算方法 68周27 在线算法;流式算法 关键词:主成分分析;子空间识别;矩阵完成;流式算法;非凸优化;全球收敛 软件:ElemStatLearn(电子状态学习) PDF格式BibTeX公司 XML格式引用 \textit{A.Eftekhari}等人,J.Mach。学习。第20号决议,第86号论文,62页(2019年;Zbl 1441.62159) 全文: arXiv公司 链接 参考文献: [1] B.A.Ardekani、J.Kershaw、K.Kashikura和I.Kanno。使用子空间建模和最大似然估计的功能MRI激活检测。IEEE医学成像学报,18(2):101-1141999。 [2] R.Arora、A.Cotter、K.Livescu和N.Srebro。PCA和PLS的随机优化。在Allerton通信、控制和计算年度会议上,第861-868页。IEEE,2012年。 [3] A.Balsubramani、S.Dasgupta和Y.Freund。增量主成分分析的快速收敛。《神经信息处理系统进展》,第3174-3182页,2013年。 [4] L.Balzano和S.J Wright。关于GROUSE和增量SVD。IEEE多传感器自适应处理(CAMSAP)计算进展国际研讨会,第1-4页。IEEE,2013年。 [5] L.Balzano和S.J.Wright。部分数据子空间识别算法的局部收敛性。计算数学基础,15(5):1279-13142015·Zbl 1327.90392号 [6] L.Balzano、R.Nowak和B.Recht。从高度不完全信息中在线识别和跟踪子空间。在Allerton通信、控制和计算年会上,第704-711页。IEEE,2010年。 [7] M.品牌。具有缺失值的不确定数据的增量奇异值分解。欧洲计算机视觉会议,第707-720页。斯普林格,2002年·Zbl 1034.68580号 [8] J.R.Bunch和C.P.Nielsen。更新奇异值分解。数字数学,31(2):111-1291978·Zbl 0421.65028号 [9] C.Cartis和K.Scheinberg。基于概率模型的无约束优化方法的全局收敛速度分析。数学规划,第1-39页,2017年·Zbl 1407.90307号 [10] Y.Chen。非相干优化矩阵完成。IEEE信息理论汇刊,61(5):2909-29232015·Zbl 1359.15022号 [11] Y.Chi、Y.C.Eldar和R.Calderbank。PETRELS:通过部分观测值的递归最小二乘进行并行子空间估计和跟踪。IEEE信号处理汇刊,61(23):5947-59592013·Zbl 1394.94127号 [12] M.A.Davenport和J.Romberg。从不完全观测中恢复低秩矩阵的概述。IEEE信号处理专题期刊,10(4):608-6222016。 [13] R.杜勒特。概率:理论和例子。剑桥大学出版社,2010年·Zbl 1202.60001号 [14] C.Eckart和G.Young。一个矩阵与另一个低阶矩阵的近似。《心理测量学》,1:211-2181936年。doi:10.1007/BF02288367。 [15] A.Eftekhari、L.Balzano和M.B.Wakin。当你期待格拉斯曼的时候,你会期待什么。IEEE信号处理快报,24(6):872-8762017。 [16] A.Eftekhari、M.B.Wakin和R.A.Ward。MC2:杠杆矩阵补全的两阶段算法。信息和推断:IMA杂志,7(3):581-6042018a·Zbl 1473.60018号 [17] A.Eftekhari、D.Yang和M.B.Wakin。带先验子空间信息的加权矩阵完成和恢复。IEEE信息理论汇刊,64(6):4044-4071,2018b·Zbl 1395.15020号 [18] N.Gershenfeld、S.Samouhos和B.Nordman。能效智能基础设施。《科学》,327(5969):1086-10882010。 [19] G.H.Golub和C.F.Van Loan。矩阵计算。约翰·霍普金斯数学科学研究。约翰·霍普金斯大学出版社,2013年·Zbl 1268.65037号 [20] A.Gonen、D.Rosenbaum、Y.C.Eldar和S.Shalev-Shwartz。部分信息的子空间学习。机器学习研究杂志,17(52):1-212016·Zbl 1360.68676号 [21] D.总量。从任何基础上的少数系数中恢复低秩矩阵。IEEE信息理论汇刊,57(3):1548-15662011·Zbl 1366.94103号 [22] T.Hastie、R.Tibshirani和J.Friedman。统计学习的要素:数据挖掘、推理和预测。统计学中的斯普林格系列。施普林格纽约,2013年·Zbl 0973.62007号 [23] 20年的阵列信号处理研究:参数方法。IEEE信号处理杂志,13(4):67-941996。 [24] A.Lakhina、M.Crovella和C.Diot。诊断网络范围的流量异常。InACM SIGCOMM Computer Communication Review,第34卷,第219-230页。ACM,2004年。 [25] B.洛伊斯和N.瓦斯瓦尼。在线矩阵完成和在线鲁棒PCA。IEEE信息理论国际研讨会(ISIT),1826-1830页。IEEE,2015年。 [26] K.Lounici。缺失观测值的高维协方差矩阵估计。伯努利,20(3):1029-10582014·Zbl 1320.62124号 [27] M.Mardani、G.Mateos和G.B.Giannakis。流式大数据矩阵和张量的子空间学习和插补。IEEE信号处理汇刊,63(10):2663-26772015·Zbl 1394.94371号 [28] L.Mirsky。对称规范函数和酉不变范数。夸脱。数学杂志。牛津,第1156-1159页,1966年。 [29] I.Mitliagkas、C.Caramanis和P.Jain。内存有限,流式PCA。《神经信息处理系统进展》,第2886-28942013页。 [30] I.Mitliagkas、C.Caramanis和P.Jain。流式处理PCA中有许多缺少的条目。预印本,2014年。 [31] J.Nocedal和S.J.Wright。数值优化。《Springer运筹学与金融工程系列》,纽约Springer出版社,2006年·Zbl 1104.65059号 [32] E.Oja和J.Karhunen。随机矩阵期望的特征向量和特征值的随机逼近。数学分析与应用杂志,106(1):69-841985·Zbl 0583.62077号 [33] J.Tanner和K.Wei。矩阵完成的标准化迭代硬阈值。SIAM科学计算杂志,35(5):S104-S1252013·Zbl 1282.65043号 [34] L.Tong和S.Perreau。多通道盲识别:从子空间到最大似然方法。IEEE会议记录,86:1951-19681998。 [35] J.A.特罗普。随机矩阵和的用户友好尾部界限。计算数学基础,12(4):389-4342012·Zbl 1259.60008号 [36] P.van Overschee和B.L.de Moor。线性系统的子空间识别:理论,实现,应用。美国施普林格出版社,2012年·Zbl 0888.93001号 [37] R.Vershynin。介绍随机矩阵的非渐近分析。Y.C.Eldar和G.Kutyniok主编,《压缩传感:理论和应用》,第95-110页。剑桥大学出版社,2012a。 [38] R.Vershynin的研究。样本协方差矩阵与实际协方差矩阵的接近程度如何?理论概率杂志,25(3):655-6862012b·Zbl 1365.62208号 [39] S.Watanabe和N.Pakvasa。模式识别的子空间方法。InProc.公司。第一。IJCPR,第25-32页,1973年。 [40] P.韦丁。奇异值分解的扰动界。BIT数字数学,12(1):99-1111972·Zbl 0239.15015号 [41] Y.Xie、J.Huang和R.Willett。缺失数据的高维时间序列的变点检测。IEEE信号处理专题期刊,7(1):12-272013。 [42] D。 此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。