×

从不完整数据中进行流式主成分分析。 (英语) Zbl 1441.62159号

摘要:线性子空间模型在计算科学中普遍存在,尤其适用于由于隐私问题或采样限制而经常不完整的大型数据集。因此,一个关键问题是从计算复杂性和存储量两方面开发一种有效的算法,从不完整数据中高效地检测低维线性结构。
本文提出了一种流子空间估计算法,称为基于部分项插值的子空间导航(SNIPE),该算法有效地处理不完整数据块,以估计潜在的子空间模型。在每次迭代中,SNIPE都会找到最适合新数据块的子空间,但仍与之前的估计值接近。我们证明了SNIPE是一个求解基本非凸矩阵完成问题的流式解算器,无论初始化如何,它都全局收敛到该程序的一个稳定点,并且收敛是局部线性的,具有很高的概率。我们还发现,SNIPE在我们的数值模拟中显示出最先进的性能。

MSC公司:

62小时25分 因子分析和主成分;对应分析
62D10号 缺少数据
62-08 统计问题的计算方法
68周27 在线算法;流式算法
PDF格式BibTeX公司 XML格式引用
全文: arXiv公司 链接

参考文献:

[1] B.A.Ardekani、J.Kershaw、K.Kashikura和I.Kanno。使用子空间建模和最大似然估计的功能MRI激活检测。IEEE医学成像学报,18(2):101-1141999。
[2] R.Arora、A.Cotter、K.Livescu和N.Srebro。PCA和PLS的随机优化。在Allerton通信、控制和计算年度会议上,第861-868页。IEEE,2012年。
[3] A.Balsubramani、S.Dasgupta和Y.Freund。增量主成分分析的快速收敛。《神经信息处理系统进展》,第3174-3182页,2013年。
[4] L.Balzano和S.J Wright。关于GROUSE和增量SVD。IEEE多传感器自适应处理(CAMSAP)计算进展国际研讨会,第1-4页。IEEE,2013年。
[5] L.Balzano和S.J.Wright。部分数据子空间识别算法的局部收敛性。计算数学基础,15(5):1279-13142015·Zbl 1327.90392号
[6] L.Balzano、R.Nowak和B.Recht。从高度不完全信息中在线识别和跟踪子空间。在Allerton通信、控制和计算年会上,第704-711页。IEEE,2010年。
[7] M.品牌。具有缺失值的不确定数据的增量奇异值分解。欧洲计算机视觉会议,第707-720页。斯普林格,2002年·Zbl 1034.68580号
[8] J.R.Bunch和C.P.Nielsen。更新奇异值分解。数字数学,31(2):111-1291978·Zbl 0421.65028号
[9] C.Cartis和K.Scheinberg。基于概率模型的无约束优化方法的全局收敛速度分析。数学规划,第1-39页,2017年·Zbl 1407.90307号
[10] Y.Chen。非相干优化矩阵完成。IEEE信息理论汇刊,61(5):2909-29232015·Zbl 1359.15022号
[11] Y.Chi、Y.C.Eldar和R.Calderbank。PETRELS:通过部分观测值的递归最小二乘进行并行子空间估计和跟踪。IEEE信号处理汇刊,61(23):5947-59592013·Zbl 1394.94127号
[12] M.A.Davenport和J.Romberg。从不完全观测中恢复低秩矩阵的概述。IEEE信号处理专题期刊,10(4):608-6222016。
[13] R.杜勒特。概率:理论和例子。剑桥大学出版社,2010年·Zbl 1202.60001号
[14] C.Eckart和G.Young。一个矩阵与另一个低阶矩阵的近似。《心理测量学》,1:211-2181936年。doi:10.1007/BF02288367。
[15] A.Eftekhari、L.Balzano和M.B.Wakin。当你期待格拉斯曼的时候,你会期待什么。IEEE信号处理快报,24(6):872-8762017。
[16] A.Eftekhari、M.B.Wakin和R.A.Ward。MC2:杠杆矩阵补全的两阶段算法。信息和推断:IMA杂志,7(3):581-6042018a·Zbl 1473.60018号
[17] A.Eftekhari、D.Yang和M.B.Wakin。带先验子空间信息的加权矩阵完成和恢复。IEEE信息理论汇刊,64(6):4044-4071,2018b·Zbl 1395.15020号
[18] N.Gershenfeld、S.Samouhos和B.Nordman。能效智能基础设施。《科学》,327(5969):1086-10882010。
[19] G.H.Golub和C.F.Van Loan。矩阵计算。约翰·霍普金斯数学科学研究。约翰·霍普金斯大学出版社,2013年·Zbl 1268.65037号
[20] A.Gonen、D.Rosenbaum、Y.C.Eldar和S.Shalev-Shwartz。部分信息的子空间学习。机器学习研究杂志,17(52):1-212016·Zbl 1360.68676号
[21] D.总量。从任何基础上的少数系数中恢复低秩矩阵。IEEE信息理论汇刊,57(3):1548-15662011·Zbl 1366.94103号
[22] T.Hastie、R.Tibshirani和J.Friedman。统计学习的要素:数据挖掘、推理和预测。统计学中的斯普林格系列。施普林格纽约,2013年·Zbl 0973.62007号
[23] 20年的阵列信号处理研究:参数方法。IEEE信号处理杂志,13(4):67-941996。
[24] A.Lakhina、M.Crovella和C.Diot。诊断网络范围的流量异常。InACM SIGCOMM Computer Communication Review,第34卷,第219-230页。ACM,2004年。
[25] B.洛伊斯和N.瓦斯瓦尼。在线矩阵完成和在线鲁棒PCA。IEEE信息理论国际研讨会(ISIT),1826-1830页。IEEE,2015年。
[26] K.Lounici。缺失观测值的高维协方差矩阵估计。伯努利,20(3):1029-10582014·Zbl 1320.62124号
[27] M.Mardani、G.Mateos和G.B.Giannakis。流式大数据矩阵和张量的子空间学习和插补。IEEE信号处理汇刊,63(10):2663-26772015·Zbl 1394.94371号
[28] L.Mirsky。对称规范函数和酉不变范数。夸脱。数学杂志。牛津,第1156-1159页,1966年。
[29] I.Mitliagkas、C.Caramanis和P.Jain。内存有限,流式PCA。《神经信息处理系统进展》,第2886-28942013页。
[30] I.Mitliagkas、C.Caramanis和P.Jain。流式处理PCA中有许多缺少的条目。预印本,2014年。
[31] J.Nocedal和S.J.Wright。数值优化。《Springer运筹学与金融工程系列》,纽约Springer出版社,2006年·Zbl 1104.65059号
[32] E.Oja和J.Karhunen。随机矩阵期望的特征向量和特征值的随机逼近。数学分析与应用杂志,106(1):69-841985·Zbl 0583.62077号
[33] J.Tanner和K.Wei。矩阵完成的标准化迭代硬阈值。SIAM科学计算杂志,35(5):S104-S1252013·Zbl 1282.65043号
[34] L.Tong和S.Perreau。多通道盲识别:从子空间到最大似然方法。IEEE会议记录,86:1951-19681998。
[35] J.A.特罗普。随机矩阵和的用户友好尾部界限。计算数学基础,12(4):389-4342012·Zbl 1259.60008号
[36] P.van Overschee和B.L.de Moor。线性系统的子空间识别:理论,实现,应用。美国施普林格出版社,2012年·Zbl 0888.93001号
[37] R.Vershynin。介绍随机矩阵的非渐近分析。Y.C.Eldar和G.Kutyniok主编,《压缩传感:理论和应用》,第95-110页。剑桥大学出版社,2012a。
[38] R.Vershynin的研究。样本协方差矩阵与实际协方差矩阵的接近程度如何?理论概率杂志,25(3):655-6862012b·Zbl 1365.62208号
[39] S.Watanabe和N.Pakvasa。模式识别的子空间方法。InProc.公司。第一。IJCPR,第25-32页,1973年。
[40] P.韦丁。奇异值分解的扰动界。BIT数字数学,12(1):99-1111972·Zbl 0239.15015号
[41] Y.Xie、J.Huang和R.Willett。缺失数据的高维时间序列的变点检测。IEEE信号处理专题期刊,7(1):12-272013。
[42] D。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。