文件Zbl 1441.62159-zbMATH Open

从不完整数据中进行流式主成分分析。（英语） Zbl 1441.62159号

J.马赫。学习。物件。 20，第86号论文，62页（2019年）.

摘要：线性子空间模型在计算科学中普遍存在，尤其适用于由于隐私问题或采样限制而经常不完整的大型数据集。因此，一个关键问题是从计算复杂性和存储量两方面开发一种有效的算法，从不完整数据中高效地检测低维线性结构。
本文提出了一种流子空间估计算法，称为基于部分项插值的子空间导航（SNIPE），该算法有效地处理不完整数据块，以估计潜在的子空间模型。在每次迭代中，SNIPE都会找到最适合新数据块的子空间，但仍与之前的估计值接近。我们证明了SNIPE是一个求解基本非凸矩阵完成问题的流式解算器，无论初始化如何，它都全局收敛到该程序的一个稳定点，并且收敛是局部线性的，具有很高的概率。我们还发现，SNIPE在我们的数值模拟中显示出最先进的性能。

引用于2文件

MSC公司：

62小时25分	因子分析和主成分；对应分析
62D10号	缺少数据
62-08	统计问题的计算方法
68周27	在线算法；流式算法

关键词：

主成分分析;子空间识别;矩阵完成;流式算法;非凸优化;全球收敛

软件：

ElemStatLearn（电子状态学习）

PDF格式 BibTeX公司 XML格式引用

全文： arXiv公司链接

参考文献：

[1]	B.A.Ardekani、J.Kershaw、K.Kashikura和I.Kanno。使用子空间建模和最大似然估计的功能MRI激活检测。IEEE医学成像学报，18（2）：101-1141999。
[2]	R.Arora、A.Cotter、K.Livescu和N.Srebro。PCA和PLS的随机优化。在Allerton通信、控制和计算年度会议上，第861-868页。IEEE，2012年。
[3]	A.Balsubramani、S.Dasgupta和Y.Freund。增量主成分分析的快速收敛。《神经信息处理系统进展》，第3174-3182页，2013年。
[4]	L.Balzano和S.J Wright。关于GROUSE和增量SVD。IEEE多传感器自适应处理（CAMSAP）计算进展国际研讨会，第1-4页。IEEE，2013年。
[5]	L.Balzano和S.J.Wright。部分数据子空间识别算法的局部收敛性。计算数学基础，15（5）：1279-13142015·Zbl 1327.90392号
[6]	L.Balzano、R.Nowak和B.Recht。从高度不完全信息中在线识别和跟踪子空间。在Allerton通信、控制和计算年会上，第704-711页。IEEE，2010年。
[7]	M.品牌。具有缺失值的不确定数据的增量奇异值分解。欧洲计算机视觉会议，第707-720页。斯普林格，2002年·Zbl 1034.68580号
[8]	J.R.Bunch和C.P.Nielsen。更新奇异值分解。数字数学，31（2）：111-1291978·Zbl 0421.65028号
[9]	C.Cartis和K.Scheinberg。基于概率模型的无约束优化方法的全局收敛速度分析。数学规划，第1-39页，2017年·Zbl 1407.90307号
[10]	Y.Chen。非相干优化矩阵完成。IEEE信息理论汇刊，61（5）：2909-29232015·Zbl 1359.15022号
[11]	Y.Chi、Y.C.Eldar和R.Calderbank。PETRELS：通过部分观测值的递归最小二乘进行并行子空间估计和跟踪。IEEE信号处理汇刊，61（23）：5947-59592013·Zbl 1394.94127号
[12]	M.A.Davenport和J.Romberg。从不完全观测中恢复低秩矩阵的概述。IEEE信号处理专题期刊，10（4）：608-6222016。
[13]	R.杜勒特。概率：理论和例子。剑桥大学出版社，2010年·Zbl 1202.60001号
[14]	C.Eckart和G.Young。一个矩阵与另一个低阶矩阵的近似。《心理测量学》，1:211-2181936年。doi:10.1007/BF02288367。
[15]	A.Eftekhari、L.Balzano和M.B.Wakin。当你期待格拉斯曼的时候，你会期待什么。IEEE信号处理快报，24（6）：872-8762017。
[16]	A.Eftekhari、M.B.Wakin和R.A.Ward。MC2：杠杆矩阵补全的两阶段算法。信息和推断：IMA杂志，7（3）：581-6042018a·Zbl 1473.60018号
[17]	A.Eftekhari、D.Yang和M.B.Wakin。带先验子空间信息的加权矩阵完成和恢复。IEEE信息理论汇刊，64（6）：4044-4071，2018b·Zbl 1395.15020号
[18]	N.Gershenfeld、S.Samouhos和B.Nordman。能效智能基础设施。《科学》，327（5969）：1086-10882010。
[19]	G.H.Golub和C.F.Van Loan。矩阵计算。约翰·霍普金斯数学科学研究。约翰·霍普金斯大学出版社，2013年·Zbl 1268.65037号
[20]	A.Gonen、D.Rosenbaum、Y.C.Eldar和S.Shalev-Shwartz。部分信息的子空间学习。机器学习研究杂志，17（52）：1-212016·Zbl 1360.68676号
[21]	D.总量。从任何基础上的少数系数中恢复低秩矩阵。IEEE信息理论汇刊，57（3）：1548-15662011·Zbl 1366.94103号
[22]	T.Hastie、R.Tibshirani和J.Friedman。统计学习的要素：数据挖掘、推理和预测。统计学中的斯普林格系列。施普林格纽约，2013年·Zbl 0973.62007号
[23]	20年的阵列信号处理研究：参数方法。IEEE信号处理杂志，13（4）：67-941996。
[24]	A.Lakhina、M.Crovella和C.Diot。诊断网络范围的流量异常。InACM SIGCOMM Computer Communication Review，第34卷，第219-230页。ACM，2004年。
[25]	B.洛伊斯和N.瓦斯瓦尼。在线矩阵完成和在线鲁棒PCA。IEEE信息理论国际研讨会（ISIT），1826-1830页。IEEE，2015年。
[26]	K.Lounici。缺失观测值的高维协方差矩阵估计。伯努利，20（3）：1029-10582014·Zbl 1320.62124号
[27]	M.Mardani、G.Mateos和G.B.Giannakis。流式大数据矩阵和张量的子空间学习和插补。IEEE信号处理汇刊，63（10）：2663-26772015·Zbl 1394.94371号
[28]	L.Mirsky。对称规范函数和酉不变范数。夸脱。数学杂志。牛津，第1156-1159页，1966年。
[29]	I.Mitliagkas、C.Caramanis和P.Jain。内存有限，流式PCA。《神经信息处理系统进展》，第2886-28942013页。
[30]	I.Mitliagkas、C.Caramanis和P.Jain。流式处理PCA中有许多缺少的条目。预印本，2014年。
[31]	J.Nocedal和S.J.Wright。数值优化。《Springer运筹学与金融工程系列》，纽约Springer出版社，2006年·Zbl 1104.65059号
[32]	E.Oja和J.Karhunen。随机矩阵期望的特征向量和特征值的随机逼近。数学分析与应用杂志，106（1）：69-841985·Zbl 0583.62077号
[33]	J.Tanner和K.Wei。矩阵完成的标准化迭代硬阈值。SIAM科学计算杂志，35（5）：S104-S1252013·Zbl 1282.65043号
[34]	L.Tong和S.Perreau。多通道盲识别：从子空间到最大似然方法。IEEE会议记录，86:1951-19681998。
[35]	J.A.特罗普。随机矩阵和的用户友好尾部界限。计算数学基础，12（4）：389-4342012·Zbl 1259.60008号
[36]	P.van Overschee和B.L.de Moor。线性系统的子空间识别：理论，实现，应用。美国施普林格出版社，2012年·Zbl 0888.93001号
[37]	R.Vershynin。介绍随机矩阵的非渐近分析。Y.C.Eldar和G.Kutyniok主编，《压缩传感：理论和应用》，第95-110页。剑桥大学出版社，2012a。
[38]	R.Vershynin的研究。样本协方差矩阵与实际协方差矩阵的接近程度如何？理论概率杂志，25（3）：655-6862012b·Zbl 1365.62208号
[39]	S.Watanabe和N.Pakvasa。模式识别的子空间方法。InProc.公司。第一。IJCPR，第25-32页，1973年。
[40]	P.韦丁。奇异值分解的扰动界。BIT数字数学，12（1）：99-1111972·Zbl 0239.15015号
[41]	Y.Xie、J.Huang和R.Willett。缺失数据的高维时间序列的变点检测。IEEE信号处理专题期刊，7（1）：12-272013。
[42]	D。

此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配，可能包含数据转换错误。在某些情况下，zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献，而不要求完整或完全匹配。

任何	在任何地方
一个	内部文档标识符
澳大利亚	作者、编辑
人工智能	内部作者标识符
钛	标题
洛杉矶	语言
所以	来源
ab公司	回顾，摘要
第页	出版年份
车辆	评审员
复写的副本	MSC代码
美国犹他州	关键字
日期	文档类型(j个：期刊文章；b条：book；一：图书文章）

一&b条	逻辑和
一\|b条	逻辑或
！ab公司	逻辑不
美国广播公司*	右通配符
"ab c公司"	短语
(ab c公司)	圆括号

示例

字段

操作员

从不完整数据中进行流式主成分分析。（英语） Zbl 1441.62159号

MSC公司：

关键词：

软件：

参考文献：

示例

字段

操作员

从不完整数据中进行流式主成分分析。 （英语） Zbl 1441.62159号

MSC公司：

关键词：

软件：

参考文献：

从不完整数据中进行流式主成分分析。（英语） Zbl 1441.62159号