基于紧恢复界的异常追踪的鲁棒PCA精确可恢复性

作者

  • 张洪扬 北京大学
  • 周晨林 北京大学
  • 张超(Chao Zhang) 北京大学
  • 爱德华常 HTC Research,台湾

内政部:

https://doi.org/10.1609/aaai.v29i1.9578

关键词:

鲁棒PCA、低秩、稀疏性、子空间恢复、异常检测

摘要

从噪声甚至损坏的数据中恢复子空间对于机器学习和数据分析中的各种应用至关重要。为了检测离群点,提出了基于离群点追踪的鲁棒PCA(R PCA),并得到了许多成功的应用。然而,目前关于离群追踪的理论分析表明,它只在腐败矩阵的稀疏度为O(n/r)时才成功,其中n是样本数,r是可能与n相当的内在矩阵的秩。此外,正则化参数建议为3/(7平方根gamma-n},其中gamma是一个先验未知的参数。本文利用非相干条件和提出的模糊条件,证明了当固有矩阵的秩为O(n log n)且腐败矩阵的稀疏性为O(n)时,Outlier Pursuit是成功的。我们进一步证明了两个边界的阶都是紧的。因此,通过Outlier Pursuit的R-PCA能够恢复更高秩的内在矩阵,并识别比现有结果所能预测的更密集的腐蚀。此外,我们建议正则化参数选择为1平方根{logn},这是确定的。我们的分析放弃了调整正则化参数的必要性,也大大扩展了Outlier Pursuit的工作范围。对合成数据和实际数据的实验验证了我们的理论。

下载

出版

2015-02-21

如何引用

张,H.,林,Z.,张,C.,&张,E.(2015)。通过具有严格恢复边界的离群追踪实现鲁棒PCA的精确可恢复性。AAAI人工智能会议记录,29(1). https://doi.org/10.1609/aaai.v29i1.9578

问题

章节

主赛道:新型机器学习算法