张量PCA的统计查询下限

Rishabh Dudeja,Daniel Hsu。

年份:2021年,数量:22,版本:83,页码:1−51


摘要

在Richard和Montanari(2014)提出的Tensor PCA问题中,给定一个由$n$samples$\mathbf组成的数据集{T}(T)_i.i.d.阶高斯张量的{1:n}$,承诺$\mathbb{E}\mathbf{T} _1个$是秩-1张量,$\|\mathbb{E}\mathbf{T} _1个\|=1美元。目标是估计$\mathbb{E}\mathbf{T} _1个$. 当$k>2$时,此问题显示出一个很大的推测硬阶段:当$d\lesssim n \ll d^{frac{k}{2}}$时,理论上可以估计$\mathbb{E}\mathbf{T} _1个$,但多项式时间估计量未知。我们对统计查询(SQ)模型中的最佳样本复杂度进行了深入分析,并表明具有多项式查询复杂度的SQ算法不仅无法在推测的硬阶段求解张量PCA,而且与诸如Richard Montanari谱估计器之类的一些多项式时间估计器相比,也具有严格次优的样本复杂度。我们的分析表明,SQ模型中的最佳样本复杂度取决于$\mathbb{E}\mathbf{T} _1个$是否对称。对于对称的偶数阶张量,我们还隔离了一个样本大小区域,在该区域中可以测试$\mathbb{E}\mathbf{T} _1个=\mathbf{0}$或$\mathbb{E}\mathbf{T} _1个\neq\mathbf{0}$具有多项式多个查询,但不估计$\mathbb{E}\mathbf{T} _1个$. 我们的证明依赖于Feldman、Perkins和Vempala(2018)的傅里叶分析方法来证明SQ下界。

PDF格式 BibTeX公司