Statistical Query Lower Bounds for Tensor PCA

Rishabh Dudeja; Daniel Hsu

在Richard和Montanari（2014）提出的Tensor PCA问题中，给定一个由$n$samples$\mathbf组成的数据集{T}（T）_i.i.d.阶高斯张量的{1:n}$，承诺$\mathbb{E}\mathbf{T} _1个$是秩-1张量，$\|\mathbb{E}\mathbf{T} _1个\| = 1$. 目标是估计$\mathbb{E}\mathbf{T} _1个$. 当$k>2$时，此问题显示出一个很大的推测硬阶段：当$d\lesssim n \ll d^{frac{k}{2}}$时，理论上可以估计$\mathbb{E}\mathbf{T} _1个$，但多项式时间估计量未知。我们对统计查询（SQ）模型中的最佳样本复杂度进行了深入分析，并表明具有多项式查询复杂度的SQ算法不仅无法在推测的硬阶段求解张量PCA，但与某些多项式时间估计量（如Richard-Montanari谱估计量）相比，它也具有严格的次优样本复杂度。我们的分析表明，SQ模型中的最佳样本复杂度取决于$\mathbb{E}\mathbf{T} _1个$是否对称。对于对称的偶数阶张量，我们还隔离了一个样本大小区域，在该区域中可以测试$\mathbb{E}\mathbf{T} _1个=\mathbf{0}$或$\mathbb{E}\mathbf{T} _1个\neq\mathbf{0}$具有多项式多个查询，但不估计$\mathbb{E}\mathbf{T} _1个$. 我们的证明依赖于Feldman、Perkins和Vempala（2018）的傅里叶分析方法来证明SQ下界。

张量PCA的统计查询下限

摘要