主页

论文

提交文件

新闻

编辑委员会

开源软件

程序(PMLR)

交易(TMLR)

搜索

统计

登录

常见问题

联系我们



RSS源

张量PCA的统计查询下限

Rishabh Dudeja、Daniel Hsu; 22(83):1−51, 2021.

摘要

在Richard和Montanari(2014)提出的Tensor PCA问题中,给定一个由$n$samples$\mathbf组成的数据集{T}(T)_i.i.d.阶高斯张量的{1:n}$,承诺$\mathbb{E}\mathbf{T} _1个$是秩-1张量,$\|\mathbb{E}\mathbf{T} _1个\| = 1$. 目标是估计$\mathbb{E}\mathbf{T} _1个$. 当$k>2$时,此问题显示出一个很大的推测硬阶段:当$d\lesssim n \ll d^{frac{k}{2}}$时,理论上可以估计$\mathbb{E}\mathbf{T} _1个$,但多项式时间估计量未知。我们对统计查询(SQ)模型中的最佳样本复杂度进行了深入分析,并表明具有多项式查询复杂度的SQ算法不仅无法在推测的硬阶段求解张量PCA,但与某些多项式时间估计量(如Richard-Montanari谱估计量)相比,它也具有严格的次优样本复杂度。我们的分析表明,SQ模型中的最佳样本复杂度取决于$\mathbb{E}\mathbf{T} _1个$是否对称。对于对称的偶数阶张量,我们还隔离了一个样本大小区域,在该区域中可以测试$\mathbb{E}\mathbf{T} _1个=\mathbf{0}$或$\mathbb{E}\mathbf{T} _1个\neq\mathbf{0}$具有多项式多个查询,但不估计$\mathbb{E}\mathbf{T} _1个$. 我们的证明依赖于Feldman、Perkins和Vempala(2018)的傅里叶分析方法来证明SQ下界。

[腹肌][pdf格式][围兜]      
©JMLR公司2021(编辑贝塔)