内禀低维数据的自适应几何多尺度逼近

廖文静、毛罗·马吉奥尼。

年份:2019年,数量:20,版本:98,页码:1-63


摘要

我们考虑有效地近似和编码从$\mathbb{R}^D$中的概率分布$\rho$中采样的高维数据的问题,该概率分布几乎支持$D$维集合$\mathcal{M}$,例如支持$D$-维流形。几何多分辨率分析(GMRA)提供了一种稳健且计算效率高的程序,用于在不同分辨率下构造$\mathcal{M}$的低维几何近似。通过引入几何小波系数的阈值算法,我们引入了适用于$\mathcal{M}$未知正则性的GMRA近似。我们表明,当阈值被选择为样本数量$n$的适当通用函数时,这些数据驱动的经验几何近似在一大类度量$\rho$上表现良好,这些度量被允许在不同的尺度和位置表现出不同的规律性,从而有效地编码来自比流形上支持的更复杂度量的数据。这些GMRA近似值与字典、将数据映射到$d$维系数的快速变换以及此类映射的逆映射相关联,所有这些都是数据驱动的。字典构造和转换的算法都具有复杂性$C D n \log n$,常数$C$的指数为$D$。因此,我们的工作将自适应GMRA确立为一种快速字典学习算法,具有近似保证,适用于本质上低维的数据。我们对合成数据和实际数据进行了几次数值实验,验证了我们的理论结果,并证明了自适应GMRA的有效性。

PDF格式 BibTeX公司