近最优羊群
尼克·哈维、萨米拉·萨马迪
第27届学习理论会议记录,PMLR 35:1165-11822014年。
摘要
羊群算法是机器学习社区最近感兴趣的一种算法,其动机是在马尔可夫随机场中进行推理。它解决了以下采样问题:给定一个平均值为μ的集合\mathcalX⊂\mathbbR^d,从\mathcalX构造一个无限的点序列,使得对于每t≥1,该序列中前t个点的平均值位于μ的欧几里得距离O(1/t)内。经典的Perceptron有界性定理表明,尽管O(1/t)符号抑制的因子在d中是指数的,但这种结果实际上适用于许多算法。因此,要为采样问题建立一个非平凡的结果,必须仔细分析O(1/t)误差界抑制的因子。本文研究了采样问题可以达到的最佳误差。对Herding算法的已知分析给出了一个误差界,该误差界取决于mathcalX的几何性质,但即使在有利的条件下,这个误差界也线性地依赖于d。我们提出了一种新的多项式时间算法,该算法解决了误差为O\ left(\sqrtd\log^2.5|mathcalX|/t\ right)的采样问题假设\mathcalX是有限的。我们的算法基于文本差异理论中的最新算法结果。我们还证明了采样问题的任何算法都必须有误差Ω(\sqrtd/t)。这意味着我们的算法在对数因子范围内是最优的。
引用本文
相关材料