计算机科学>机器学习
标题: 两位专家的高效最优定时后悔
摘要: 专家建议预测是在线学习中的一个基本问题。 在$T$轮次和$n$专家的情况下,当$T$事先已知时,经典的乘法权重更新方法最多会遭受$\sqrt{(T/2)\ln n}$遗憾。 此外,当$T$和$n$都增长到无穷大时,这是渐近最优的。 然而,当专家数量$n$较小/固定时,存在具有更好遗憾保证的算法。 1967年,封面展示了一个动态规划算法,用于限制为${0,1}$成本的双专家问题,该问题的预处理时间最多为$\sqrt{T/2\pi}+O(1)$。 在这项工作中,我们提出了一种使用两位专家的建议进行预测的优化算法,该算法即使在成本为[0,1]$且每次处理时间为$O(1)$的情况下也有效。 我们的算法建立在最近基于随机演算技术和工具的专家问题研究的基础上。