Efficient and Optimal Fixed-Time Regret with Two Experts

Greenstreet, Laura; Harvey, Nicholas J. A.; Portella, Victor Sanches

计算机科学>机器学习

arXiv公司：2203.07577（cs）

【2022年3月15日提交】

标题：两位专家的高效最优定时后悔

作者：劳拉·格林斯特雷特,尼古拉斯·J·A·哈维,维克托·桑切斯·波特拉

查看PDF

摘要：专家建议预测是在线学习中的一个基本问题。在$T$轮次和$n$专家的情况下，当$T$事先已知时，经典的乘法权重更新方法最多会遭受$\sqrt｛（T/2）\ln n｝$遗憾。此外，当$T$和$n$都增长到无穷大时，这是渐近最优的。然而，当专家数量$n$较小/固定时，存在具有更好遗憾保证的算法。1967年，封面展示了一个动态规划算法，用于限制为${0,1}$成本的双专家问题，该问题的预处理时间最多为$\sqrt{T/2\pi}+O（1）$。在这项工作中，我们提出了一种使用两位专家的建议进行预测的优化算法，该算法即使在成本为[0,1]$且每次处理时间为$O（1）$的情况下也有效。我们的算法建立在最近基于随机演算技术和工具的专家问题研究的基础上。

评论：	29页，13页正文，发表于ALT 2022（PMLR第167卷）
学科：	机器学习（cs.LG）; 概率（math.PR）；机器学习（stat.ML）
引用为：	arXiv公司：2203.07577【cs.LG】
	（或 arX病毒：2203.07577v1【cs.LG】对于此版本）
	https://doi.org/10.48550/arXiv.2203.07577

提交历史记录

发件人：Victor Sanches Portella[查看电子邮件]
[第1版]2022年3月15日星期二01:07:09 UTC（62 KB）

全文链接：

访问纸张：

查看许可证

当前浏览上下文：

反恐精英。LG公司

<上一版本 | 下一个>

新的 | 最近的 |2022-03

更改为浏览方式：

反恐精英
数学
数学。公共关系
斯达
统计ML

参考文献和引文

导出BibTeX引文

计算机科学>机器学习

标题：两位专家的高效最优定时后悔

提交历史记录

访问纸张：

参考文献和引文

书签

书目和引文工具

与本文相关的代码、数据和媒体

演示

推荐和搜索工具

arXivLabs：与社区合作者合作的实验项目

计算机科学>机器学习

标题：两位专家的高效最优定时后悔

提交历史记录

访问纸张：

参考文献和引文

BibTeX格式的引文

书签

书目和引文工具

与本文相关的代码、数据和媒体

演示

推荐和搜索工具

arXivLabs：与社区合作者合作的实验项目