文件Zbl 1335.68196-zbMATH Open

在线学习和竞争分析的统一算法。（英语）兹比尔1335.68196

数学。操作。物件。 41，第2号，612-625（2016）.

摘要：在线学习和竞争分析是在线决策设置的两个广泛研究的框架。尽管他们研究的问题经常相似，但他们的假设、目标和技术存在显著差异，阻碍了统一分析和两者之间更丰富的相互作用。在本文中，我们在这方面提供了一些贡献。我们提供了一个单一的统一算法，该算法通过参数调整，在专家学习的最佳后悔（在线学习）和度量任务系统问题的最佳竞争比（竞争分析）之间进行插值，改进了以前的结果。该算法还允许我们获得针对“漂移”专家的新后悔界限，这可能是独立的兴趣所在。此外，我们的方法允许我们超越专家/MTS，只要设置具有特定的拟阵结构，就可以为结构化动作集和“组合专家”获得类似的统一结果。

引用于1审查

引用于8文件

MSC公司：

68T05型	人工智能中的学习和自适应系统
05B35号	拟阵和几何格的组合方面
68周27	在线算法；流式算法
91B06型	决策理论
91立方厘米32	资源和成本分配（包括公平分配、分摊等）

关键词：

在线学习；竞争分析；专家；度量任务系统；拟阵

软件：

阿达·布斯特。MH公司

PDF格式 BibTeX公司 XML格式引用

全文：内政部

参考文献：

[1]	Abernethy J，Bartlett PL，Buchbinder N，Stanton I（2010）度量任务系统的正则化方法。Hutter M、Stephan F、Vovk V、Zeugmann T编辑。算法学习理论/会议录（柏林施普林格），270-284。交叉参考·Zbl 1306.68211号
[2]	Bansal N、Buchbinder N、Naor J（2010）《走向随机化》k个-服务器推测：一种原始-对偶方法。程序。第二十届ACM-SIAM年度交响曲。离散算法，SODA’10（费城SIAM），40-55。交叉参考·Zbl 1288.68283号
[3]	Blum A、Burch C（2000）《在线学习与度量任务系统问题》。机器学习。39(1):35-58. 交叉参考·Zbl 0951.68125号
[4]	Blum A、Burch C、Kalai A（1999）《精细竞争寻呼》。程序。第40届年度交响乐团。基础计算。科学。，1999年FOCS（IEEE计算机学会，华盛顿特区），450-458。交叉参考
[5]	Blum A，Chawla S，Kalai A（2003）列表和树中的静态最优性和动态搜索最优性。算法36(3):249-260. 交叉参考·兹比尔1045.68045
[6]	Blum A，Karloff HJ，Rabani Y，Saks ME（2000）任务系统的分解定理和随机服务器问题的边界。SIAM J.计算。30(5):1624-1661. 交叉参考·Zbl 0977.68039号
[7]	硼蛋白A，El-Yaniv R（1998）在线计算和竞争分析（剑桥大学出版社，纽约）。
[8]	Borodin A，Linial N，Saks ME（1992）测量任务系统的一种最优在线算法。美国临床医学杂志39(4):745-763. 交叉参考·Zbl 0799.68035号
[9]	Buchbinder N，Naor J（2009）通过主对偶方法设计竞争性在线算法。理论计算机科学的基础和发展趋势3(2-3):93-263. 交叉参考·Zbl 1190.68083号
[10]	Buchbinder N，Chen S，Naor J（2014）限制缓存和拟阵缓存的竞争算法。舒尔茨A、瓦格纳D编辑。程序。第22届欧洲年度交响曲。算法，ESA’14（柏林施普林格），209-221年。交叉参考·Zbl 1423.68146号
[11]	Buchbinder N，Chen S，Naor J，Shamir O（2012）《在线学习和竞争分析的统一算法》。Mannor S、Srebro N、Williamson RC编辑。程序。第25届COLT’12年度Conf.学习理论（JMLR）, 5.1-5.18. ·Zbl 1335.68196号
[12]	Calinescu G，Chekuri C，Pál M，Vondrák J（2011）拟阵约束下单调子模函数的最大化。SIAM J.计算。40(6):1740-1766. 交叉参考·Zbl 1234.68459号
[13]	塞萨·比安奇N，卢戈西G（2006）预测、学习和游戏（剑桥大学出版社，纽约）。交叉参考·Zbl 1114.91001号
[14]	Crammer K、Mansour Y、Even-Dar E、Vaughan JW（2010）《概念漂移的后悔最小化》。Tauman Kalai A，Mohri M，编辑。程序。COLT’10第23届年度大会学习理论（威斯康星州麦迪逊市Omnipress），168-180。
[15]	Even-Dar E、Kleinberg R、Mannor S、Mansour Y（2009）全球成本函数在线学习。程序。第22届COLT’09年度Conf.学习理论（威斯康星州麦迪逊市Omnipress），41-52。
[16]	Freund Y，Schapire RE（1997）在线学习的决策理论推广及其在助推中的应用。J.计算。系统科学。55(1):119-139. 交叉参考·Zbl 0880.68103号
[17]	Gupta A、Talwar K、Wieder U（2014）《改变基：拟阵和匹配的多级优化》。Esparza J、Fraignaud P、Husfeldt T、Koutsoupias E编辑。程序。第41国际。ICALP’14自动化、语言和编程学术讨论会，第一部分（柏林施普林格），563-575。交叉参考·Zbl 1423.90067号
[18]	Hazan E，Seshadhri C（2009）《变化环境下的高效学习算法》。程序。第26届国际年会。Conf.机器学习，ICML'09（ACM，纽约），393-400。交叉参考
[19]	Herbster M，Warmuth MK（1998）追踪最佳专家。机器学习。32(2):151-178. 交叉参考·Zbl 0912.68165号
[20]	Kalai AT，Vempala S（2005）在线决策问题的高效算法。J.计算。系统科学。71(3):291-307. 交叉参考·Zbl 1094.68112号
[21]	Koolen WM、Warmuth MK、Kivinen J（2010）《对冲结构性概念》。Tauman Kalai A，Mohri M，编辑。程序。COLT’10第23届年度大会学习理论（威斯康星州麦迪逊市Omnipress），93-105。
[22]	Magnanti TL，Wolsey LA（1995）最优树。手册操作。资源管理科学。7:503-615. 交叉参考·兹伯利0839.0135
[23]	Rakhlin A、Sridharan K、Tewari A（2011）《在线学习：超越遗憾》。Kakade SM，von Luxburg U编辑。程序。COLT’11第24届年度大会学习理论（JMLR），559-594。
[24]	Schrijver A（2003）组合优化：多面体和效率（柏林施普林格）。
[25]	Zinkevich M（2003）在线凸规划和广义无穷小梯度上升。Fawcett T，Mishra N，编辑。程序。第20届国际。Conf.机器学习，ICML'03（加利福尼亚州帕洛阿尔托市AAAI），928-936。

此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配，可能包含数据转换错误。在某些情况下，zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献，而不要求完整或完全匹配。

任何	在任何地方
一个	内部文档标识符
澳大利亚	作者、编辑
人工智能	内部作者标识符
钛	标题
洛杉矶	语言
所以	来源
实验室	回顾，摘要
第页	出版年份
车辆	评审员
复写的副本	MSC代码
美国犹他州	关键字
日期	文档类型(j个：期刊文章；b条：book；一：图书文章）

一&b条	逻辑和
一\|b条	逻辑或
!实验室	逻辑不
美国广播公司*	右通配符
"ab c公司"	短语
(ab c公司)	圆括号

示例

领域

操作员

在线学习和竞争分析的统一算法。（英语）兹比尔1335.68196

MSC公司：

关键词：

软件：

参考文献：

示例

领域

操作员

在线学习和竞争分析的统一算法。 （英语） 兹比尔1335.68196

MSC公司：

关键词：

软件：

参考文献：

在线学习和竞争分析的统一算法。（英语）兹比尔1335.68196