×

在线学习和竞争分析的统一算法。 (英语) 兹比尔1335.68196

摘要:在线学习和竞争分析是在线决策设置的两个广泛研究的框架。尽管他们研究的问题经常相似,但他们的假设、目标和技术存在显著差异,阻碍了统一分析和两者之间更丰富的相互作用。在本文中,我们在这方面提供了一些贡献。我们提供了一个单一的统一算法,该算法通过参数调整,在专家学习的最佳后悔(在线学习)和度量任务系统问题的最佳竞争比(竞争分析)之间进行插值,改进了以前的结果。该算法还允许我们获得针对“漂移”专家的新后悔界限,这可能是独立的兴趣所在。此外,我们的方法允许我们超越专家/MTS,只要设置具有特定的拟阵结构,就可以为结构化动作集和“组合专家”获得类似的统一结果。

MSC公司:

68T05型 人工智能中的学习和自适应系统
05B35号 拟阵和几何格的组合方面
68周27 在线算法;流式算法
91B06型 决策理论
91立方厘米32 资源和成本分配(包括公平分配、分摊等)
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Abernethy J,Bartlett PL,Buchbinder N,Stanton I(2010)度量任务系统的正则化方法。Hutter M、Stephan F、Vovk V、Zeugmann T编辑。算法学习理论/会议录(柏林施普林格),270-284。交叉参考·Zbl 1306.68211号
[2] Bansal N、Buchbinder N、Naor J(2010)《走向随机化》k个-服务器推测:一种原始-对偶方法。程序。第二十届ACM-SIAM年度交响曲。离散算法,SODA’10(费城SIAM),40-55。交叉参考·Zbl 1288.68283号
[3] Blum A、Burch C(2000)《在线学习与度量任务系统问题》。机器学习。39(1):35-58. 交叉参考·Zbl 0951.68125号
[4] Blum A、Burch C、Kalai A(1999)《精细竞争寻呼》。程序。第40届年度交响乐团。基础计算。科学。,1999年FOCS(IEEE计算机学会,华盛顿特区),450-458。交叉参考
[5] Blum A,Chawla S,Kalai A(2003)列表和树中的静态最优性和动态搜索最优性。算法36(3):249-260. 交叉参考·兹比尔1045.68045
[6] Blum A,Karloff HJ,Rabani Y,Saks ME(2000)任务系统的分解定理和随机服务器问题的边界。SIAM J.计算。30(5):1624-1661. 交叉参考·Zbl 0977.68039号
[7] 硼蛋白A,El-Yaniv R(1998)在线计算和竞争分析(剑桥大学出版社,纽约)。
[8] Borodin A,Linial N,Saks ME(1992)测量任务系统的一种最优在线算法。美国临床医学杂志39(4):745-763. 交叉参考·Zbl 0799.68035号
[9] Buchbinder N,Naor J(2009)通过主对偶方法设计竞争性在线算法。理论计算机科学的基础和发展趋势3(2-3):93-263. 交叉参考·Zbl 1190.68083号
[10] Buchbinder N,Chen S,Naor J(2014)限制缓存和拟阵缓存的竞争算法。舒尔茨A、瓦格纳D编辑。程序。第22届欧洲年度交响曲。算法,ESA’14(柏林施普林格),209-221年。交叉参考·Zbl 1423.68146号
[11] Buchbinder N,Chen S,Naor J,Shamir O(2012)《在线学习和竞争分析的统一算法》。Mannor S、Srebro N、Williamson RC编辑。程序。第25届COLT’12年度Conf.学习理论(JMLR), 5.1-5.18. ·Zbl 1335.68196号
[12] Calinescu G,Chekuri C,Pál M,Vondrák J(2011)拟阵约束下单调子模函数的最大化。SIAM J.计算。40(6):1740-1766. 交叉参考·Zbl 1234.68459号
[13] 塞萨·比安奇N,卢戈西G(2006)预测、学习和游戏(剑桥大学出版社,纽约)。交叉参考·Zbl 1114.91001号
[14] Crammer K、Mansour Y、Even-Dar E、Vaughan JW(2010)《概念漂移的后悔最小化》。Tauman Kalai A,Mohri M,编辑。程序。COLT’10第23届年度大会学习理论(威斯康星州麦迪逊市Omnipress),168-180。
[15] Even-Dar E、Kleinberg R、Mannor S、Mansour Y(2009)全球成本函数在线学习。程序。第22届COLT’09年度Conf.学习理论(威斯康星州麦迪逊市Omnipress),41-52。
[16] Freund Y,Schapire RE(1997)在线学习的决策理论推广及其在助推中的应用。J.计算。系统科学。55(1):119-139. 交叉参考·Zbl 0880.68103号
[17] Gupta A、Talwar K、Wieder U(2014)《改变基:拟阵和匹配的多级优化》。Esparza J、Fraignaud P、Husfeldt T、Koutsoupias E编辑。程序。第41国际。ICALP’14自动化、语言和编程学术讨论会,第一部分(柏林施普林格),563-575。交叉参考·Zbl 1423.90067号
[18] Hazan E,Seshadhri C(2009)《变化环境下的高效学习算法》。程序。第26届国际年会。Conf.机器学习,ICML'09(ACM,纽约),393-400。交叉参考
[19] Herbster M,Warmuth MK(1998)追踪最佳专家。机器学习。32(2):151-178. 交叉参考·Zbl 0912.68165号
[20] Kalai AT,Vempala S(2005)在线决策问题的高效算法。J.计算。系统科学。71(3):291-307. 交叉参考·Zbl 1094.68112号
[21] Koolen WM、Warmuth MK、Kivinen J(2010)《对冲结构性概念》。Tauman Kalai A,Mohri M,编辑。程序。COLT’10第23届年度大会学习理论(威斯康星州麦迪逊市Omnipress),93-105。
[22] Magnanti TL,Wolsey LA(1995)最优树。手册操作。资源管理科学。7:503-615. 交叉参考·兹伯利0839.0135
[23] Rakhlin A、Sridharan K、Tewari A(2011)《在线学习:超越遗憾》。Kakade SM,von Luxburg U编辑。程序。COLT’11第24届年度大会学习理论(JMLR),559-594。
[24] Schrijver A(2003)组合优化:多面体和效率(柏林施普林格)。
[25] Zinkevich M(2003)在线凸规划和广义无穷小梯度上升。Fawcett T,Mishra N,编辑。程序。第20届国际。Conf.机器学习,ICML'03(加利福尼亚州帕洛阿尔托市AAAI),928-936。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。