{“状态”:“确定”,“消息类型”:“工作”,“信息版本”:“1.0.0”,“邮件”:{“索引”:{-“日期-部分”:[[2024,6,21]],“日期-时间”:“2024-06-21T05:12:29Z”,“时间戳”:1718946749379},“引用-计数”:36,“发布者”:“运筹学与管理科学研究所(INFORMS)”,“问题”:“1”,“内容-域”:{:“域”:[],“交叉标记-限制”:false},“short-container-title”:[“OR数学”],“published-print”:{“date-parts”:[[2014,2]},”抽象“:”当决策者的可能行为由二进制向量表示时,我们解决在线线性优化问题。决策者的遗憾是,她意识到的损失和她事后选择尽可能好的行动所能获得的最小损失之间的区别。我们的目标是了解最大可能后悔的程度。我们针对决策者收到的反馈在三种不同的假设下研究了该问题:完全信息,以及所谓的“u201csemi-bandit”和“u201cbandit”问题的部分信息模型。在全信息情况下,我们表明标准指数加权平均预测是一种可证明的次优策略。对于半强盗模型,通过结合镜像下降算法和隐式规范化预测(INF)策略,我们能够证明第一个最优界。最后,在强盗案例中,我们根据一个新的下限讨论了现有结果,并提出了该案例中最优后悔的一个猜想<\/jats:p>“,”DOI“:”10.1287\/moor.2013.0598“,”type“:”journal-article“,”created“:{”date-parts“:[[2013,5,7]],”date-time“:”2013-05-07T04:11:17Z“,”timestamp“:1367899877000},”page“:“31-45”,“source”:“Crossref”,“is-referenced-by-count”:54,“title”:[“遗憾的在线组合优化”],“前缀”:“10.1287”,“卷”:“39“,”作者“:[{”给定“:”Jean-Yves“,”family“:”Audibert“,”sequence“:”first“,”affiliation“:[{”name“:”Imagine,University Paris Est;and Sierra,CNRS\/ENS\/INRIA,Paris,France“}]},{”given“:”S\u00e9bastien“,”family”:“Bubeck”,“sequence”:“additional”,“affiliance”:[{“name”:“Department of Operations Research and Financial Engineering,Princeton University”}]},{“given”:“G\u00ebor”,“family“:”Lugosi“,”sequence“:”additional“,”affiliation“:[{”name“:”ICREA and Pompeu Fabra University,Barcelona,Spain“}]}],”member“:”109“,”reference“:[}”key“:”B1“,”first page“:me-title“:”程序。第22届年会学习。理论(COLT)”,“作者”:“奥迪伯特J-Y”,“年份”:“2009”},{“密钥”:“B3”,“首页”:“2635”,“卷”:“11”,“作家”:“Au迪伯特J-Y”,“年”:“2010”,“期刊标题”:“J.Machine Learn.Res.”}由“:”publisher“,”doi“:”10.1145\/1007352.1007367“}插入,{”key“:”B6“,”doi-asserted-by“:”publisher“,”doi“:”10.1016\/S0167-6377(02)00231-6“},{”key“:”B7“,”volume-title“:”课堂讲稿“,”author“:”Bubeck S“,”year“:”2011“}”,{“key”:“B8”,“doi-assert-by”:“publisher”,“doi”:“10.1561\/220000024”},“key“”:”B9“,”首页“:”41.1“,”卷“:”23“,”author“:”Bubeck S“,”year“:”2012“,”journal-title“:”JMLR Workshop Conf.Proc.(COLT)“},{“key”:“B10”,“doi-asserted-by”:“publisher”,“doi”:“10.1017\/CBO9780511546921”}V.神经信息处理系统(NIPS)“},{“key”:“B13”,“doi-asserted-by”:“publisher”,“doi”:“10.1006\/jcss.1997.1504”},{“key”:“B14”,“首页”:“225”,“volume-title”:“Proc.Adv.Neural Inform.Processing Systems(NIPS)”,“author”:“Gentile C”,“year”:“1998”}卷“:”8“,”作者“:”Gy\u00f6rgy A“,”年份“:”2007“,”新闻标题“:”J。机器学习。研究“},{”key“:”B17“,”doi-asserted-by“:”crossref“,”first page“:“287”,”doi“:”10.7551\/mitpress\/8996.003.0012“,”volume-title“:”Optimization for Machine Learning“,”author“:”Hazan E“,”year“:”2011“}”{E“,”年份“:”2010“},{”键“:”B19“,”首页“:”1705“,“卷”:“10”,“作者”:“Helmbold DP”,“年份”:“2009”,“新闻标题”:“J.机器学习”。Res.“},{”key“:”B20“,”doi-asserted-by“:”publisher“,”doi“:”10.1023\/A:1007424614876“}”,{“key”:“B21”,“doi-assert-by”:“publisher”,“doi”:“10.1007\/978-3642-56468-0”},“key“:”B22“,:“B23”,“首页”:“1054”,“volume-title”:“高级神经信息处理系统(NIPS)”,“作者”:“Kale S“,“年份”:“2010”},{“key”:“B24”,“doi-asserted-by”:“publisher”,“doi”:“10.1214\/aoms\/117729392”}“,”author“:”Koolen W“,”year“:”2010“},{”key“:”B27“,”doi-asserted-by“:”publisher“,”DOI“:”10.1007\/978-3-540-27819-1_8“},{”key“:”B28“,”first page“:“15”,”author“:”Nemirovski A“,”year“:”1979“,”journal-title“:”Ekonomika I Matematicheskie Metody“}”,{“key”:“B29”,“volume-title”:“优化中的问题复杂性和方法效率”,“author”:“Nemirowski A”,“year”:“1983”},”{“”key:“B31”,“DOI-asserted-b”y“:”publisher“,”DOI“:”10.1214\/aoms\/117729586“},{“键”:“B32”,“卷标题”:“组合优化”,“作者”:“Schrijver A”,“年份”:“2003”},{“键”:“B33”,“非结构化”:“Shalev Shwartz S(2007)在线学习:理论、算法和应用。耶路撒冷希伯来大学博士论文。”},{“键”:“B34”,“首页”:“773”,“卷”:“4”,“作者”:“Takimoto E”,“年份”:“2003年”,“新闻标题”:“J.机器学习。研究“},{”key“:”B35“,”doi-asserted-by“:”publisher“,”doi“:”10.1007\/978-3642-16108-7_30“}、{”key“:“B36”,“首页”:“2287”,“卷”:“9”,“作者”:“Warmuth M”,“年份”:“2008”,“日志标题”:“J.Machine Learn.Res.”},“key”:“B37”,“第一页”:”928“,“卷时间”:“Proc.Twentiee”th Internat.Conf.Machine Learn.(ICML)“,”author“:”Zinkevich M“,”year“:”2003“}”,“container-title”:[“运筹学数学”],“original-title“:[],“language”:“en”,“link”:[{“URL”:“https:\/\/pubsonline.notifies.org\/doi\/pdf\/10.1287\/moor.2013.0598”,“content-type”:“unspecified”,“content-version”:“vor”,“intended-application”:“similarity-checking”}],“deposed”:{“date-parts”:[2023,7,1]],“date-ports”时间“:”2023-07-01T14:39:46Z“,”timestamp“:1688222386000},”score“:1,”resource“:{主要”:{“URL”:“https:\/\/pubsonline.notifies.org\/doi\/10.1287\/moor.2013.0598”}},“副标题”:[],“短标题”:[],“已发布”:{“日期-部分”:[[2014,2]},《参考-计数》:36,“日志发布”:}“发布”:“1”,“published-print“:{”date-parts“:[[2014,2]}},”alternative-id“:[”10.1287\/moor.2013.0598“],“URL”:“http://\/dx.doi.org\/10.1287\/mooor.2013.0598”,“关系”:{},“ISSN”:[“0364-765X”,“1526-5471”],“ISSN-type”:[{“value”:“0364~765X”,”type“:”print“},”value“:“1526-5571”,”类型“:”electronic“}],”subject“:[],”published“:{“date-parts”:[2014,2]}}