{“状态”:“确定”,“消息类型”:“工作”,“信息版本”:“1.0.0”,“邮件”:{“索引”:{“日期-部分”:[[2023,4,3]],“日期-时间”:“2023-04-03T04:15:25Z”,“时间戳”:1680495325355},“引用-计数”:36,“发布者”:“运筹学与管理科学研究所(INFORMS)”,“问题”:“4”,“内容-域”:{-“域”:[],“交叉标记-限制”:false},“short-container-title”:[“OR数学”],“published-print”:{“date-parts”:[[2014,11]]},”抽象“:”自1956年引入Blackwell \u2019的可接近性理论以来,该理论在研究一系列重复的多智能体决策问题中证明是一种有用的工具。给定一个具有向量支付的重复矩阵博弈,对于对手的任何策略,如果玩家能够确保平均支付向量收敛到目标集,那么目标集S是可接近的。在本文中,我们考虑这样的情况:一个集合一般来说不需要是可接近的,但如果对手在某种意义上表现良好,则可以接近。特别地,我们考虑了满足Blackwell\u2019对偶条件的非凸集,即当对手使用平稳策略时可以逼近。虽然这样一个集合的凸壳是可接近的,但对于原始的非凸集合本身,通常情况并非如此。我们首先定义对手的受限游戏感(静态策略是一种特殊情况),然后为机会主义接近性算法制定适当的目标,该算法可以利用游戏中展开的受限游戏。然后,我们考虑基于校准的可接近性策略,在这个意义上是机会主义的。本研究的主要动机来自缺乏凸结构的无更新问题,如Mannor等人提出的具有样本路径约束的在线学习问题。[Mannor S,Tsitsiklis JN,Yu JY(2009)《具有样本路径限制的在线学习》。J.Machine Learn.Res.10:569\u2013590]。在这里,事后诸葛亮的最佳反应通常是无法实现的,而只是一种凸性放松。我们提出的算法,在确保轻松目标的同时,当对手的比赛受到明确定义的限制时,也更接近于非轻松目标<\/jats:p>“,”DOI“:”10.1287\/moor.2014.0643“,”type“:”journal-article“,”created“:{”date-parts“:[[2014,4,16]],”date-time“:”2014-04-16T17:44:39Z“,”timestamp“:1397670279000},”page“:“,”卷“:”39“,”author“:[{”given“:”Andrey“,”family“:”Bernstein“,”sequence“:”first“,”affiliation“:”Technion\u2013Israel Institute of Technology,Haifa 32000,Israel“}]},{”given“,”Shie“,”fumily“sequence“:”additional“,”affiliation“:[{”name“:”Technion\u2013Israel Institute of Technology,Haifa 32000,Israel“}]}],”member“:”109“,”reference“:[[{“key”:“B1”,”first page“:”27“,”volume-title“:”Proc.24th Annual Conf.Learn.Theory(COLT'11)“,”author“:”Abernethy J“,”year“:”2011“},{“key”:”B2“,“volume-titel”:“集值分析”,“author”:“Aubin J-P”,“年份:“1990”},{“key”:“B4”,“首页”:“190”,“volume-title”:“Proc.Adv.Neural Inform.Processing Systems”,“卷”:“23”,“author”:“Bernstein A”,“year”:“2010”}、{“key”:《B6》,“first page》:“335”,“volume-title:”Proc.Internat.Congress of Mathematicians“,”author“:“Blackwell D”,“年份”:“1954”}“doi-asserted-by”:“publisher”,“doi”:“10.2140\/pjm.1956.6.1“},{“key”:“B8”,“volume-title”:“Proc.25th Annual Conf.Learn.Theory(COLT'12)”,“author”:“Bubeck S”,“year”:“2012”},“key“:”B9“,”doi-asserted-by“:”publisher“,”doi“:”10.1017\/CBO9780511546921:“Dawid AP”,“年份”:“1985年”,“新闻标题”:“J.Amer.统计协会”},{“key”:“B11“,”卷标题“:”程序。第22届年会学习。Theory(COLT’09)“,”author“:”Even-Dar E“,”year“:”2009“},{”key“:”B12“,”doi-asserted-by“:”publisher“,”doi“:”10.1006\/gamer.1997.0595“}”,{“key”:“B13”,“first page”:”293“,”volume-title“:”Proc.24th Annual Conf.Learn.Theory“(COLT'11)”,“author”:“Foster DP”,“year”:“2011”},”{“key“:“B14“,”volume-title“:”游戏学习理论“,”author“:”Fudenberg D“,”年份”:“1998”},{“密钥”:“B15”,“首页”:“97”,“卷”:“3”,“作者”:“Hannan J”,“年份”:“1957”,“期刊标题”:“对游戏理论的贡献”},{“密钥”:“B16”,“doi断言”:“出版商”,“doi”:“10.1006\/jeth.2000.2746”},{“密钥”:“B17”,“卷标题”:“第25届年会学术理论(COLT'12)”,“作者”:“Hazan E“,”年份“:”2012“},{”密钥“:”B18“,”doi-asserted-by“:”publisher“,”doi“:”10.1214\/aoms\/1177693422“},{“key”:“B19”,“doi-assert-by”:“publisher”,“doi”:“10.1006\/game.1998.0608”},“key“:”B20 10.1016\/j.geb.2007.07.011“},{“密钥”:“B24”,“首页”:“1”,“卷标”:“程序。第五国际。Conf.网络游戏,控制优化。(NetGCooP)“,”author“:”Lehrer E“,”year“:”2011“},{”key“:”B25“,”doi-asserted-by“:”publisher“,”doi“:”10.1287\/moor.28.2.327.14483“}”,{“key”:“B26”,“doi-assert-by”:“publisher”,“doi”:“10.1016\/j.geb.2007.06”},“key“”:”B27“,”doi-asserted-by“”:“publisher”,“doi”:“10.1287\/moor.1100.0465”},{“key”:“B28”,“volume-title”:“Proc.24th Annual Conf。学习。Theory(COLT'11)“,”author“:”Mannor S“,”year“:”2011“},{”key“:”B29“,”doi-asserted-by“:”publisher“,”doi“:”10.1007\/s10994-006-0219-y“}”,{“key”:”B30“,”first page“:由“:”publisher“,”doi“:”10.1137\/S0895479892228900“}插入,{”key“:”B32“,”doi-asserted-by“:”publisher“,”doi“:”10.2307\/1969615“},{“key”:“B33”,“doi-assert-by”:“publisher”,“doi”:“10.1016\/j.geb.2005.06.005”},“key“:”B34“,”doi-asserted-by“:”publishers“,”doi“:理论(COLT’11)“,”作者“:”拉赫林A“,”年份“:”2011“},{”关键“:”B37“,”doi-asserted-by“:”publisher“,”doi“:”10.1109\/9.186314“},{”key“:”B38“,”volume-title“:”Probability“,”author“:”Shiryaev AN“,”year“:”1995“}、{”key“:“B39 \/3213865“},{”key“:”B41“,”doi-asserted-by“:”publisher“,”doi“:”10.1093\/acprof:oso\/9780199269181.001.0001“}],“container-title”:[“运筹学数学”],“original-title“:[],“language”:“en”,“link”:[{“URL”:“https:\/\/pubsonline.notifies.org\/doi\/pdf\/10.1287\/moor.2014.0643”,“content-type”:“unspecified”,“content-version”:“vor”,“intended-application”:“similarity-checking”},“deposed”:{“date-parts“:[[2023,4,2]],“date-time”:“2023-04-02T13:38:26Z”,“timestamp”:1680442706000},“score”:1,“resource”:{“primary”:{“URL”:“https:\/\/pubsonline.netails.org\/doi\/10.1287\/moor.2014.0643”},”subtitle“:[],”shorttitle“:[],”issued“:{”date-part“:[2014,11]]}”,“references-count”:36,“新闻发布”:{“发布”:“4”,“发布-发布”:}date-parts“:[[2014,11]]}},”alternative-id“:[”10.1287\/moor.2014.0643“],”URL“:”http://\/dx.doi.org\/10.1287\/mool.2014.0642“,”relation“:{},“ISSN”:[”0364-765X“,”1526-5471“],“ISSN-type”:[{“value”:“0364-7650X”,“type”:“print”},{“value”:“1526-54711”,“类型“:”电子“}],”主题“:[],”发布“:{”日期部分“:[[2014,11]]}}}