文件Zbl 1320.91041-zbMATH Open

随机多武装盗贼问题弱一致策略的下界和选择性。（英语） Zbl 1320.91041号

J.马赫。学习。物件。 14, 187-207 (2013)。

综述：本文致力于研究随机多武装土匪经典模型中的后悔下界。Lai和Robbins的一个著名结果被Burnetas和Katehakis推广，为所有一致的政策建立了对数界。我们放宽了一致性的概念，并对边界进行了推广。我们还研究了一般情况下以及Hannan一致性情况下对数界的存在性。此外，我们证明了不可能设计出一种自适应策略来利用环境的特性从两种算法中选择最佳的算法。为了得到这些结果，我们研究了流行的置信上限（UCB）策略的变体。

引用于2文件

MSC公司：

91A60型	概率博弈；赌博
62升05	顺序统计设计

关键词：

随机土匪;遗憾下限;一致性;选择性;UCB政策

PDF格式 BibTeX公司 XML格式引用

全文： arXiv公司链接

任何	在任何地方
一个	内部文档标识符
澳大利亚	作者、编辑
人工智能	内部作者标识符
钛	标题
洛杉矶	语言
所以	来源
ab公司	回顾，摘要
第页	出版年份
车辆	评审员
复写的副本	MSC代码
美国犹他州	关键字
日期	文档类型(j个：期刊文章；b条：book；一：图书文章）

一&b条	逻辑和
一\|b条	逻辑或
！ab公司	逻辑不
美国广播公司*	右通配符
"ab c公司"	短语
(ab c公司)	圆括号

示例

字段

操作员

随机多武装盗贼问题弱一致策略的下界和选择性。（英语） Zbl 1320.91041号

MSC公司：

关键词：

示例

字段

操作员

随机多武装盗贼问题弱一致策略的下界和选择性。 （英语） Zbl 1320.91041号

MSC公司：

关键词：

随机多武装盗贼问题弱一致策略的下界和选择性。（英语） Zbl 1320.91041号