稳健的风险规避随机多武器强盗-存档ouverte HAL Accéder directment au contenu公司
奥特出版物科学 Anneée:2013年

稳健的风险规避随机多臂强盗

Résumé

我们研究了标准随机多武器盗贼问题的一种变体,当人们对具有最佳平均值的武器不感兴趣,而是对使武器最大化的某种相干风险度量标准感兴趣时。此外,我们正在研究遗憾的偏差,而不是信息较少的预期遗憾。我们提供了一种称为RA-UCB的算法来解决这个问题,并且很有可能会后悔。

与葡萄园

认证信息[cs.LG]
菲奇尔校长
小品小品
风险意识KLMAB_Arxiv.pdf(256.54 Ko) 特勒充电器
起源:菲奇尔斯制片人par l’(les)auteur(s)
加载。。。

日期和版本

hal-00821670, 版本1 (11-05-2013)

标识符

  • HAL Id: hal-00821670,版本1

Citer公司

奥达尔里克·梅勒德(Odarlic-Ambrym Maillard)。稳健的风险规避型随机多武器强盗。2013⟨哈尔-00821670⟩
264 磋商
1210 交易费用

合作伙伴

Gmail(Gmail) 脸谱网 X(X) LinkedIn链接 更多