[编辑]

第24卷:欧洲强化学习研讨会,2012年7月30日至1日,苏格兰爱丁堡

[编辑]

编辑:Marc Peter Deisenroth、Csaba Szepesvári、Jan Peters

[围兜][城市规划署]

内容:

前言

前言

马克·彼得·德伊森罗特(Marc Peter Deisenroth)、塞佩斯瓦里(Csaba Szepesvári)、扬·彼得斯(Jan Peters);第十届强化学习欧洲研讨会会议记录,PMLR 24:i-i

接受的论文

单轨迹强化学习的学习探索/开发策略

Michael Castronovo、Francis Maes、Raphael Fonteneau、Damien Ernst;第十届强化学习欧洲研讨会会议记录,PMLR 24:1-10

基于循环后缀树的特征强化学习

马扬克·达斯瓦尼、彼得·苏尼哈格、马库斯·赫特;第十届强化学习欧洲研讨会会议记录,PMLR 24:11-24

通过PAC Bandits在薪酬丰厚的领域进行规划

Sergiu Goschin、Ari Weinstein、Michael L.Littman、Erick Chastain;第十届强化学习欧洲研讨会会议记录,PMLR 24:25-42

基于能源政策的参与者关键强化学习

尼古拉斯·希斯(Nicolas Heess)、大卫·西尔弗(David Silver)、叶惠德(Yee Whye Teh);第十届强化学习欧洲研讨会会议记录,PMLR 24:45-58

转移知识强化学习中的定向探索

Timothy A.Mann,Yoonsuck Choe;第十届强化学习欧洲研讨会会议记录,PMLR 24:59-76

使用基于图的聚类进行在线技能发现

简·亨德里克·梅岑;第十届强化学习欧洲研讨会会议记录,PMLR 24:77-88

离散MDP中非政策学习的实证分析

科斯敏·普杜拉鲁、多伊娜·普雷库普、乔尔·皮诺、吉奥盖·科姆尼奇;第十届强化学习欧洲研讨会会议记录,PMLR 24:89-102

EXP3算法在随机环境中的性能评估与分析

叶夫根尼·塞尔丁(Yevgeny Seldin)、塞佩斯瓦里(Csaba Szepesvari)、彼得·奥尔(Peter Auer)、亚辛·阿巴斯·亚德科里(Yasin Abbasi-Yadkori);第十届强化学习欧洲研讨会会议记录,PMLR 24:103-116

梯度时差网络

大卫·西尔弗;第十届强化学习欧洲研讨会会议记录,PMLR 24:117-130

半监督学徒制学习

米查尔·瓦尔科、穆罕默德·加瓦姆扎德、亚历山德罗·拉扎里奇;第十届强化学习欧洲研讨会会议记录,PMLR 24:131-142

结构化预测的模拟学习算法研究

安德烈亚斯·弗拉科斯;第十届强化学习欧洲研讨会会议记录,PMLR 24:143-154

基于滚动的游戏树搜索超越了传统的Alpha-beta

Ari Weinstein、Michael L.Littman、Sergiu Goschin;第十届欧洲强化学习研讨会论文集,PMLR 24:155-167

订阅通过RSS