[编辑]
第24卷:欧洲强化学习研讨会,2012年7月30日至1日,苏格兰爱丁堡
[编辑]
编辑:Marc Peter Deisenroth、Csaba Szepesvári、Jan Peters
[围兜][城市规划署]
前言
前言
马克·彼得·德伊森罗特(Marc Peter Deisenroth)、塞佩斯瓦里(Csaba Szepesvári)、扬·彼得斯(Jan Peters);第十届强化学习欧洲研讨会会议记录,PMLR 24:i-i
[防抱死制动系统][下载PDF]
接受的论文
单轨迹强化学习的学习探索/开发策略
Michael Castronovo、Francis Maes、Raphael Fonteneau、Damien Ernst;第十届强化学习欧洲研讨会会议记录,PMLR 24:1-10
[防抱死制动系统][下载PDF]
基于循环后缀树的特征强化学习
马扬克·达斯瓦尼、彼得·苏尼哈格、马库斯·赫特;第十届强化学习欧洲研讨会会议记录,PMLR 24:11-24
[防抱死制动系统][下载PDF]
通过PAC Bandits在薪酬丰厚的领域进行规划
Sergiu Goschin、Ari Weinstein、Michael L.Littman、Erick Chastain;第十届强化学习欧洲研讨会会议记录,PMLR 24:25-42
[防抱死制动系统][下载PDF]
基于能源政策的参与者关键强化学习
尼古拉斯·希斯(Nicolas Heess)、大卫·西尔弗(David Silver)、叶惠德(Yee Whye Teh);第十届强化学习欧洲研讨会会议记录,PMLR 24:45-58
[防抱死制动系统][下载PDF]
转移知识强化学习中的定向探索
Timothy A.Mann,Yoonsuck Choe;第十届强化学习欧洲研讨会会议记录,PMLR 24:59-76
[防抱死制动系统][下载PDF]
使用基于图的聚类进行在线技能发现
简·亨德里克·梅岑;第十届强化学习欧洲研讨会会议记录,PMLR 24:77-88
[防抱死制动系统][下载PDF]
离散MDP中非政策学习的实证分析
科斯敏·普杜拉鲁、多伊娜·普雷库普、乔尔·皮诺、吉奥盖·科姆尼奇;第十届强化学习欧洲研讨会会议记录,PMLR 24:89-102
[防抱死制动系统][下载PDF]
EXP3算法在随机环境中的性能评估与分析
叶夫根尼·塞尔丁(Yevgeny Seldin)、塞佩斯瓦里(Csaba Szepesvari)、彼得·奥尔(Peter Auer)、亚辛·阿巴斯·亚德科里(Yasin Abbasi-Yadkori);第十届强化学习欧洲研讨会会议记录,PMLR 24:103-116
[防抱死制动系统][下载PDF]
梯度时差网络
大卫·西尔弗;第十届强化学习欧洲研讨会会议记录,PMLR 24:117-130
[防抱死制动系统][下载PDF]
半监督学徒制学习
米查尔·瓦尔科、穆罕默德·加瓦姆扎德、亚历山德罗·拉扎里奇;第十届强化学习欧洲研讨会会议记录,PMLR 24:131-142
[防抱死制动系统][下载PDF]
结构化预测的模拟学习算法研究
安德烈亚斯·弗拉科斯;第十届强化学习欧洲研讨会会议记录,PMLR 24:143-154
[防抱死制动系统][下载PDF]
基于滚动的游戏树搜索超越了传统的Alpha-beta
Ari Weinstein、Michael L.Littman、Sergiu Goschin;第十届欧洲强化学习研讨会论文集,PMLR 24:155-167
[防抱死制动系统][下载PDF]