机器学习研究论文集| 2012年6月30日至7月1日在苏格兰爱丁堡举行的第十届强化学习欧洲研讨会论文集，2013年1月12日机器学习研究文献集作为第24卷出版。卷编辑：Marc Peter Deisenroth Csaba Szepesvári Jan Peters系列编辑：Neil D.Lawrence

第24卷：欧洲强化学习研讨会，2012年7月30日至1日，苏格兰爱丁堡

编辑：Marc Peter Deisenroth、Csaba Szepesvári、Jan Peters

内容：

筛选作者：过滤器标题：

马克·彼得·德伊森罗特（Marc Peter Deisenroth）、塞佩斯瓦里（Csaba Szepesvári）、扬·彼得斯（Jan Peters）;第十届强化学习欧洲研讨会会议记录，PMLR 24:i-i

单轨迹强化学习的学习探索/开发策略

Michael Castronovo、Francis Maes、Raphael Fonteneau、Damien Ernst;第十届强化学习欧洲研讨会会议记录，PMLR 24:1-10

基于循环后缀树的特征强化学习

马扬克·达斯瓦尼、彼得·苏尼哈格、马库斯·赫特;第十届强化学习欧洲研讨会会议记录，PMLR 24:11-24

通过PAC Bandits在薪酬丰厚的领域进行规划

Sergiu Goschin、Ari Weinstein、Michael L.Littman、Erick Chastain;第十届强化学习欧洲研讨会会议记录，PMLR 24:25-42

基于能源政策的参与者关键强化学习

尼古拉斯·希斯（Nicolas Heess）、大卫·西尔弗（David Silver）、叶惠德（Yee Whye Teh）;第十届强化学习欧洲研讨会会议记录，PMLR 24:45-58

转移知识强化学习中的定向探索

Timothy A.Mann，Yoonsuck Choe;第十届强化学习欧洲研讨会会议记录，PMLR 24:59-76

使用基于图的聚类进行在线技能发现

简·亨德里克·梅岑;第十届强化学习欧洲研讨会会议记录，PMLR 24:77-88

离散MDP中非政策学习的实证分析

科斯敏·普杜拉鲁、多伊娜·普雷库普、乔尔·皮诺、吉奥盖·科姆尼奇;第十届强化学习欧洲研讨会会议记录，PMLR 24:89-102

EXP3算法在随机环境中的性能评估与分析

叶夫根尼·塞尔丁（Yevgeny Seldin）、塞佩斯瓦里（Csaba Szepesvari）、彼得·奥尔（Peter Auer）、亚辛·阿巴斯·亚德科里（Yasin Abbasi-Yadkori）;第十届强化学习欧洲研讨会会议记录，PMLR 24:103-116

梯度时差网络

大卫·西尔弗;第十届强化学习欧洲研讨会会议记录，PMLR 24:117-130

半监督学徒制学习

米查尔·瓦尔科、穆罕默德·加瓦姆扎德、亚历山德罗·拉扎里奇;第十届强化学习欧洲研讨会会议记录，PMLR 24:131-142

结构化预测的模拟学习算法研究

安德烈亚斯·弗拉科斯;第十届强化学习欧洲研讨会会议记录，PMLR 24:143-154

基于滚动的游戏树搜索超越了传统的Alpha-beta

Ari Weinstein、Michael L.Littman、Sergiu Goschin;第十届欧洲强化学习研讨会论文集，PMLR 24:155-167