摘要

第二十四届国际人工智能联合会议论文摘要

街机学习环境:通用代理评估平台(扩展摘要)/4148
马克·贝勒马尔(Marc Bellemare)、雅瓦·纳达夫(Yavar Naddaf)、乔尔·维内斯(Joel Veness)、迈克尔·鲍林(Michael Bowling)
PDF格式

在这个扩展的摘要中,我们介绍了Arcade学习环境(ALE):这既是一个挑战性问题,也是一个评估通用、领域相关AI技术开发的平台和方法。ALE为数百个Atari 2600游戏环境提供了一个接口,每个环境都是不同的、有趣的,并且都是为人类玩家设计的挑战。ALE在强化学习、模型学习、基于模型的规划、模仿学习、迁移学习和内在动机方面提出了重大的研究挑战。最重要的是,它为评估和比较解决这些问题的方法提供了一个严格的测试平台。我们通过展示一组使用成熟的AI技术设计的领域相关代理的基准集来说明ALE的前景,这些代理用于强化学习和规划。在这样做的过程中,我们还提出了一种由ALE提供的评估方法,报告了超过55场不同比赛的经验结果。最后,我们简要介绍了ALE的最新发展。所有的软件,包括基准代理,都是公开的。