计算机科学>人工智能
标题: Atari-5:将街机学习环境提炼为五个游戏
摘要: 街机学习环境(ALE)已成为评估强化学习算法性能的基本基准。 然而,在整个57游戏数据集上生成结果的计算成本限制了ALE的使用,并使得许多结果的再现性不可行。 我们提出了一种新的解决方案来解决这个问题,其形式是在基准套件中选择较小但具有代表性的环境子集。 我们应用我们的方法确定了五个ALE游戏的子集,称为Atari-5,它产生了57个游戏的中位数估计值,在其真实值的10%以内。 将子集扩展到10个游戏可以恢复57个游戏集中所有游戏日志核心的80%的方差。 我们表明,由于ALE中的许多游戏之间存在高度相关性,因此可以实现这种级别的压缩。