Deep Exploration via Randomized Value Functions

我们研究了随机值函数的使用，以指导强化学习中的深入探索。这为将统计和计算效率的探索与价值函数学习的常用实用方法相结合提供了一种优雅的方法。我们提出了几种利用随机值函数的强化学习算法，并通过计算研究证明了其有效性。我们还证明了一个遗憾界，它用表格表示建立了统计效率。

通过随机值函数进行深度探索