基线

基线:OpenAI基线是一组强化学习算法的高质量实现。这些算法将使研究社区更容易复制、提炼和识别新的想法,并将创建良好的基线,以便在此基础上进行研究。我们的DQN实现和它的变体与已发表论文的分数大致相当。我们希望它们能作为一个基础,在这个基础上可以添加新的想法,并作为一个工具来比较新的方法和现有的方法。

此软件的关键字

这里的任何内容都将在支持canvas元素的浏览器上被替换