稳定基础3:可靠的强化学习实施

安东宁·拉芬(Antonin Raffin)、阿什利·希尔(Ashley Hill)、亚当·格利夫(Adam Gleave)、安西·卡内维斯托(Anssi Kanervisto)、马克西米利安·厄内斯特斯(Maximilian Ernestus)、诺亚·多。

年份:2021年,数量:22,版本:268,页码:1-8


摘要

Stable-Baselines3提供了Python中深度强化学习(RL)算法的开源实现。这些实现已经根据参考代码库进行了基准测试,自动化单元测试覆盖了95%的代码。算法遵循一致的接口,并附有大量文档,使训练和比较不同的RL算法变得简单。我们的文档、示例和源代码可在https://github.com/DLR-RM/stable-baselines3。

PDF格式 BibTeX公司 代码