×

清洁RL

swMATH ID: 41244
软件作者: 黄圣依、鲁斯兰·费尔南德·朱利安·多萨、常野、杰夫·布拉加
描述: CleanRL:深层强化学习算法的高质量单文件实现。CleanRL是一个开源库,它提供了深度强化学习算法的高质量单文件实现。它通过简单的代码库和集成生产工具来帮助交互和缩放实验,提供了一种更简单但可扩展的开发体验。在CleanRL中,我们将算法的所有细节放在一个文件中,使这些与性能相关的细节更容易识别。此外,还提供了一个实验跟踪功能,以帮助将指标、超参数、代理游戏的视频、依赖关系等记录到云中。尽管实现简洁,但我们还设计了一些工具来帮助扩展,通过Docker和云提供商在2000多台机器上同时进行实验。最后,我们通过对各种环境进行基准测试来确保实现的质量。CleanRL的源代码可以在https://github.com/vwxyzjn/cleanrl
主页: https://arxiv.org/abs/2111.08819
源代码:  https://github.com/vwxyzjn/cleanrl
依赖项: 蟒蛇
相关软件: Isaac健身房;张力板;PyTorch公司;优雅RL;稳定基线;RLzoo公司;RLlib(RL库);蘑菇RL;补药;rlpyt公司;PyTorchRL公司;主席RL;皮子弹;MuJoCo公司;OpenAI健身房;蟒蛇;skrl公司
引用于: 0个文档