更新源 && sudo apt-get安装cmake libopenmpi-dev python3-dev zlib1g-dev
brew安装cmake openmpi
pip安装virtualenv
virtualenv/path/to/venv--python=python3
./path/to/venv/bin/activate
-
克隆回购并将其cd到其中: git克隆 https://github.com/openai/baselines.git 光盘 基线 -
如果您尚未安装TensorFlow,请安装您最喜欢的TensorFlow。 在大多数情况下,您可以使用 pip安装tensorflow-gpu==1.14 # 如果您有兼容CUDA的gpu和合适的驱动程序 或 pip安装张量流==1.14 安装Tensorflow 1.14,这是主分支支持的最新版本的Tensorlow。 请参阅 TensorFlow安装指南 了解更多详细信息。 -
安装基线包 pip安装-e .
pip安装pytest pytest测试
python-m基线.run--alg= < 算法的名称 > --环境价值= < 环境id > [其他参数]
python-m baselines.run--alg=ppo2--env=Humanoid-v2--network=mlp--num_timesteps=2e7
python-m baselines.run--alg=ppo2--env=Humanoid-v2--network=mlp--num_timesteps=2e7--ent_cef=0.1--num_hidden=32--num_alayers=3--value_network=copy
python-m baselines.run--alg=deepq--env=PongNoFrameskip-v4--num_timesteps=1e6
python-m baselines.run--alg=ppo2--env=PongNoFrameskip-v4--num_timesteps=2e7--保存路径= ~ /型号/pong_20M_ppo2
python-m baselines.run--alg=ppo2--env=PongNoFrameskip-v4--num_timesteps=0--加载路径= ~ /型号/pong_20M_ppo2--播放
python-m baselines.run--alg=ppo2--env=PongNoFrameskip-v4--num_timesteps=2e7--保存路径= ~ /模型/pong_20M_ppo2--日志路径= ~ /原木/Pong/
@其他{基线, author={达里瓦尔、普拉福拉和黑塞、克里斯托弗和克里莫夫、奥列格和尼科尔、亚历克斯和普拉佩特、马提亚斯和拉德福德、亚历克和舒尔曼、约翰和西多尔、西门和吴、于怀和柴可夫、彼得}, title={OpenAI基线}, 年份={2017年}, publisher={GitHub}, 日志={GitHub存储库}, howpublished={\url{ https://github.com/openai/baselines }}, }