强化学习工具箱的功能,一个应用程序和一个Simulink平台,用于强化学习的算法,包括DQN、PPO、SAC和DDPG。Estas políticas se pueden emplear para implementar controladores y algoritmos de toma de dedecisiones para aplicaciones compleejas,tales como asignacioón de recursios,robótica y sistemas autónomos。
Esta toolbox允许在MATLAB和Simulink中代表神经网络的深度和表格的策略和功能,以及内部模型的媒体交互。在工具箱中评估强化学习的算法——单智能体和多智能体的建议。普埃德试验了hiperparámetros的配置,监督了企业的发展,同时代理也参与了形式互动和形式应用程序的开发。Para mejorar el-rendimiento del entranamiento,se-pueden ejecutar simulaciones en parallelo en varias CPU,GPU,clusters de PC,y la nube(con Parallel Computing Toolbox y MATLAB Parallel Server)。
Mediante el formato de modelos ONNX™,se-pueden importar políticas existentes desde marcos de Deep Learning tales como TensorFlow™Keras y PyTorch(con Deep Learning Toolbox)。Puede通用código c,c++y CUDA®优化GPU y微控制器中的并行处理策略。Los ejemplos de referencia de esta toolbox le ayudarán a iniciar sus proyectos公司。