强化学习工具箱

强化学习工具箱

使用强化学习设计和培训策略

获得免费试用

查看定价

有问题吗？联系销售人员.

强化学习工具箱为使用强化学习算法（包括DQN、PPO、SAC和DDPG）的培训策略提供了应用程序、功能和Simulink块。您可以使用这些策略为资源分配、机器人和自治系统等复杂应用程序实现控制器和决策算法。

工具箱允许您使用深层神经网络或查找表来表示策略和值函数，并通过与MATLAB或Simulink中建模的环境的交互来训练它们。您可以评估工具箱中提供的单代理或多代理强化学习算法，也可以开发自己的算法。您可以实验超参数设置，监控培训进度，并通过应用程序或编程方式模拟经过培训的代理。为了提高训练性能，模拟可以在多个CPU、GPU、计算机集群和云上并行运行（使用并行计算工具箱和MATLAB并行服务器）。

通过ONNX™模型格式，可以从TensorFlow™Keras和PyTorch（使用深度学习工具箱）等深度学习框架导入现有策略。您可以生成优化的C、C++和CUDA^®在微控制器和GPU上部署经过培训的策略的代码。工具箱中包含参考示例，可帮助您入门。

什么是强化学习工具箱？

了解发行说明中的最新功能

强化学习代理

使用流行的算法（如DQN、PPO和SAC）创建无模型和基于模型的强化学习代理。或者，使用提供的模板开发您自己的自定义算法。使用RL代理阻止您的代理进入Simulink。

强化学习，第3部分：策略和学习算法(17:51)

强化学习设计器应用程序

交互式设计、培训和模拟强化学习代理。将经过培训的代理导出到MATLAB以供进一步使用和部署。

奖励信号

创建奖励信号，衡量代理人在实现目标方面的成功程度。自动生成奖励函数根据中定义的控制规范模型預測控制工具箱或Simulink设计优化.

政策代表

使用工具箱建议的神经网络架构快速入门。或者，使用深度学习工具箱图层，和深度网络设计师应用程序。

强化学习培训

通过与环境的交互或使用现有数据对代理进行培训。探索单代理和多代理培训。记录和查看培训数据，并随时监控进度。

多智能体强化学习简介(14:43)

分布式计算

使用多核计算机、云资源或计算集群加速培训并行计算工具箱和MATLAB并行服务器。利用GPU加速梯度计算和预测等操作。

四足机器人Simulink模型的屏幕截图。

环境建模

使用以下工具对与强化学习代理无缝交互的环境进行建模MATLAB软件和Simulink。与的接口第三方建模工具。

强化学习入门(9:30)

代码生成和部署

自动生成C/C++和CUDA代码来自用于部署到嵌入式设备的训练有素的策略。使用MATLAB编译器和MATLAB生产服务器将经过培训的策略作为独立应用程序、C/C++共享库等部署到生产系统。

参考示例

为机器人、自动驾驶、校准、调度和其他应用程序设计控制器和决策算法。请参考我们的参考示例以快速入门。

产品资源：

文档示例视频技术文章功能阻碍要求发行说明

“5G是一个关键的基础设施，我们必须保护它免受对手攻击。强化学习工具箱允许我们快速评估5G漏洞并确定缓解方法。”
洛克希德·马丁公司Ambrose Kam

查看更多客户案例

获得免费试用

30天的探索触手可及。

立即开始

准备好购买了吗？

获取定价信息并浏览相关产品。

查看定价联系销售人员

你是一个学生吗？

您的学校可能已经通过校园许可证提供了对MATLAB、Simulink和附加产品的访问。

获取MATLAB

接下来是什么？

免费电子书

强化学习理解指南

辅导的

强化学习进入

视频系列