模型预测控制的最优成本设计
Avik Jain、Lawrence Chan、Daniel S.Brown、Anca D.Dragan
第三届动力学和控制学习会议记录,PMLR 144:1205-12172021年。
摘要
许多机器人领域使用某种形式的非凸模型预测控制(MPC)进行规划,该控制设置缩短的时间范围,执行轨迹优化,并在每一步重新规划。实际任务通常需要比可计算的时间范围长得多的时间范围,并通过在整个时间范围内累积的成本函数来指定。例如,自动驾驶汽车可能具有成本函数,该函数在效率、安全风险和遵守交通法规之间做出期望的权衡。在这项工作中,我们挑战了通常的假设,即我们应该为MPC指定的成本应该与任务的基本真实成本相同。我们建议,由于MPC解算器的视野较短,存在局部最优,而且重要的是,未能考虑到未来的重新规划能力,因此在许多任务中,有目的地选择不同的成本函数进行MPC优化可能是有益的:这将导致MPC的推出具有较低的实际成本,而不是MPC计划的轨迹。我们将其形式化为一个最优成本设计问题,并提出一种基于零阶优化的方法,使我们能够为MPC规划机器人设计连续状态和动作MDP的最优成本。我们在一个自主驾驶领域中测试了我们的方法,在该领域中,我们发现成本与地面真相不同,这隐含地补偿了重新规划、短期和局部最小值问题。例如,在已知成本下与vanilla MPC进行规划会激励汽车推迟决策,这隐含了一个事实,即汽车在未来将获得更多信息,并能够做出更好的决策。
引用本文
相关材料