六足机器人多控制运动规划的深度强化学习

六足机器人多控制运动规划的深度强化学习

傅慧乔、汤开强、李鹏、张文琪、王新鹏、邓贵州、王涛、陈春林

第三十届国际人工智能联合会议记录
主轨道。第2381-2388页。https://doi.org/10.24963/ijcai.2021/328

在复杂环境中进行腿部运动需要仔细规划腿部机器人的立足点。本文提出了一种新的深度强化学习(DRL)方法,用于实现六足机器人在不均匀梅花桩上的多接触运动规划。首先,六足机器人的运动被描述为具有特定奖励函数的马尔可夫决策过程(MDP)。其次,提出了六足机器人的转移可行性模型,描述了在满足运动学和动力学条件下状态转移的可行性,进而确定了奖赏。第三,根据对角高斯分布对落脚点和质量中心(CoM)序列进行采样,并利用设计的DRL算法学习最优策略,对序列进行优化。物理系统的仿真和实验结果都证明了该方法的可行性和有效性。视频显示在https://videoviewpage.wixsite.com/mcrl。
关键词:
机器学习:深度强化学习
机器人学:机器人学
机器人:运动和路径规划