计算机科学>机器人
标题: 基于技能的工业机器人多目标强化学习及其规划和知识集成
摘要: 在小批量的现代工业环境中,为新任务设置机器人系统应该很容易。 策略是存在的,例如技能的使用,但当涉及到操作力和扭矩时,这些系统往往不足。 我们引入了一种方法,该方法将任务级规划与基于技能的系统场景特定参数的目标学习相结合。 我们提出以下流水线:(1)用户用规划语言PDDL提供任务目标,(2)生成计划(即技能序列),并自动识别技能的可学习参数。 然后,操作员为学习过程选择(3)个奖励函数和超参数。 我们方法的两个方面至关重要:(a)学习与知识框架紧密集成,以支持符号规划并为学习提供先验,(b)使用多目标优化。 这有助于平衡安全和任务绩效等关键绩效指标(KPI),因为它们往往会相互影响。 我们采用多目标贝叶斯优化方法,并在仿真中完全学习。 我们通过学习两种不同的接触丰富任务的技能参数来证明我们的方法的有效性和通用性。 我们展示了它们在一个真实的7自由度KUKA-iiwa机械手上的成功执行,并优于人类机器人操作员的手动参数化。