Skill-based Multi-objective Reinforcement Learning of Industrial Robot Tasks with Planning and Knowledge Integration

Mayr, Matthias; Ahmad, Faseeh; Chatzilygeroudis, Konstantinos; Nardi, Luigi; Krueger, Volker

计算机科学>机器人

arXiv公司：2203.10033（cs）

【2022年3月18日提交】

标题：基于技能的工业机器人多目标强化学习及其规划和知识集成

作者：马提亚斯·迈尔,法西·艾哈迈德,康斯坦蒂诺斯·查齐利格鲁迪斯,路易吉·纳尔迪,沃尔克·克鲁格

查看PDF

摘要：在小批量的现代工业环境中，为新任务设置机器人系统应该很容易。策略是存在的，例如技能的使用，但当涉及到操作力和扭矩时，这些系统往往不足。我们引入了一种方法，该方法将任务级规划与基于技能的系统场景特定参数的目标学习相结合。我们提出以下流水线：（1）用户用规划语言PDDL提供任务目标，（2）生成计划（即技能序列），并自动识别技能的可学习参数。然后，操作员为学习过程选择（3）个奖励函数和超参数。我们方法的两个方面至关重要：（a）学习与知识框架紧密集成，以支持符号规划并为学习提供先验，（b）使用多目标优化。这有助于平衡安全和任务绩效等关键绩效指标（KPI），因为它们往往会相互影响。我们采用多目标贝叶斯优化方法，并在仿真中完全学习。我们通过学习两种不同的接触丰富任务的技能参数来证明我们的方法的有效性和通用性。我们展示了它们在一个真实的7自由度KUKA-iiwa机械手上的成功执行，并优于人类机器人操作员的手动参数化。

评论：	提交给2022 IEEE/RSJ智能机器人和系统国际会议（IROS）的8页6图
学科：	机器人（cs.RO）; 机器学习（cs.LG）
引用为：	arXiv公司：2203.10033[cs.反渗透]
	（或 arXiv:2203.10033v1[cs.反渗透]对于此版本）
	https://doi.org/10.48550/arXiv.2203.10033

提交历史记录

发件人：Matthias Mayr[查看电子邮件]
[第1版]2022年3月18日星期五16:03:27 UTC（10587 KB）

计算机科学>机器人

标题：基于技能的工业机器人多目标强化学习及其规划和知识集成

提交历史记录

访问纸张：

参考文献和引文

书签

书目和引文工具

与本文相关的代码、数据和媒体

演示

推荐和搜索工具

arXivLabs：与社区合作者合作的实验项目

计算机科学>机器人

标题：基于技能的工业机器人多目标强化学习及其规划和知识集成

提交历史记录

访问纸张：

参考文献和引文

BibTeX格式的引文

书签

书目和引文工具

与本文相关的代码、数据和媒体

演示

推荐和搜索工具

arXivLabs：与社区合作者合作的实验项目