Goal Space Abstraction in Hierarchical Reinforcement Learning via Reachability Analysis

Zadem, Mehdi; Mover, Sergio; Nguyen, Sao Mai

计算机科学>机器学习

arXiv:2309.07168（cs）

【于2023年9月12日提交】

职务：基于可达性分析的分层强化学习目标空间提取

作者：迈赫迪·扎德姆（LIX，U2IS），塞尔吉奥·莫弗（LIX），圣美阮（U2IS、Flowers、IMT Atlastive-INFO、Lab-STICC_RAMBO）

查看PDF

摘要：开放式学习极大地受益于目标表示的符号方法的使用，因为它们提供了构建知识的方法，以实现高效和可转移的学习。然而，现有的基于符号推理的分层强化学习（HRL）方法往往受到限制，因为它们需要手动表示目标。自主发现象征性目标表示的挑战在于，它必须保存关键信息，例如环境动力学。在这项工作中，我们通过一种紧急表示提出了一种用于子目标发现的发展机制，该表示抽象（即，将在任务中具有类似角色的环境状态集分组）。我们创建了一个HRL算法，该算法会随着策略逐渐学习该表示，并在导航任务中对其进行评估，以表明所学习的表示是可解释的，从而提高数据效率。

学科：	机器学习（cs.LG）; 人工智能；形式语言与自动机理论（cs.FL）；机器人（cs.RO）
引用为：	arXiv:2309.07168【cs.LG】
	（或 arXiv:2309.07168v1【cs.LG】对于此版本）
	https://doi.org/10.44850/arXiv.2309.07168
日志参考：	内在激励开放式学习IMOL 20232023年9月，法国巴黎

提交历史记录

发件人：Sao Mai Nguyen[查看电子邮件][通过CCSD代理]
[第1版]2023年9月12日星期二06:53:11 UTC（566 KB）

计算机科学>机器学习

职务：基于可达性分析的分层强化学习目标空间提取

提交历史记录

访问纸张：

参考文献和引文

书签

书目和引文工具

与本文相关的代码、数据和媒体

演示

推荐和搜索工具

arXivLabs：与社区合作者合作的实验项目

计算机科学>机器学习

职务：基于可达性分析的分层强化学习目标空间提取

提交历史记录

访问纸张：

参考文献和引文

BibTeX格式的引文

书签

书目和引文工具

与本文相关的代码、数据和媒体

演示

推荐和搜索工具

arXivLabs：与社区合作者合作的实验项目