Hierarchical Empowerment: Towards Tractable Empowerment-Based Skill Learning

Levy, Andrew; Rammohan, Sreehari; Allievi, Alessandro; Niekum, Scott; Konidaris, George

计算机科学>机器学习

arXiv:2307.02728（cs）

【于2023年7月6日提交(第1版)，最新修订日期：2023年10月3日（此版本，v2）]

职务：分级授权：以可追踪授权为基础的技能学习

作者：安德鲁·列维,Sreehari Rammohan公司,亚历山德罗·阿列维,斯科特·尼库姆,乔治·科尼达利斯

查看PDF

摘要：通用代理需要大量技能。授权——技能和状态之间的最大交互信息——为学习大量不同技能提供了一条途径，但交互信息很难优化。我们引入了一个新的框架，分层授权，通过集成目标条件分层强化学习的概念，使计算授权更容易处理。我们的框架有两个具体贡献。首先，我们引入了一个新的互信息变分下界，可以用来计算短期内的赋权。其次，我们引入了一种分层结构，用于在指数级更长的时间范围内实现计算授权。我们在一系列模拟机器人任务中验证了该框架的贡献。在一个流行的蚂蚁导航领域中，我们的四级代理能够学习覆盖面积比先前工作大两个数量级的技能。

评论：	其他基线比较
学科：	机器学习（cs.LG）; 人工智能；机器人（cs.RO）
引用为：	arXiv:2307.02728【cs.LG】
	（或 arXiv:2307.02728v2【cs.LG】对于此版本）
	https://doi.org/10.48550/arXiv.2307.02728

提交历史记录

发件人：Andrew Levy[查看电子邮件]
[第1版]2023年7月6日星期四02:27:05 UTC（1296 KB）
[版本2]2023年10月3日星期二18:24:31 UTC（1532 KB）

计算机科学>机器学习

职务：分级授权：以可追踪授权为基础的技能学习

提交历史记录

访问纸张：

参考文献和引文

书签

书目和引文工具

与本文相关的代码、数据和媒体

演示

推荐和搜索工具

arXivLabs：与社区合作者合作的实验项目

计算机科学>机器学习

职务：分级授权：以可追踪授权为基础的技能学习

提交历史记录

访问纸张：

参考文献和引文

BibTeX格式的引文

书签

书目和引文工具

与本文相关的代码、数据和媒体

演示

推荐和搜索工具

arXivLabs：与社区合作者合作的实验项目