Deep Hierarchical Planning from Pixels

Hafner, Danijar; Lee, Kuang-Huei; Fischer, Ian; Abbeel, Pieter

计算机科学>人工智能

arXiv公司：2206.04114（cs）

【于2022年6月8日提交】

标题：基于像素的深度分层规划

作者：丹尼尔·哈夫纳,Kuang-Huei Lee先生,伊恩·菲舍尔,彼得·阿比尔

查看PDF

摘要：智能代理需要选择长的动作序列来解决复杂的任务。虽然人类很容易将任务分解为子目标，并通过数百万条肌肉命令实现，但当前的人工智能仅限于具有数百个决策范围的任务，尽管计算预算很大。分层强化学习的研究旨在克服这一局限性，但已经证明具有挑战性，目前的方法依赖于手动指定的目标空间或子任务，并且不存在通用的解决方案。我们介绍了Director，这是一种实用的方法，通过在学习世界模型的潜在空间内进行规划，直接从像素学习层次行为。高级策略通过选择潜在目标来最大化任务和探索奖励，而低级策略则学习实现目标。尽管在潜在空间中操作，但决策是可以解释的，因为世界模型可以将目标解码为图像以进行可视化。导演在奖励较少的任务上表现优于探索方法，包括从以自我为中心的摄像机和本体感受器中使用四足机器人进行3D迷宫穿越，而无需访问先前工作中使用的全局位置或自上而下的视图。导演还学习了各种环境中的成功行为，包括视觉控制、Atari游戏和DMLab级别。

评论：	网站：此https URL
学科：	人工智能（cs.AI）; 机器学习（cs.LG）；机器人（cs.RO）；机器学习（stat.ML）
引用为：	arXiv公司：2206.04114[cs.人工智能]
	（或 arXiv:2206.04114v1[cs.人工智能]对于此版本）
	https://doi.org/10.48550/arXiv.2206.04114

提交历史记录

发件人：Danijar Hafner[查看电子邮件]
[第1版]2022年6月8日星期三18:20:15 UTC（1324 KB）

计算机科学>人工智能

标题：基于像素的深度分层规划

提交历史记录

访问纸张：

参考文献和引文

书签

书目和引文工具

与本文相关的代码、数据和媒体

演示

推荐和搜索工具

arXivLabs：与社区合作者合作的实验项目

计算机科学>人工智能

标题：基于像素的深度分层规划

提交历史记录

访问纸张：

参考文献和引文

BibTeX格式的引文

书签

书目和引文工具

与本文相关的代码、数据和媒体

演示

推荐和搜索工具

arXivLabs：与社区合作者合作的实验项目