INSIGHT: End-to-End Neuro-Symbolic Visual Reinforcement Learning with Language Explanations

Luo, Lirui; Zhang, Guoxi; Xu, Hongming; Yang, Yaodong; Fang, Cong; Li, Qing

计算机科学>人工智能

arXiv公司：2403.12451（cs）

【于2024年3月19日提交】

标题：洞察：通过语言解释进行端到端的神经符号视觉强化学习

作者：李瑞洛,张国喜,徐洪明,杨耀东,丛芳,李青（音）

查看PDF HTML（实验性）

摘要：神经符号强化学习（NS-RL）以符号政策的可解释性为特征，已成为一种有前途的可解释决策范式。对于具有视觉观察的任务，NS-RL需要状态的结构化表示，但由于缺乏效率，以前的算法无法使用奖励信号细化结构化状态。可访问性也是一个问题，因为需要广泛的领域知识来解释当前的符号策略。本文提出了一种能够同时学习结构化状态和符号策略的框架，其核心思想是通过将视觉基础模型提取为可扩展的感知模块来克服效率瓶颈。此外，我们设计了一个管道，它使用大型语言模型为政策和决策生成简明易读的语言解释。在九个Atari任务的实验中，我们的方法与现有的NSRL方法相比表现出了显著的性能提升。我们还展示了对政策和决策的解释。

学科：	人工智能（人工智能）
引用为：	arXiv公司：2403.12451[cs.人工智能]
	（或 arX病毒：2403.12451v1[cs.人工智能]对于此版本）
	https://doi.org/10.48550/arXiv.2403.12451

提交历史记录

发件人：李瑞洛[查看电子邮件]
[第1版]2024年3月19日星期二05:21:20 UTC（4298 KB）

全文链接：

访问纸张：

查看许可证

当前浏览上下文：

反恐精英。人工智能

<上一版本 | 下一个>

新的 | 最近的 | 2403

更改为浏览方式：

反恐精英

参考文献和引文

导出BibTeX引文

计算机科学>人工智能

标题：洞察：通过语言解释进行端到端的神经符号视觉强化学习

提交历史记录

访问纸张：

参考文献和引文

书签

书目和引文工具

与本文相关的代码、数据和媒体

演示

推荐和搜索工具

arXivLabs：与社区合作者合作的实验项目

计算机科学>人工智能

标题：洞察：通过语言解释进行端到端的神经符号视觉强化学习

提交历史记录

访问纸张：

参考文献和引文

BibTeX格式引文

书签

书目和引文工具

与本文相关的代码、数据和媒体

演示

推荐和搜索工具

arXivLabs：与社区合作者合作的实验项目