计算机科学>人工智能
标题: 洞察:通过语言解释进行端到端的神经符号视觉强化学习
摘要: 神经符号强化学习(NS-RL)以符号政策的可解释性为特征,已成为一种有前途的可解释决策范式。 对于具有视觉观察的任务,NS-RL需要状态的结构化表示,但由于缺乏效率,以前的算法无法使用奖励信号细化结构化状态。 可访问性也是一个问题,因为需要广泛的领域知识来解释当前的符号策略。 本文提出了一种能够同时学习结构化状态和符号策略的框架,其核心思想是通过将视觉基础模型提取为可扩展的感知模块来克服效率瓶颈。 此外,我们设计了一个管道,它使用大型语言模型为政策和决策生成简明易读的语言解释。 在九个Atari任务的实验中,我们的方法与现有的NSRL方法相比表现出了显著的性能提升。 我们还展示了对政策和决策的解释。