以往研究:基于愿景的强化学习

主要研究者:
斯特拉·余(Stella Yu)

基于视觉的强化学习(RL)是成功的,但如何将其推广到未知的测试环境仍然具有挑战性。它不仅需要处理高维视觉输入,还需要处理新测试场景中的显著变化,例如颜色/纹理变化或移动干扰物。现有的方法侧重于训练一个对变化的视觉领域通用的RL策略,而我们侧重于提取通用的视觉前景,为RL策略学习者提供清晰的不变视觉。我们的方法是完全无监督的,没有手动注释或对环境内部的访问。