计算机科学>机器学习
标题: NeurIPS 2021 NetHack挑战的见解
摘要: 在本报告中,我们总结了第一次NeurIPS 2021 NetHack挑战赛的收获。 参与者的任务是开发一个程序或代理,通过与NetHack学习环境(NLE)的互动,该程序或代理可以赢得(即“提升”)NetHack流行的地牢爬行游戏,这是一个可扩展的、程序生成的、具有挑战性的健身房环境,用于强化学习(RL)。 这项挑战展示了社区驱动的人工智能进步,许多不同的方法大大超过了之前在NetHack上的最佳结果。 此外,它还直接比较了神经网络(例如,深度RL)和符号人工智能以及混合系统,表明在NetHack上,符号机器人目前的性能远远优于深度RL。 最后,没有一个代理接近胜利,这说明NetHack适合作为人工智能研究的长期基准。