跳到内容

法拉玛基金会/迷你电网

存储库文件导航

预先提交 代码样式:黑色

图车门钥匙课程

Minigrid库包含一组离散网格世界环境,用于对强化学习进行研究。环境遵循健身房标准API,它们被设计为轻量级、快速且易于定制。

文档网站位于minigrid.farama.org网站,我们有一个公共discord服务器(我们也使用它来协调开发工作),您可以在此加入:https://discord.gg/bnJ6kubTg6版本

请注意,该图书馆以前被称为gym-minigrid,并在多个出版物中引用。如果您的出版物使用Minigrid库,并且您希望它包含在出版物清单,请在中创建问题GitHub存储库.

请参阅项目路线图有关长期计划的详细信息。

安装

要安装迷你网格库,请使用pip安装迷你电网.

我们支持Linux和macOS上的Python 3.7、3.8、3.9、3.10和3.11。我们将接受与Windows相关的PR,但不正式支持。

环境

包含的环境可以分为两组。原件迷你电网环境和BabyAI婴儿环境。

迷你电网

原始版本中包含的环境列表迷你电网库可以在文档这些环境都有一个类似于三棱镜的代理,该代理具有一个离散的动作空间,必须根据环境使用不同的障碍物(墙、熔岩、动态障碍物)导航2D地图。要完成的任务由使命代理观察返回的字符串。这些任务包括不同的面向目标和层次的任务,例如捡起箱子、用钥匙打开门或在迷宫中导航以到达目标位置。每个环境都提供一个或多个在Gymansium注册的配置。每个环境还可以根据大小/复杂性进行编程调整,这对于课程学习或微调难度都很有用。

BabyAI婴儿

这些环境已从BabyAI婴儿项目库和环境列表也可以在文档。本环境集的目的是对扎根语言学习进行研究。这些环境源于迷你电网网格世界环境,包括生成合成自然的指示(例如“把红色的球放在你左边的盒子旁边”),命令代理导航世界(包括打开门)并将对象移动到指定位置以完成任务。

培训代理人

这个rl-存储文件是一个包含如何培训示例的存储库微型电网具有RL算法的环境。此代码已经过测试,可以在该环境中使用。默认的超参数也会收敛。

引用

原件健身房迷你网格创建环境是在米拉。添加了动态障碍物环境,作为在达姆施塔特工业大学国际会计准则以及热那亚大学的动态障碍物移动机器人导航。

要引用此项目,请使用:

@文章{迷你电网迷你世界23,作者={马克西姆·谢瓦利尔·博伊斯弗特(Maxime Chevalier-Boisvert)、博伦·戴(Bolun Dai)、马克·托尔斯(Mark Towers)、罗德里戈·德拉扎诺(Rodrigo de Lazcano)、卢卡斯·威廉姆斯(Lucas Willems)、塞勒姆·拉鲁(Salem Lahlou)、苏曼·},标题={Minigrid和Miniworld:面向目标任务的模块化和可定制强化学习环境},杂志={CoRR公司},体积={abs/2306.13831},={2023},}

如果使用BabyAI婴儿环境还请引用以下内容:

@文章{骑士2018babyai,标题={Babyai:一个研究扎根语言学习样本效率的平台},作者={波西弗特骑士、马克西姆和巴达瑙、德兹米特里和拉鲁、塞勒姆和威廉姆斯、卢卡斯和萨哈利亚、奇特万和阮、蒂恩·胡和本吉奥、约书亚},杂志={arXiv预打印arXiv:1810.08272},={2018}}