跳到内容

概述


一个开放源码的嵌入式人工智能研究框架


许可证:麻省理工学院 文件状态 最新版本 Python 3.6 LGTM等级:Python 代码样式:黑色

阿连克是一个模块化和灵活的学习框架,主要针对具体人工智能研究的独特需求而设计。它为越来越多的具体环境、任务和算法提供一流的支持,提供最新模型的复制品,包括大量文档、教程、启动代码和预培训模型。

AllenAct由艾伦人工智能研究所(AI2). AI2是一个非盈利机构,其使命是通过高影响力的人工智能研究和工程来为人类做出贡献。

特色与亮点#

  • 支持多种环境:支持伊索,机器人栖息地具体环境以及网格世界,包括小型电网.
  • 任务抽象:任务和环境在AllenAct中是解耦的,使得研究人员能够在同一环境中轻松地实现各种各样的任务。
  • 算法:支持多种on-policy算法,包括多酚氧化酶,DD-PPO,A2C型,模仿学习和匕首以及离线培训,如离线IL。
  • 序列算法:使用不同序列的训练例程进行试验是很简单的,这通常是成功策略的关键。
  • 同时损失:在培训模型的同时轻松组合各种损失(例如,在优化PPO损失的同时使用外部自我监督损失)。
  • 多代理支持:支持多代理算法和任务。
  • 可视化效果:开箱即用支持,可以轻松地可视化第一人称和第三人称代理视图以及中间模型张量,集成到Tensorboard中。
  • 预先培训的模型:许多标准的人工智能任务的代码和模型。
  • 教程:启动代码和广泛的教程,以帮助逐步上升到具体的人工智能。
  • 一流的Pythorch支持:为数不多的针对PyTorch的RL框架之一。
  • 任意作用空间:支持离散和连续操作。
环境 任务 算法
伊索,机器人,栖息地,小型电网,OpenAI健身房 点导航,对象导航,迷你网格任务,健身房任务框2D A2C型,多酚氧化酶,DD-PPO,匕首,政策外模仿

贡献#

我们欢迎广大社区的贡献。如果您愿意提供此类信息,我们建议您首先提交问题描述你的改进建议。这样做可以确保我们可以在您花费大量时间之前验证您的建议。改进和错误修复应该通过来自存储库分支的pull请求进行https://github.com/allenai/allenact.

此存储库中的所有代码都要遵守格式、文档和类型注释准则。更多详情,请参阅捐款指南.

致谢#

这项工作建立在pytorch-a2c-ppo-acktr图书馆的Ilya Kostrikov和使用的一些数据结构从博览会栖息地实验室. 我们要感谢Dustin Schwenk对框架公开发布的帮助。

许可证#

AllenAct是麻省理工学院授权的许可证文件。

团队#

AllenAct是一个开源项目,由Allen人工智能研究所(AI2)先前的研究小组成员建立。

引用#

如果你使用这项工作,请引用我们的纸张:

@文章{阿连克,
  作者 = {卢卡·魏斯、乔尔迪·萨尔瓦多、克莱门·科塔尔、乌纳特·贾因、郭浩增、鲁兹贝·莫塔吉和阿尼鲁德达·坎巴维},
  标题 = {AllenAct:一个具体化人工智能研究框架},
   = {2020},
  杂志 = {arXiv},
}