概述
用于具体人工智能研究的开源框架
AllenAct公司是一个模块化且灵活的学习框架,其设计重点是具体化AI研究的独特要求。它为越来越多的具体化环境、任务和算法提供一流的支持,提供最先进模型的复制品,包括大量文档、教程、启动代码和预培训模型。
AllenAct由艾伦人工智能研究所(AI2)AI2是一家非盈利机构,其使命是通过高影响力的AI研究和工程为人类做出贡献。
快速链接
功能和亮点
- 支持多种环境:支持iTHOR公司,机器人THOR和栖息地具体化环境以及网格世界,包括迷你电网.
- 任务摘要:AllenAct将任务和环境解耦,使研究人员能够在同一环境中轻松执行各种任务。
- 算法:支持多种on-policy算法,包括颇,DD-PPO公司,A2C型、模仿学习和戴格尔以及离线培训,如离线IL。
- 顺序算法:试验不同序列的训练程序是微不足道的,这通常是成功策略的关键。
- 同时损失:在培训模型中轻松组合各种损失(例如,在优化PPO损失的同时使用外部自我监督损失)。
- 多代理支持:支持多代理算法和任务。
- 可视化效果:开箱即用的支持,可以轻松可视化代理的第一人称和第三人称视图,以及集成到Tensorboard中的中间模型张量。
- 预训练模型:许多标准具体化AI任务的代码和模型。
- 教程:启动代码和广泛的教程,帮助提升到具体化AI。
- 一流的PyTorch支持:为数不多的针对PyTorch的RL框架之一。
- 任意动作空间:支持离散和连续动作。
环境 |
任务 |
算法 |
iTHOR公司,机器人THOR,栖息地,迷你电网,OpenAI健身房 |
指针导航,对象导航,MiniGrid任务,健身房Box2D任务 |
A2C型,颇,DD-PPO公司,戴格尔、非政策模仿 |
贡献
我们欢迎广大社区的贡献。如果您想做出这样的贡献,我们建议您首先提交一份问题描述您提出的改进。这样做可以确保在您花费大量时间讨论建议之前,我们可以验证您的建议。应该通过来自存储库分支的pull请求进行改进和错误修复,地址为https://github.com/allenai/allenact.
此存储库中的所有代码都要遵循格式、文档和类型注释准则。有关更多详细信息,请参阅我们的缴款指南.
致谢
这项工作建立在pytorch-a2c-ppo-acktr喷枪伊利亚·科斯特里科夫图书馆,并使用FAIR的一些数据结构居住实验室。我们要感谢达斯汀·施温克(Dustin Schwenk)为公开发布该框架提供的帮助。
许可证
AllenAct是麻省理工学院授权的,如许可证文件。
团队
AllenAct是一个开源项目,由艾伦人工智能研究所(AI2)PRIOR研究小组的成员创建。
引用
如果你使用这项工作,请引用我们的纸张:
@文章{艾伦卡特,
作者 = {Luca Weihs、Jordi Salvador、Klemen Kotar、Unnat Jain、Kuo-Hao Zeng、Roozbeh Mottaghi和Aniruddha Kembhavi},
标题 = {AllenAct:具体人工智能研究的框架},
年 = {2020},
杂志 = {arXiv预打印arXiv:2008.12760},
}