张力 swMATH ID: 31158 软件作者: 亚历山大·库内尔(Alexander Kuhnle);Michael Schaarschmidt;凯·弗里克 描述: Tensorforce:用于应用强化学习的TensorFlow库。Tensorforce是一个开放源码的深度强化学习框架,强调模块化的灵活库设计以及在研究和实践中应用程序的简单易用性。Tensorforce建立在谷歌的TensorFlow框架之上,并与Python 3兼容(Python 2的支持在0.5版本中被删除)。Tensorforce遵循一系列高级设计选择,这些选择将其与其他类似库区分开来:基于模块化组件的设计:最重要的是,努力做到尽可能通用和可配置,可能要付出一定的代价,忠实地模仿介绍论文的细节。RL算法和应用程序的分离:算法与输入(状态/观察)和输出(操作/决策)的类型和结构以及与应用程序环境的交互无关。Full-on TensorFlow模型:整个强化学习逻辑(包括控制流)在TensorFlow中实现,以实现独立于应用程序编程语言的可移植计算图,并促进模型的部署。 主页: https://github.com/tensorforce/tensorforce网站 源代码: https://github.com/tensorforce/tensorforce网站 依赖项: TensorFlow公司 相关软件: TensorFlow公司;OpenAI健身房;PyTorch公司;github;皮子弹;稳定基线;多巴胺;蘑菇RL;地平线;安大略省;蟒蛇;RLlib语言;普纳戈奇;模仿;SLM实验室;TF-试剂;WaveRL公司;d3rlpy公司;稳定基线3;奥普图纳 引用于: 4文件 全部的 前5名20位作者引用 1 安德烈·博纳里尼 1 卡洛·德雷莫 1 诺亚·多尔曼 1 马克西米利安·厄内斯特斯 1 方文珍 1 哈桑·格拉伊布 1 亚当·格里夫 1 Elie Hachem 1 希尔,阿什利 1 安西·卡内维斯托 1 亚历山大·库内尔 1 奥雷连·拉彻 1 简·彼得斯 1 Jean Rabault 1 安东尼·拉芬 1 马塞洛·雷斯特利 1 大卫·塔泰奥 1 乔纳森·维克拉特 1 朱光浦 1 朱来来 3篇连载文章中引用 2 机器学习研究杂志(JMLR) 1 计算物理杂志 1 流体力学杂志 在3个字段中引用 三 计算机科学(68至XX) 2 流体力学(76-XX) 1 生物学和其他自然科学(92-XX) 按年份列出的引文