• 杰森

  • 60篇参考文献[SW06187]
  • 使用杰森平台的系统;强化 学习举例,问题和插图,包括…
  • 近似的

  • 27篇参考文献[SW14312]
  • 若干近似的实现加固 学习(RL)和动态规划(DP)算法。尤其是。。。Schutter和D. Ernst加固 学习动态编程采用函数逼近器、CRC压力机、自动化…
  • R-最大值

  • 32篇参考文献[ SW02539 ]
  • 非常简单的基于模型的加固 学习能够获得接近最优平均报酬的算法…
  • 开爱体育馆

  • 13篇参考文献[SW15330]
  • OpenAI健身房是一个工具包加固 学习研究它包括一个不断增长的收藏…
  • 探索

  • 7篇参考文献[SW13721]
  • 时间差异加固 学习对于机器人和时间受限的领域,这本书介绍…发展新加固 学习使快速和鲁棒性的方法学习机器人在真实…他们没有被编程。加固 学习(RL)是一个范例。学习相继的。。。
  • RL胶

  • 8篇参考文献[SW13720]
  • 胶:语言独立的软件加固-学习实验RL胶是一种标准的、语言无关的…软件包加固-学习实验RL胶提供的标准化有助于代码共享…
  • 白脑

  • 9篇参考文献[SW12670]
  • 仍然强大的机器算法学习任务和各种预定义的环境来测试…PyBoin是基于Python的缩写加固 学习人工智能和神经网络库…
  • 塞克甘

  • 7篇参考文献[SW26534 ]
  • 作为随机策略的发电机加固 学习(RL),SeqGAN绕过发电机微分问题…
  • 多巴胺

  • 4篇参考文献[SW31 151]
  • 多巴胺:深部研究框架加固 学习. 深的加固 学习(深RL)研究…
  • RLILB

  • 4篇参考文献[SW31 153]
  • RLlib:可伸缩性加固 学习. RLILB是一个开源的库加固 学习提供…
  • 精灵

  • 4篇参考文献[SW26533 ]
  • 轻便灵活的基础平台加固 学习研究使用ELF,我们实现了一个高度…笔记本当与现代结合加固 学习方法,系统可以训练一个完整的游戏…
  • 皮尔

  • 2篇参考文献[SW29 437 ]
  • 整合符号规划与层级加固 学习用于稳健决策。加固 学习用于构建智能自治代理。加固 学习依赖于学习从互动与真实…将符号规划与层次结合起来加固 学习(HL)以应对决策…
  • RLPY

  • 2篇参考文献[SW14300 ]
  • RLPy:一种基于价值函数的方法加固 学习教育和研究框架。RLPy…面向对象的加固 学习软件包的重点是基于价值函数的方法使用…功能,促进最近的专业化加固 学习. RLPy是用Python写的…属性允许用户比较各种加固 学习费力费力的算法…
  • 激光测距仪

  • 2篇参考文献[SW31 155]
  • RLCGRAP:深度模块化计算图加固 学习.加固 学习(RL)任务是具有挑战性的…设计与执行图书馆加固 学习静态图和定义图中的任务…
  • 张紧力

  • 2篇参考文献[SW31 158]
  • Tensorforce:一个应用程序的TraceFROM库加固 学习. 张力源是开源的加固学习框架,重点是模块化的灵活的库设计和简单的可用性的应用程序…完整的张量流模型:整个加固 学习逻辑,包括控制流,实现…
  • 视界

  • 2篇参考文献[SW31 157]
  • 地平线:脸谱网的开源应用加固 学习平台在本文中,我们提出了地平线…脸谱网的开源应用加固 学习(RL)平台。地平线…展示和描述真实的例子加固 学习用地平线训练的模型显著优于…
  • RLILB

  • 2篇参考文献[SW11544 ]
  • 基于模板加固 学习图书馆:将代码拟合到数学。本文介绍了…数学之间的良好拟合加固 学习以及它们在图书馆中的实现…
  • L-振动

  • 3篇参考文献[SW02429 ]
  • 去年在线使用学习实现协调的方法吸引了…这项工作是用加固 学习工作中的方法学习
  • 1篇参考文献[SW2684]
  • APOS:一个用于模拟的Python工具箱加固 学习环境。神经网络辅助加固 学习任意要素加固 学习问题。环境模拟代理的动态…创建2D网格世界环境加固 学习问题。猿用算法装备代理。
  • 元类

  • 1篇参考文献[SW27 153]
  • Metacar:A加固 学习自驾车的环境在浏览器中。Metacar…加固 学习自主车辆在浏览器中运行的环境。该项目的目标是…加固 学习通过解决有趣的问题更容易接近每个人。Meta伴随着…