OpenAI健身房

OpenAI健身房。OpenAI Gym是一个用于强化学习研究的工具包。它包括越来越多的基准问题集合,这些问题暴露了一个公共接口,以及一个人们可以分享结果和比较算法性能的网站。本白皮书讨论了OpenAI Gym的组件和软件中的设计决策。


数学参考文献

显示第1到15个结果,共15个。
按年份排序(引用)

  1. 诺兰·巴德;福斯特,雅各布N.;钱达尔,萨拉斯;尼尔·伯克;兰科特,马克;宋,H.弗朗西斯;帕里索托,埃米利奥;杜穆林,文森特;莫特拉,苏波德;休斯,爱德华;邓宁,伊恩;穆拉德,希布尔;拉罗谢尔,雨果;贝尔马尔,马克G.;保龄球,迈克尔:哈纳比挑战:人工智能研究的新前沿(2020年)
  2. Christian D.Hubbs,Hector D.Perez,Owais Sarwar,Nikolaos V.Sahinidis,Ignacio E.Grossmann,John M.Wassick:或Gym:运筹学问题的强化学习库(2020)阿尔十四
  3. Ruehle,Fabian:数据科学在弦理论中的应用(2020)
  4. 詹姆斯哈尔弗森;纳尔逊,布伦特;鲁尔,费边:《大脑的膜:用深度强化学习探索弦真空》(2019)
  5. 帕里西,西蒙尼;唐卡拉特,沃特;彼得斯,扬;可汗,穆罕默德埃姆蒂亚兹:TD正规化演员批评方法(2019年)
  6. Sergey Kolesnikov,Oleksii Hrinchuk:Catalyst.RL:可再生RL研究的分布式框架(2019)阿尔十四
  7. Tristan Deleu,Tobias Würfl,Mandana Samiei,Joseph Paul Cohen,Yoshua Bengio:Torchmeta:Pythorch的元学习库(2019)阿尔十四
  8. 藤田安弘、Kataoka Toshiki、Prabhat Nagarajan、Takahiro Ishikawa:ChainerRL:深度强化学习图书馆(2019)阿尔十四
  9. Aggarwal,Charu C.:神经网络与深度学习。教科书(2018)
  10. Aqeel Labash;Ardi Tampuu;Tambet Matisen;Jaan Aru;Raul Vicente:APES:用于模拟强化学习环境的Python工具箱(2018)阿尔十四
  11. Hananel Hazan,Daniel J.Saunders,Hassaan Khan,Darpan T.Sanghavi,Hava T.Siegelmann,Robert Kozma:BindsNET:Python中面向机器学习的峰值神经网络库(2018)阿尔十四
  12. Michael Schaarschmidt,Sven Mika,Kai Fricke,Eiko Yoneki:RLgraph:深度强化学习的模块化计算图(2018)阿尔十四
  13. Ueltzhöffer,Kai:深度主动推理(2018)
  14. 胡志婷;史浩然;杨紫超;谭博文;赵天成;何俊贤;王文涛;余兴江;秦连辉;王迪;马学哲;刘海涛;梁晓丹;朱万荣;戴文德拉·辛格·萨坎;埃里克·P·邢:一个模块化、多功能、可扩展的文本生成工具包(2018)第十四章
  15. Eric Liang,Richard Liaw,Philipp Moritz,Robert Nishihara,Roy Fox,Ken Goldberg,Joseph E.Gonzalez,Michael I.Jordan,Ion Stoica:RLlib:分布式强化学习的抽象(2017)阿尔十四