稳定基线 swMATH ID: 34408 软件作者: Hill,A.、Raffin,A.、Ernestus,M.、Gleave,A.、Traore,R.、Dhariwal,P.、Hesse,C.、Klimov,O.、Nichol,A.、Plappert,M.,Radford,A.、Schulman,J.、Sidor,S.、Wu,Y。 描述: 稳定基线是一组基于OpenAI基线的强化学习算法的改进实现。 主页: https://stable基线.readthedocs.io/en/master/ 源代码: https://github.com/hill-a/stable-baselines网站 相关软件: github;OpenAI健身房;TensorFlow公司;MuJoCo公司;皮子弹;RLlib(RL库);蟒蛇;亚当;CMA-ES公司;rlpyt公司;链条RL;PyTorch公司;阿尔法零;凯拉斯;QT-点;蘑菇RL;张力;催化剂。RL公司;多巴胺;Scikit公司 引用于: 19文件 全部的 前5名72位作者引用 三 马塞洛·雷斯特利 三 乔纳森·维克拉特 2 洛伦佐·比西 2 卡洛·德雷莫 2 Elie Hachem 2 奥雷连·拉彻 2 简·彼得斯 1 哈尼·阿卜杜勒萨马德 1 拉斐尔·阿迪托 1 皮埃尔·巴尔迪 1 鲍里斯·贝洛乌索夫 1 安德烈·博纳里尼 1 马西米利亚诺·博内蒂 1 贝扎德·博罗杰迪安 1 阿尔贝托·科里利亚诺 1 阿德里安·西萨里克 1 杰科波·玛丽亚·德·蓬蒂 1 悉达哈·德赛 1 诺亚·多尔曼 1 Dymitry V.迪洛夫。 1 马克西米利安·厄内斯特斯 1 格雷戈里·法夸尔 1 阿列克桑德拉·浮士德 1 Jakob N.Foerster。 1 威廉·傅 1 藤田康弘 1 保罗·卡尼尔 1 哈桑·格拉伊布 1 丹尼尔·吉伦。 1 亚当·格里夫 1 约西亚·P·汉纳。 1 拉尔斯·赫特尔 1 阿什利·希尔 1 卢卡·伊奥里奥 1 石川高弘 1 塞萨里·卡利西克 1 安西·卡内维斯托 1 哈雷什·卡南 1 Toshiki Kataoka 1 帕斯卡·克林克 1 斯利瓦桑·克里希南 1 德米特里·克里洛夫 1 亚历山大·库内尔 1 圣埃芬兰特里 1 李亮 1 菲利普·梅利加 1 米查勒夫斯基(Michalewski)、亨利克(Henryk) 1 洛伦佐·莫罗 1 Nagarajan,普拉巴特 1 乔尼·巴贾林恩 1 艾丽斯·帕帕雷利 1 恩里科·普拉蒂 1 邱、梁 1 Jean Rabault 1 安东尼·拉芬 1 拉希德、塔比什 1 维杰·贾纳帕·雷迪 1 卢卡·罗萨法尔科 1 米卡耶尔·萨姆维利安 1 费德里科·桑德雷利 1 戴维·桑坦布罗基奥 1 马蒂亚斯·施耐贝尔 1 克里斯蒂安·施罗德·德维特 1 达维德·塔特奥 1 安德烈亚·蒂林佐尼 1 约瑟夫·厄本 1 加勒特·沃内尔 1 西蒙·怀特森 1 薛光浩 1 赵莹 1 布莱恩·齐巴特。 1 佐姆博里(Zsolt Zombori) 全部的 前5名12篇连载文章中引用 5 机器学习研究杂志(JMLR) 2 人工智能 2 机器学习 1 计算机和流体 1 计算物理杂志 1 模拟中的数学和计算机 1 欧洲运筹学杂志 1 混乱 1 欧洲力学杂志。A.固体 1 量子信息处理 1 国际量子信息杂志 1 计算与图形统计杂志 全部的 前5名在8个字段中引用 12 计算机科学(68-XX) 2 流体力学(76-XX) 2 量子理论(81-XX) 2 生物学和其他自然科学(92-XX) 1 统计学(62-XX) 1 可变形固体力学(74-XX) 1 博弈论、经济学、金融和其他社会和行为科学(91-XX) 1 系统论;控制(93至XX) 按年份列出的引文