稳定基线 swMATH ID: 34408 软件作者: Hill,A.、Raffin,A.、Ernestus,M.、Gleave,A.、Traore,R.、Dhariwal,P.、Hesse,C.、Klimov,O.、Nichol,A.、Plappert,M.,Radford,A.、Schulman,J.、Sidor,S.、Wu,Y。 描述: 稳定基线是一组基于OpenAI基线的强化学习算法的改进实现。 主页: https://stable-baselines.readthedocs.io/en/master/ 源代码: https://github.com/hill-a/stable-baselines网站 相关软件: github;OpenAI健身房;MuJoCo公司;TensorFlow公司;CMA-ES公司;RLlib(RL库);rlpyt公司;链条RL;PyTorch公司;蘑菇RL;张力;蟒蛇;QT-点;阿尔法零;催化剂RL;多巴胺;亚当;凯拉斯;皮子弹;Scikit公司 引用于: 15出版物 全部的 前5名60位作者引用 三 乔纳森·维克拉特 2 卡洛·德雷莫 2 Elie Hachem 2 奥雷连·拉彻 2 简·彼得斯 1 哈尼·阿卜杜勒萨马德 1 皮埃尔·巴尔迪 1 鲍里斯·贝卢索夫 1 安德烈·博纳里尼 1 贝扎德·博罗杰迪安 1 阿德里安·西萨里克 1 悉达哈·德赛 1 诺亚·多尔曼 1 Dymitry V.迪洛夫。 1 马克西米利安·厄内斯特斯 1 格雷戈里·法夸尔 1 阿列克桑德拉·浮士德 1 Jakob N.Foerster。 1 威廉·傅 1 藤田康弘 1 保罗·卡尼尔 1 哈桑·格拉伊布 1 丹尼尔·吉伦。 1 亚当·格里夫 1 约西亚·P·汉纳。 1 拉尔斯·赫特尔 1 阿什利·希尔 1 石川高弘 1 塞萨里·卡利西克 1 安西·卡内维斯托 1 哈雷什·卡南 1 Toshiki Kataoka 1 帕斯卡·克林克 1 斯利瓦桑·克里希南 1 德米特里·克里洛夫 1 亚历山大·库内尔 1 圣埃芬兰特里 1 李亮(Li,Liang) 1 菲利普·梅利加 1 米查勒夫斯基(Michalewski)、亨利克(Henryk) 1 洛伦佐·莫罗 1 普拉巴特·纳加拉扬 1 乔尼·巴贾林恩 1 艾丽斯·帕帕雷利 1 恩里科·普拉蒂 1 Jean Rabault 1 安东尼·拉芬 1 拉希德、塔比什 1 维杰·贾纳帕·雷迪 1 马塞洛·雷斯特利 1 迈克尔·罗森布鲁姆(Michael G.Rosenblum)。 1 米卡耶尔·萨姆维利安 1 马蒂亚斯·施耐贝尔 1 克里斯蒂安·施罗德·德维特 1 达维德·塔特奥 1 约瑟夫·乌尔班 1 加勒特·沃内尔 1 西蒙·怀特森 1 赵莹 1 佐姆博里(Zsolt Zombori) 全部的 前5名9篇连载文章中引用 5 机器学习研究杂志(JMLR) 2 机器学习 1 计算机和流体 1 计算物理杂志 1 模拟中的数学和计算机 1 欧洲运筹学杂志 1 混乱 1 国际量子信息杂志 1 计算与图形统计杂志 全部的 前5名在7个字段中引用 10 计算机科学(68至XX) 2 流体力学(76-XX) 2 生物学和其他自然科学(92-XX) 1 统计学(62-XX) 1 量子理论(81-XX) 1 博弈论、经济学、金融和其他社会和行为科学(91-XX) 1 系统论;控制(93至XX) 按年份列出的引文