PILCO公司 swMATH ID: 34813 软件作者: M.Deisenroth;C.拉斯穆森 描述: PILCO:基于模型和数据效率的政策搜索方法。PILCO策略搜索框架(Matlab版本)。该软件包实现了PILCO RL策略搜索框架。该学习框架可应用于具有连续状态和控制/动作的MDP,并基于动力学的概率建模和近似贝叶斯推理,用于策略评估和改进。 主页: https://www.ias.informatik.tu-darmstadt.de/uploads/Publications/Deisenroth_ICML_2011.pdf 源代码: https://github.com/ICL-SML/pilco-matlab 依赖项: Matlab公司 相关软件: G流量;GPy火炬;TensorFlow公司;亚当;OpenAI健身房;github;皮子弹;青蒿素;VIME(可变利益实体);MuJoCo公司;SQIL公司;SBEED公司;GPstuff公司;PyMC公司;通用公共管理语言;NumPyro编号;GPy公司;微型GP;高斯过程.jl;斯坦 引用于: 30份出版物 全部的 前5名98位作者引用 4 格哈德·诺伊曼 三 马克·彼得·戴森罗特(Marc Peter Deisenroth) 三 简·彼得斯 2 里亚德·阿克鲁 2 沃伦·狄克逊(Warren E.Dixon)。 2 拉西克什·卡马拉普卡尔 2 森本俊 1 A.Ruiken,德克 1 阿巴斯·阿卜杜勒马利基 1 穆罕默德·阿明·阿卜杜拉 1 哈尼·阿卜杜勒萨马德 1 伊恩·亚伯拉罕 1 亚历杭德罗·阿戈斯蒂尼 1 海萨姆·布·阿马尔 1 Brenna D.Argall。 1 沙拉布·巴特纳加 1 博罗维茨基,维亚切斯拉夫A。 1 布泽利斯,乔治一世。 1 亚历山大·布罗德 1 恩里克·塞拉亚 1 康斯坦蒂诺斯·查齐利格鲁迪斯 1 程丹松 1 卡米尔·乔塞克 1 亚历山大一世,科恩·里弗斯。 1 悉达哈·德赛 1 达米安·恩斯特 1 面部畸形、贫血 1 毛里齐奥·法尔科内 1 保罗·费利克斯 1 科迪·H·弗莱明。 1 约翰内斯·范克兰兹 1 君士坦丁诺·加西亚。 1 爱德华多·C·加里多·梅尔坎。 1 克里斯蒂安·戈里克 1 约西亚·P·汉纳。 1 长谷川、田崎 1 Akinobu Hayashi 1 丹尼尔·埃尔南德斯·洛巴托 1 石原浩司 1 伊藤武史D。 1 哈桑·贾法扎德 1 约瑟夫·阿金·乔治 1 托拜厄斯·荣格 1 哈雷什·卡南 1 乔治·科尼达利斯。 1 奥利弗·克雷默 1 K.S.Sesh Kumar 1 安德拉斯·库普西克 1 亚里士多德·拉扎里迪斯 1 刘嘉峰 1 马奇约夫斯基(Jan M.Maciejowski)。 1 梅斯·弗朗西斯 1 Guglielmo Manneschi 1 阿尔贝托·玛丽亚·梅特利 1 米利奇,伯伦 1 文森特·莫恩斯 1 Syogo Mori 1 里卡多·莫里科尼 1 彼得·莫斯托夫斯基 1 Jean-Baptiste穆雷特 1 托德·默菲。 1 瑞安·莫里(Ryan W.Murray)。 1 斯科特·尼库姆 1 迈克尔·奥斯本。 1 亚伯拉罕·奥特罗 1 阿根内塞州帕西菲科 1 丹尼尔·帕勒尼斯克 1 米歇尔·帕拉迪诺 1 潘云鹏 1 苏普拉蒂克·保罗 1 安德烈亚·佩萨雷 1 艾莉森·皮诺斯基 1 波罗艾 1 Presedo,Jesús M。 1 马塞洛·雷斯特利 1 乔尔·罗森菲尔德。 1 艾瓦·索特拉 1 杉山正树 1 唐祥龙 1 Voot Tangkaratt公司 1 亚历山大·特列宁 1 埃文格洛斯·塞奥多罗。 1 巴拉德·瓦达基帕特 1 赫尔克·范·霍夫 1 卡洛斯·维拉坎帕·卡尔沃 1 维拉哈瓦斯,伊奥安尼斯·P。 1 帕特里克·沃尔特斯 1 王军 1 加勒特·沃内尔 1 Louis A.Wehenkel。 1 西蒙·怀特森 1 詹姆斯·威尔逊。 1 克里斯蒂安·沃思 1 吴锐 1 杨晓科 1 布莱恩·扎尔迪瓦尔 1 赵东方 1 赵婷婷 全部的 前5名14篇连载文章中引用 7 机器学习研究杂志(JMLR) 4 机器学习 三 Automatica公司 2 人工智能 2 神经计算 2 国际应用数学与计算机科学杂志 1 计算物理杂志 1 数学心理学杂志 1 系统和控制信件 1 神经网络 1 国际自适应控制与信号处理杂志 1 SIAM科学计算杂志 1 人工智能研究杂志 1 优化信函 全部的 前5名11个领域引用 22 计算机科学(68至XX) 11 系统论;控制(93至XX) 7 统计学(62-XX) 7 运筹学、数学规划(90-XX) 5 变分法与最优控制;最优化(49至XX) 1 近似值和展开值(41至XX) 1 概率论与随机过程(60-XX) 1 数值分析(65-XX) 1 粒子和系统力学(70-XX) 1 博弈论、经济学、金融和其他社会和行为科学(91-XX) 1 信息与通信理论、电路(94-XX) 按年份列出的引文