PILCO公司 swMATH ID: 34813 软件作者: M.Deisenroth;C.拉斯穆森 描述: PILCO:基于模型和数据效率的政策搜索方法。PILCO策略搜索框架(Matlab版本)。该软件包实现了PILCO RL策略搜索框架。该学习框架可应用于具有连续状态和控制/动作的MDP,并基于动力学的概率建模和用于策略评估和改进的近似贝叶斯推理。 主页: https://www.ias.informatik.tu-darmstadt.de/uploads/Publications/Deisenroth_ICML_2011.pdf 源代码: https://github.com/ICL-SML/pilco-matlab 依赖项: Matlab公司 相关软件: OpenAI健身房;亚当;TensorFlow公司;github;G流量;GPy火炬;青蒿素;PyTorch公司;PMTK公司;日本宇宙航空公司;MNIST公司;SMAC公司;AlexNet公司;ImageNet公司;皮子弹;MuJoCo公司;VIME(可变利益实体);阿达格拉德;Autograd公司;张紧器2传感器 引用于: 39文件 全部的 前5名127位作者引用 4 格哈德·诺伊曼 三 马克·彼得·戴森罗特(Marc Peter Deisenroth) 三 沃伦·狄克逊(Warren E.Dixon)。 三 拉西克什·卡马拉普卡尔 三 简·彼得斯 2 里亚德·阿克鲁 2 森本俊 1 A.Ruiken,德克 1 阿巴斯·阿卜杜勒马利基 1 穆罕默德·阿明·阿卜杜拉 1 哈尼·阿卜杜勒萨马德 1 伊恩·亚伯拉罕 1 亚历杭德罗·阿戈斯蒂尼 1 海萨姆·布·阿马尔 1 布兰登·D·阿莫斯。 1 Brenna D.Argall。 1 鲍亚杰 1 尼古拉·贝尔尼尼 1 米哈伊尔·贝萨 1 沙拉布·巴特纳加 1 凯萨琳娜·比克 1 Borovitskiĭ,维亚切斯拉夫A。 1 布泽利斯,乔治一世。 1 亚历山大·布罗德 1 乔斯特·布鲁肯斯 1 恩里克·塞拉亚 1 康斯坦蒂诺斯·查齐利格鲁迪斯 1 程丹松 1 卡米尔·乔塞克 1 亚历山大一世,科恩·里弗斯。 1 雷米·德尔马 1 帕特里克·德普图拉 1 悉达哈·德赛 1 达米安·恩斯特 1 Fachantidis,阿涅斯蒂斯 1 毛里齐奥·法尔科内 1 保罗·费利克斯 1 科迪·H·弗莱明。 1 Fürnkranz,约翰内斯 1 君士坦丁诺·加西亚。 1 爱德华多·C·加里多·梅尔坎。 1 克里斯蒂安·戈里克 1 金,亚瑟 1 埃里克·古堡 1 马克斯·格林。 1 约西亚·P·汉纳。 1 长谷川、田崎 1 Akinobu Hayashi 1 埃尔南德斯·洛巴托,丹尼尔 1 荷兰G.Zacharias 1 石原浩司 1 伊藤武史D。 1 哈桑·贾法扎德 1 Jonker,天主教M。 1 约瑟夫·阿金·乔治 1 托拜厄斯·荣格 1 哈雷什·卡南 1 乔治·科尼达利斯。 1 奥利弗·克雷默 1 K.S.Sesh Kumar 1 安德拉斯·库普西克 1 拉扎里迪斯,亚里士多德 1 刘嘉峰 1 马,童 1 马洛斯·马查多。 1 Maciejowski,Jan M。 1 梅斯·弗朗西斯 1 Guglielmo Manneschi 1 阿尔贝托·玛丽亚·梅特利 1 米利奇,伯伦 1 文森特·莫恩斯 1 托马斯·莫兰(Thomas M.Moerland)。 1 贾瓦德·穆罕默德普·维尼 1 Syogo Mori 1 里卡多·莫里科尼 1 彼得·莫斯托夫斯基 1 让-巴蒂斯特·莫雷特 1 托德·默菲。 1 瑞安·莫里(Ryan W.Murray)。 1 斯科特·尼库姆 1 迈克尔·奥斯本。 1 亚伯拉罕·奥特罗 1 阿根内塞州帕西菲科 1 丹尼尔·帕勒尼斯克 1 米歇尔·帕拉迪诺 1 潘云鹏 1 苏普拉蒂克·保罗 1 塞巴斯蒂安·佩茨 1 罗曼·佩内克 1 安德烈亚·佩萨雷 1 艾莉森·皮诺斯基 1 阿斯克·普拉特 1 波罗艾 1 Presedo,Jesús M。 1 Sylvie推杆 1 马塞洛·雷斯特利 1 安娜丽莎·里卡迪 1 乔尔·罗森菲尔德。 1 弗朗索瓦·西利昂。 1 艾瓦·索特拉 …还有27位作者 全部的 前5名17篇连载文章中引用 7 机器学习研究杂志(JMLR) 4 Automatica公司 4 机器学习 三 人工智能 2 国际控制杂志 2 神经计算 2 国际应用数学与计算机科学杂志 2 机器学习的基础和趋势 1 计算物理杂志 1 数学心理学杂志 1 系统和控制信件 1 神经网络 1 国际自适应控制与信号处理杂志 1 SIAM科学计算杂志 1 人工智能研究杂志 1 优化与工程 1 优化信函 全部的 前5名11个领域引用 28 计算机科学(68至XX) 15 系统论;控制(93至XX) 10 运筹学、数学规划(90-XX) 8 统计学(62-XX) 5 变分法与最优控制;最优化(49至XX) 2 数值分析(65-XX) 2 粒子和系统力学(70-XX) 1 近似和展开(41至XX) 1 概率论与随机过程(60-XX) 1 博弈论、经济学、金融学以及其他社会和行为科学(91-XX) 1 信息与通信理论、电路(94-XX) 按年份列出的引文