×

PILCO公司

swMATH ID: 34813
软件作者: M.Deisenroth;C.拉斯穆森
描述: PILCO:基于模型和数据效率的政策搜索方法。PILCO策略搜索框架(Matlab版本)。该软件包实现了PILCO RL策略搜索框架。该学习框架可应用于具有连续状态和控制/动作的MDP,并基于动力学的概率建模和用于策略评估和改进的近似贝叶斯推理。
主页: https://www.ias.informatik.tu-darmstadt.de/uploads/Publications/Deisenroth_ICML_2011.pdf
源代码:  https://github.com/ICL-SML/pilco-matlab
依赖项: Matlab公司
相关软件: OpenAI健身房;亚当;TensorFlow公司;G流量;GPyTorch公司;青蒿素;PyTorch公司;PMTK公司;日本宇宙航空公司;MNIST公司;SMAC公司;AlexNet公司;ImageNet公司;github;皮子弹;MuJoCo公司;波姆;张紧器2传感器;OSQP公司;OptNet公司
引用于: 39文件
全部的 前5名

127位作者引用

4 格哈德·诺伊曼
马克·彼得·戴森罗特(Marc Peter Deisenroth)
沃伦·狄克逊(Warren E.Dixon)。
拉西克什·卡马拉普卡尔
简·彼得斯
2 里亚德·阿克鲁
2 森本俊
1 A.Ruiken,德克
1 阿巴斯·阿卜杜勒马利基
1 阿卜杜拉·穆罕默德·阿明
1 哈尼·阿卜杜勒萨马德
1 伊恩·亚伯拉罕
1 亚历杭德罗·阿戈斯蒂尼
1 海萨姆·布·阿马尔
1 布兰登·D·阿莫斯。
1 Brenna D.Argall。
1 鲍亚杰
1 尼古拉·贝尔尼尼
1 米哈伊尔·贝萨
1 沙拉布·巴特纳加
1 凯萨琳娜·比克
1 博罗维茨基,维亚切斯拉夫A。
1 布泽利斯,乔治一世。
1 亚历山大·布罗德
1 乔斯特·布鲁肯斯
1 恩里克·塞拉亚
1 康斯坦蒂诺斯·查齐利格鲁迪斯
1 程丹松
1 卡米尔·乔塞克
1 亚历山大一世,科恩·里弗斯。
1 雷米·德尔马
1 帕特里克·德普图拉
1 悉达哈·德赛
1 达米安·恩斯特
1 面部畸形、贫血
1 毛里齐奥·法尔科内
1 保罗·费利克斯
1 科迪·H·弗莱明。
1 约翰内斯·范克兰兹
1 君士坦丁诺·加西亚。
1 爱德华多·C·加里多·梅尔坎。
1 克里斯蒂安·戈里克
1 金,亚瑟
1 埃里克·古堡
1 马克斯·格林。
1 约西亚·P·汉纳。
1 长谷川、田崎
1 Akinobu Hayashi
1 丹尼尔·埃尔南德斯·洛巴托
1 荷兰G.Zacharias
1 石原浩司
1 伊藤武史D。
1 哈桑·贾法扎德
1 Jonker,天主教M。
1 约瑟夫·阿金·乔治
1 托拜厄斯·荣格
1 哈雷什·卡南
1 乔治·科尼达利斯。
1 奥利弗·克雷默
1 K.S.Sesh Kumar
1 安德拉斯·库普西克
1 亚里士多德·拉扎里迪斯
1 刘嘉峰
1 马,童
1 马查多,马洛斯C。
1 马奇约夫斯基(Jan M.Maciejowski)。
1 梅斯·弗朗西斯
1 Guglielmo Manneschi
1 阿尔贝托·玛丽亚·梅特利
1 米利奇,伯伦
1 文森特·莫恩斯
1 托马斯·莫兰(Thomas M.Moerland)。
1 穆罕默德·维尔尼,贾瓦德
1 Syogo Mori
1 里卡多·莫里科尼
1 彼得·莫斯托夫斯基
1 Jean-Baptiste穆雷特
1 托德·默菲。
1 瑞安·莫里(Ryan W.Murray)。
1 斯科特·尼库姆
1 迈克尔·奥斯本。
1 亚伯拉罕·奥特罗
1 阿根内塞州帕西菲科
1 丹尼尔·帕勒尼斯克
1 米歇尔·帕拉迪诺
1 潘云鹏
1 苏普拉蒂克·保罗
1 塞巴斯蒂安·佩茨
1 罗曼·佩内克
1 安德烈亚·佩萨雷
1 艾莉森·皮诺斯基
1 阿斯克·普拉特
1 波罗艾
1 Presedo,Jesús M。
1 Sylvie推杆
1 马塞洛·雷斯特利
1 安娜丽莎·里卡迪
1 Rosenfeld,Joel A。
1 弗朗索瓦·西利昂。
1 艾瓦·索特拉
…还有27位作者

按年份列出的引文