×

PILCO公司

swMATH ID: 34813
软件作者: M.Deisenroth;C.拉斯穆森
描述: PILCO:基于模型和数据效率的政策搜索方法。PILCO策略搜索框架(Matlab版本)。该软件包实现了PILCO RL策略搜索框架。该学习框架可应用于具有连续状态和控制/动作的MDP,并基于动力学的概率建模和近似贝叶斯推理,用于策略评估和改进。
主页: https://www.ias.informatik.tu-darmstadt.de/uploads/Publications/Deisenroth_ICML_2011.pdf
源代码:  https://github.com/ICL-SML/pilco-matlab
依赖项: Matlab公司
相关软件: G流量;GPy火炬;TensorFlow公司;亚当;OpenAI健身房;github;皮子弹;青蒿素;VIME(可变利益实体);MuJoCo公司;SQIL公司;SBEED公司;GPstuff公司;PyMC公司;通用公共管理语言;NumPyro编号;GPy公司;微型GP;高斯过程.jl;斯坦
引用于: 30份出版物
全部的 前5名

98位作者引用

4 格哈德·诺伊曼
马克·彼得·戴森罗特(Marc Peter Deisenroth)
简·彼得斯
2 里亚德·阿克鲁
2 沃伦·狄克逊(Warren E.Dixon)。
2 拉西克什·卡马拉普卡尔
2 森本俊
1 A.Ruiken,德克
1 阿巴斯·阿卜杜勒马利基
1 穆罕默德·阿明·阿卜杜拉
1 哈尼·阿卜杜勒萨马德
1 伊恩·亚伯拉罕
1 亚历杭德罗·阿戈斯蒂尼
1 海萨姆·布·阿马尔
1 Brenna D.Argall。
1 沙拉布·巴特纳加
1 博罗维茨基,维亚切斯拉夫A。
1 布泽利斯,乔治一世。
1 亚历山大·布罗德
1 恩里克·塞拉亚
1 康斯坦蒂诺斯·查齐利格鲁迪斯
1 程丹松
1 卡米尔·乔塞克
1 亚历山大一世,科恩·里弗斯。
1 悉达哈·德赛
1 达米安·恩斯特
1 面部畸形、贫血
1 毛里齐奥·法尔科内
1 保罗·费利克斯
1 科迪·H·弗莱明。
1 约翰内斯·范克兰兹
1 君士坦丁诺·加西亚。
1 爱德华多·C·加里多·梅尔坎。
1 克里斯蒂安·戈里克
1 约西亚·P·汉纳。
1 长谷川、田崎
1 Akinobu Hayashi
1 丹尼尔·埃尔南德斯·洛巴托
1 石原浩司
1 伊藤武史D。
1 哈桑·贾法扎德
1 约瑟夫·阿金·乔治
1 托拜厄斯·荣格
1 哈雷什·卡南
1 乔治·科尼达利斯。
1 奥利弗·克雷默
1 K.S.Sesh Kumar
1 安德拉斯·库普西克
1 亚里士多德·拉扎里迪斯
1 刘嘉峰
1 马奇约夫斯基(Jan M.Maciejowski)。
1 梅斯·弗朗西斯
1 Guglielmo Manneschi
1 阿尔贝托·玛丽亚·梅特利
1 米利奇,伯伦
1 文森特·莫恩斯
1 Syogo Mori
1 里卡多·莫里科尼
1 彼得·莫斯托夫斯基
1 Jean-Baptiste穆雷特
1 托德·默菲。
1 瑞安·莫里(Ryan W.Murray)。
1 斯科特·尼库姆
1 迈克尔·奥斯本。
1 亚伯拉罕·奥特罗
1 阿根内塞州帕西菲科
1 丹尼尔·帕勒尼斯克
1 米歇尔·帕拉迪诺
1 潘云鹏
1 苏普拉蒂克·保罗
1 安德烈亚·佩萨雷
1 艾莉森·皮诺斯基
1 波罗艾
1 Presedo,Jesús M。
1 马塞洛·雷斯特利
1 乔尔·罗森菲尔德。
1 艾瓦·索特拉
1 杉山正树
1 唐祥龙
1 Voot Tangkaratt公司
1 亚历山大·特列宁
1 埃文格洛斯·塞奥多罗。
1 巴拉德·瓦达基帕特
1 赫尔克·范·霍夫
1 卡洛斯·维拉坎帕·卡尔沃
1 维拉哈瓦斯,伊奥安尼斯·P。
1 帕特里克·沃尔特斯
1 王军
1 加勒特·沃内尔
1 Louis A.Wehenkel。
1 西蒙·怀特森
1 詹姆斯·威尔逊。
1 克里斯蒂安·沃思
1 吴锐
1 杨晓科
1 布莱恩·扎尔迪瓦尔
1 赵东方
1 赵婷婷

按年份列出的引文