×

皮尔科

swMATH标识: 34813
软件作者: M、 戴森罗斯;C、 拉斯穆森
说明: PILCO:一种基于模型和数据有效的策略搜索方法。PILCO策略搜索框架(Matlab版本)。该软件包实现了PILCO-RL策略搜索框架。该学习框架可以应用于具有连续状态和控制/动作的mdp,它基于动态的概率建模和用于策略评估和改进的近似贝叶斯推理。
主页: https://www.ias.informatik.tu-darmstadt.de/uploads/Publications/Deisenroth_ICML_2011.pdf
源代码: https://github.com/ICL-SML/pilco-matlab
依赖项: Matlab语言
相关软件: G流量;GPyTorch公司;张量流;亚当;OpenAI健身房;github;皮子弹;留兰香;维姆;穆乔科;GPstuff公司;PyMC公司;加仑/加仑;纽皮罗;GPy公司;叮咬;高斯过程.jl;斯坦;塞诺;布莱克贾克斯
引用于: 29种出版物
全部的 前5名

被95位作者引用

4 纽曼,格哈德
戴森罗斯,马克·彼得
彼得斯,简
2 阿克鲁尔,里亚德
2 狄克逊,沃伦E。
2 Kamalapurkar,拉什凯什
2 森本俊
1 A、 瑞肯,德克
1 Abdolmaleki,阿巴斯
1 阿卜杜拉,穆罕默德·阿明
1 哈尼·阿卜杜勒萨马德
1 亚伯拉罕,伊恩
1 阿戈斯蒂尼,亚历杭德罗
1 阿马尔,海瑟姆·布
1 阿戈尔,布伦娜D。
1 巴塔纳加尔,沙拉布
1 博罗维茨基,维亚切斯拉夫
1 布茨利斯,乔治一世。
1 博德,亚历山大
1 塞拉亚,恩里克
1 康斯坦丁诺斯查茨利格鲁迪斯
1 程丹松
1 科塞克,卡米尔
1 考恩·里弗斯,亚历山大一世。
1 德赛,西德哈斯
1 恩斯特,达米安
1 纤溶酶,麻醉剂
1 法尔科内,毛里齐奥
1 费利克斯,保罗
1 弗莱明,科迪H。
1 Fürnkranz,约翰内斯
1 加西亚,康斯坦丁诺。
1 Garrido Merchán,Eduardo C。
1 戈瑞克,克里斯蒂安
1 汉娜,约西亚P。
1 长谷川,Tadaaki
1 秋野林
1 赫尔南德斯·洛巴托,丹尼尔
1 石原,古井
1 伊藤,武史。
1 哈桑·贾法尔扎德
1 约瑟夫,阿金·乔治
1 荣格,托比亚斯
1 卡南,哈雷什
1 科尼达利斯,乔治D。
1 克鲁默,奥利弗
1 库马尔,K.S.塞什
1 库普西克,安得拉斯
1 拉扎里迪斯,亚里士多德
1 刘佳峰
1 马西约夫斯基,简·M。
1 梅斯,弗朗西斯
1 米里奇,贝伦
1 莫恩斯,文森特
1 森喜郎
1 莫里康尼,里卡多
1 莫斯托夫斯基,彼得
1 莫雷特,让-巴蒂斯特
1 莫菲,托德D。
1 默里,瑞安W。
1 尼库姆,斯科特
1 奥斯本,迈克尔A。
1 亚伯拉罕奥特罗
1 帕西菲科,阿格内塞
1 丹尼尔,帕莱尼克
1 帕拉迪诺,米歇尔
1 潘云鹏
1 保罗,上提克
1 佩萨雷,安德里亚
1 皮诺斯基,艾莉森
1 啊,洛艾
1 普雷塞多,杰斯·M。
1 罗森菲尔德,乔尔A。
1 索特拉,艾瓦
1 杉山,Masashi
1 唐祥龙
1 唐卡拉特,沃特
1 泰宁,亚历山大
1 西奥多,埃文盖洛斯A。
1 瓦达克帕特,普拉拉德
1 范霍夫,赫克
1 卡洛斯,维拉坎帕·卡尔沃
1 弗拉哈瓦,约安尼斯P。
1 沃尔特斯,帕特里克
1 王俊
1 沃内尔,加勒特
1 韦汉克尔,路易A。
1 怀特森,西蒙
1 威尔逊,詹姆斯T。
1 沃思,克里斯蒂安
1 吴,芮
1 杨小可
1 扎尔迪瓦尔,布莱恩
1 赵,东方
1 赵婷婷

按年份列出的引文