尼古拉斯·穆莱奥
人员信息
SPARQL查询
优化列表
2010 – 2019
2014 [i10] 尼古拉斯·穆莱奥 , 埃曼纽尔·贝纳泽拉 , 罗恩·布拉夫曼 , 埃里克·汉森 , 四季倾城 :
随机域中连续资源规划的启发式搜索方法。 CoRR公司 abs/1401.3428 ( 2014 ) [第九章] 列奥尼德·佩什金 , Kee-Eung Kim(金记) , 尼古拉斯·穆莱奥 , Leslie Pack Kaelbling公司 :
通过政策搜索学习合作。 CoRR公司 abs/1408.1484 ( 2014 ) 2013 [i8] 约翰·布雷西纳 , 理查德·迪尔登 , 尼古拉斯·穆莱奥 , 赛莱什·拉马克里希南 , 大卫·E·史密斯 , 理查德·华盛顿 :
持续时间和资源不确定性下的计划:人工智能面临的挑战。 CoRR公司 abs/1301.0559 ( 2013 ) [i7] 尼古拉斯·穆莱奥 , Kee-Eung Kim(金记) , Leslie Pack Kaelbling公司 , 安东尼·卡桑德拉 :
通过搜索有限策略空间求解POMDP。 CoRR公司 abs/1301.6720 ( 2013 ) [i6] 尼古拉斯·穆莱奥 , 列奥尼德·佩什金 , Kee-Eung Kim(金记) , Leslie Pack Kaelbling公司 :
学习部分可观测环境的有限状态控制器。 CoRR公司 abs/1301.6721 ( 2013 ) [i5] 米洛斯·奥斯克雷希特 , 尼古拉斯·穆莱奥 , Leslie Pack Kaelbling公司 , 托马斯·L·迪恩 , Craig Boutiler公司 :
使用宏操作的马尔可夫决策过程的层次解。 CoRR公司 abs/1301.7381 ( 2013 ) 2012 [i4] 郑竹峰 , 理查德·迪尔登 , 尼古拉斯·穆莱奥 , 理查德·华盛顿 :
结构化连续马尔可夫决策问题的动态规划。 CoRR公司 腹肌/1207.4115 ( 2012 ) [i3] 尼古拉斯·穆莱奥 , 大卫·E·史密斯 :
最优有限应急计划。 CoRR公司 abs/1212.2502 ( 2012 )
2000 – 2009
2009 [j5] 尼古拉斯·穆莱奥 , 埃曼纽尔·贝纳泽拉 , 罗恩·布拉夫曼 , 埃里克·汉森 , 四季倾城 :
随机域中连续资源规划的启发式搜索方法。 J.阿蒂夫。 智力。 物件。 34 : 27-59 ( 2009 ) [第17条] 尼古拉斯·穆莱奥 , 克里斯蒂安·普朗特 , 大卫·E·史密斯 , 特里斯坦·B·史密斯 :
受损飞机的紧急着陆计划员。 国际机场协会 2009 2007 [第16条] 尼古拉斯·穆莱奥 , 罗恩·布拉夫曼 :
随机域中的分层启发式前向搜索。 国际JCAI 2007 : 2542-2549 2006 [第15条] 尼古拉斯·穆莱奥 , 罗恩·布拉夫曼 , 埃曼纽尔·贝纳泽拉 :
使用MDP层次结构的随机超额订购计划。 ICAPS公司 2006 : 121-130 2005 [第14条] 四季倾城 , 埃曼纽尔·贝纳泽拉 , 罗恩·布拉夫曼 , 尼古拉斯·穆莱奥 , 埃里克·汉森 :
随机域中具有连续资源的规划。 国际JCAI 2005 : 1244-1251 2004 【j4】 马克·兹洛钦 , 毛罗·比拉塔里 , 尼古拉斯·穆莱奥 , 多里戈 :
基于模型的组合优化搜索:一项关键调查。 安·Oper。 物件。 131 ( 1-4 ) : 373-395 ( 2004 ) [第13条] 郑竹峰 , 理查德·迪尔登 , 尼古拉斯·穆莱奥 , 理查德·华盛顿 :
结构化连续马尔可夫决策问题的动态规划。 阿联酋 2004 : 154-161 2003 [第12条] 尼古拉斯·穆莱奥 , 大卫·E·史密斯 :
最优有限应急计划。 阿联酋 2003 : 417-426 2002 [j3] 尼古拉斯·穆莱奥 , 多里戈 :
蚁群优化和随机梯度下降。 Artif公司。 生活 8 ( 2 ) : 103-121 ( 2002 ) [第11条] 约翰·布雷西纳 , 理查德·迪尔登 , 尼古拉斯·穆莱奥 , 大卫·E·史密斯 , 理查德·华盛顿 :
持续时间和资源不确定性下的计划:人工智能面临的挑战。 AIPS时间域规划研讨会 2002 : 91-97 [c10] 多里戈 , 马克·兹洛钦 , 尼古拉斯·穆莱奥 , 毛罗·比拉塔里 :
使用随机梯度上升和交叉熵方法更新ACO信息素。 Evo研讨会 2002 : 21-30 【c9】 约翰·布雷西纳 , 理查德·迪尔登 , 尼古拉斯·穆莱奥 , 塞列什·拉马克里希南 , 大卫·E·史密斯 , 理查德·华盛顿 :
持续时间和资源不确定性下的计划:人工智能面临的挑战。 阿联酋 2002 : 77-84 2001 [注2] 马泰奥·戈尔法雷利 , 尼古拉斯·穆莱奥 :
部分可观测状态博弈模型及其最优性。 申请。 智力。 14 ( 三 ) : 273-284 ( 2001 ) [i2] 列奥尼德·佩什金 , 尼古拉斯·穆莱奥 , Leslie Pack Kaelbling公司 :
具有外部记忆的学习策略。 CoRR公司 反恐精英。 LG/0103003 ( 2001 ) [i1] 列奥尼德·佩什金 , Kee-Eung Kim(金记) , 尼古拉斯·穆莱奥 , Leslie Pack Kaelbling公司 :
通过政策搜索学习合作。 CoRR公司 反恐精英。 LG/015032号 ( 2001 ) 2000 【c8】 Kee-Eung Kim(金记) , 托马斯·L·迪恩 , 尼古拉斯·穆莱奥 :
有限状态控制器空间中基于贪婪搜索的因子化马尔可夫决策过程的近似解。 AIPS公司 2000 : 323-330 【c7】 列奥尼德·佩什金 , Kee-Eung Kim(金记) , 尼古拉斯·穆莱奥 , Leslie Pack Kaelbling公司 :
通过政策搜索学习合作。 阿联酋 2000 : 489-496
1990 – 1999
1999 [j1] 尼古拉斯·穆莱奥 , 保罗·鲍尔金 :
探索多国环境:当地措施和不确定性的反向传播。 机器。 学习。 35 ( 2 ) : 117-154 ( 1999 ) 【c6】 列奥尼德·佩什金 , 尼古拉斯·穆莱奥 , Leslie Pack Kaelbling公司 :
具有外部记忆的学习策略。 ICML公司 1999 : 307-314 【c5】 尼古拉斯·穆莱奥 , Kee-Eung Kim(金记) , Leslie Pack Kaelbling公司 , 安东尼·卡桑德拉 :
通过搜索有限策略空间求解POMDP。 阿联酋 1999 : 417-426 【c4】 尼古拉斯·穆莱奥 , 列奥尼德·佩什金 , Kee-Eung Kim(金记) , Leslie Pack Kaelbling公司 :
学习部分可观测环境的有限状态控制器。 阿联酋 1999 : 427-436 1998 【c3】 尼古拉斯·穆莱奥 , 米洛斯·奥斯克雷希特 , Kee-Eung Kim(金记) , 列奥尼德·佩什金 , Leslie Pack Kaelbling公司 , 托马斯·L·迪恩 , Craig Boutiler公司 :
求解超大型弱耦合马尔可夫决策过程。 AAAI/IAAI公司 1998 : 165-172 【c2】 米洛斯·奥斯克雷希特 , 尼古拉斯·穆莱奥 , Leslie Pack Kaelbling公司 , 托马斯·L·迪恩 , Craig Boutiler公司 :
使用宏操作的马尔可夫决策过程的层次解。 阿联酋 1998 : 220-229 1995 【c1】 尼古拉斯·穆莱奥 , 克劳德·拉托德 :
合作的人工进化。 人工进化 1995 : 159-180