×

学习驱动的目标生成。 (英语) Zbl 1462.68176号

概要:自动规划处理推理过程,其中必须使用一些操作从初始状态实现一组目标。大多数规划工作都有一个静态的目标观;它们是在规划过程开始时给出的,不会随着规划和/或计划执行而改变。然而,在许多现实领域中,代理需要考虑动态目标管理。在本文中,我们建议通过学习近期目标何时出现来提高规划代理的性能。学习到的预测模型允许代理执行某种预期规划,其中规划过程不仅考虑当前目标,还考虑未来的预测目标。我们还研究了在哪些条件下,这种预期方法优于标准规划方法。最后,给出了支持我们假设的实验。

MSC公司:

68T20型 人工智能背景下的问题解决(启发式、搜索策略等)
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] M.Ai-Chang、J.Bresina、L.Charest、A.Chase、J.-J.Hsu、A.Jonsson、B.Kanefsky、P.Morris、K.Rajan、J.Yglesias、B.Chafin、W.Dias和P.Maldague,MAPGEN:火星探测车任务的混合初始规划和调度,IEEE智能系统19(1)(2004),8-12。doi:10.1109/MIS.2004.1265878。
[2] M.Behrisch、L.Bieker、J.Erdmann和D.Krajzewicz,Sumo–城市流动性模拟,摘自:第三届系统模拟进展国际会议(SIMUL 2011),西班牙巴塞罗那,2011年。
[3] H.Blockeel和L.De Raedt,一阶逻辑决策树的自顶向下归纳法,人工智能101(1)(1998),285-297。doi:10.1016/S0004-3702(98)00034-4·Zbl 0909.68034号
[4] B.Bonet和H.Geffner,《mGPT:基于启发式搜索的概率规划师》,JAIR24(12)(2005),933-944·Zbl 1080.68656号
[5] D.Borrajo、R.Fuentetaja和T.de la Rosa,《具有状态相关成本的部分满意度规划的预期搜索》,载于《第四届目标推理研讨会论文集》(IJCAI’16),2016年。
[6] E.Burns、J.Benton、W.Ruml、S.Yoon和M.B.Do,《预期在线规划》,收录于:ICAPS会议记录,2012年。
[7] I.Cenamor、S.Nuñez、T.de la Rosa和D.Borrajo,《利用社交网络规划旅游路线》,《应用专家系统》69(2017),1-9。doi:10.1016/j.eswa.2016.10.030。
[8] A.M.Coddington,《MADbot的动机:一个有动机和目标导向的机器人》,载于《英国规划与调度特别兴趣小组第25次研讨会论文集》(PlanSIG 2006),2006年,第39-46页。
[9] M.T.Cox,《永久自我认知代理》,AI杂志28(1)(2007),第32-46页。
[10] M.T.Cox,《目标驱动的自主性和基于问题的问题识别》,载于:2013年第二届认知系统进步年会,海报集,2013年,第29-45页。
[11] M.T.Cox、Z.Alavi、D.Dannenhauer、V.Eyorokon、H.MunozAvila和D.Perlis,Midca:自我调节自治的元认知、集成双循环架构,载于:第三十届AAAI人工智能会议,2016年。
[12] M.de la Asunción,L.A.Castillo,J.Fernández-Olivares,澳大利亚。加西亚·佩雷斯(García-Pérez)、a.G.Muñoz和F.Palao,《SIADEX:森林灭火决策支持的交互式知识规划师》,《人工智能通信》18(4)(2005),257-268。
[13] S.Duff、J.Harland和J.Thangarajah,《关于主动性和维护目标》,载于:《第五届自治代理和多代理系统国际联合会议记录》,ACM,2006年,第1033-1040页。
[14] M.Fox和D.Long,PDDL2.1:表达时间规划域的PDDL扩展,《人工智能研究杂志》20(2003),61-124·Zbl 1036.68093号
[15] J.García、J.E.Florez、a.Torralba、D.Borrajo、C.LinaresLópez、a.Garcí)a-Olaya和J.Sáenz,《将线性规划和自动化规划结合起来解决多式联运问题》,《欧洲运筹学杂志》227(1)(2013),216-226。doi:10.1016/j.jor.2012.12.018·Zbl 1292.90048号
[16] M.Ghallab、D.Nau和P.Traverso,《自动化规划》。《理论与实践》,摩根·考夫曼,2004年·兹比尔1074.68613
[17] S.Gopalakrishnan、H.M.Avila和U.Kuter,Word2htn:使用统计语义和目标推理学习任务层次,收录于:《第四届目标推理研讨会论文集》(IJCAI’16),2016年。
[18] C.Guzmán、V.Alcázar、D.Prior、E.Onaindía、D.Borrajo、J.Fdez-Olivares和E.Quintero,《PELEA:规划、执行和学习的独立于域的架构》,载于《ICAPS’12计划和规划应用程序汇编》(SPARK),AAAI出版社,阿提巴亚(巴西),2012年,第38-45页。
[19] U.Jaidee,《目标驱动自主的综合学习》,里海大学硕士论文,2013年。
[20] M.Klenk、M.Molineaux和D.W.Aha,战略模拟中应对意外事件的目标驱动自主,计算智能29(2)(2013),187-206。doi:10.1111/j.1467-8640.2012.00445.x。
[21] M.Maynord、M.T.Cox、M.Paisner和D.Perlis,集成认知系统的数据驱动目标生成,摘自:2013年AAAI秋季研讨会系列,2013年。
[22] M.Molineaux和D.W.Aha,《学习未知事件模型》,载于:《第二十届AAAI人工智能会议论文集》,第27-31卷,AAAI出版社,加拿大魁北克省魁北克市,2014年,第395-401页,2014年。
[23] M.Paisner、M.T.Cox、M.Maynord和D.Perlis,《认知系统的目标驱动自主性》,载于:CogSci,2014年。
[24] A.Pokahr、W.Braubach和W.Lamersdorf,为JADE代理实施BDI基础设施,见:Exp in Search of Innovation,第3卷,2003年。
[25] J.Powell、M.Molineaux和D.W.Aha,《目标选择知识的主动和交互式发现》,载于:第二十四届国际佛罗里达人工智能研究会会议记录,2011年5月18日至20日,美国佛罗里达州棕榈滩,AAAI出版社,2011年。
[26] A.Pozanco、S.Fernández和D.Borrajo,《交通控制学习规划目标》,载于《第四届目标推理研讨会论文集》(IJCAI’16),2016年。
[27] J.R.Quinlan,从关系中学习逻辑定义,机器学习5(3)(1990),239-266。
[28] W.Ruml、M.B.Do、R.Zhou和M.P.J.Fromherz,《在线计划和调度:控制模块化打印机的应用》,《人工智能研究杂志》40(2011),第415-468页。
[29] K.Talamadupula、J.Benton、S.Kambhampati、P.Schermerhorn和M.Scheutz,《开放世界中的人机合作规划》,《ACM智能系统与技术交易》(TIST)1(2)(2010),14。
[30] M.B.Van Riemsdijk、M.Dastani和M.Winikoff,《代理系统中的目标:统一框架》,载于:《第七届自治代理和多代理系统国际联合会议论文集》,第2卷,2008年,第713-720页。
[31] S.Vattam、M.Klenk、M.Molineaux和D.W.Aha,《目标推理方法的广度:研究调查》,收录于:《目标推理:ACS研讨会论文》,医学博士,2013年。
[32] B.G.Weber、M.Mateas和A.Jhala,《从演示中学习目标驱动的自主性》,载于《第二十六届AAAI人工智能会议论文集》,加拿大安大略省多伦多,2012年7月22日至26日,AAAI出版社,2012年。
[33] G.Widmer和M.Kubat,《概念漂移和隐藏背景下的学习》,《机器学习》23(1)(1996),69-101。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。