×

使用经典规划器计算广义规划程序。 (英语) Zbl 1478.68333号

摘要:广义规划是生成单个解决方案(广义计划)这对多个规划实例有效。本文介绍了一种新的表示广义计划的形式,该形式借用了结构化编程的两种机制:控制流和过程调用。一方面,控制流结构允许紧凑地表示广义计划。另一方面,过程调用允许表示层次化和递归解决方案,以及重用现有的通用计划。本文还提出了一种从广义规划到经典规划的汇编方法,它允许我们使用非自助规划师计算广义规划。汇编可以将先前的知识以辅助程序的形式纳入,从而将该方法的适用性扩展到更具挑战性的任务。实验表明,使用我们的编译的经典规划器可以计算出解决各种广义规划任务的广义规划,包括可变大小的排序列表或遍历可变大小二叉树的DFS。此外,当泛化需要一个没有先验知识的高级状态表示时,本文对计算广义规划的编译进行了扩展。这种扩展为经典规划带来了新的基准景观,因为分类任务可以自然地建模为广义规划任务,因此,作为经典规划任务。最后,本文表明,该汇编可以扩展到计算现成规划者的控制知识,并解决在没有这些额外知识的情况下难以解决的规划实例。

MSC公司:

68T20型 人工智能背景下的问题解决(启发式、搜索策略等)
68T05型 人工智能中的学习和自适应系统
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 优胜者E。;Veloso,M.,《蒸馏:通过示例学习特定领域的规划师》,(机器学习国际会议(2003)),800-807
[2] 博内,B。;帕拉西奥斯,H。;Geffner,H.,行为控制有限状态机的自动推导,(AAAI人工智能会议(2010))
[3] 胡,Y。;Levesque,H.J.,一维规划问题推理的正确性结果,(国际人工智能联合会议(2011)),2638-2643
[4] Srivastava,S。;Immerman,N。;Zilberstein,S。;Zhang,T.,使用经典规划师直接搜索广义规划,(自动化规划与调度国际会议(2011)),226-233
[5] 胡,Y。;De Giacomo,G.,《合成有界有限状态控制器的通用技术》(自动化规划和调度国际会议(2013))
[6] Khardon,R.,《规划领域的学习行动策略》,Artif。智力。,113, 1, 125-148 (1999) ·Zbl 0943.68130号
[7] 马汀,M。;Geffner,H.,使用概念语言从规划示例中学习通用政策,应用。智力。,20, 9-19 (2004) ·Zbl 1078.68713号
[8] Baier,J.A。;弗里茨,C。;McIlraith,S.A.,《在最先进的规划师中利用程序域控制知识》(ICAPS(2007)),26-33
[9] Jiménez,S。;Jonsson,A.,使用经典规划器计算带有控制流和程序的计划,(第八届组合搜索年度研讨会论文集。第八届联合搜索年度研讨会文献集,SOCS-15(2015)),62-69
[10] 塞戈维亚·阿瓜斯,J。;Jiménez,S。;Jonsson,A.,《具有程序域控制知识的广义规划》(自动化规划和调度国际会议论文集(2016))
[11] Lotinac,D。;塞戈维亚,J。;Jiménez,S。;Jonsson,A.,《为广义规划自动生成高级状态特征》(国际人工智能联合会议(2016))
[12] Botea,A。;恩森伯格,M。;米勒,M。;Schaeffer,J.,《Macro-ff:使用自动学习的宏观操作员改进人工智能规划》,J.Artif。智力。决议,24581-621(2005)·Zbl 1080.68657号
[13] 科尔斯,A。;Smith Marvin,A.,在线宏观行动学习启发式搜索规划师,J.Artif。智力。决议,28,119-156(2007)·Zbl 1182.68231号
[14] Jonsson,A.,《宏在可处理规划中的作用》,J.Artif。智力。第471-511号决议(2009年)·Zbl 1185.68642号
[15] Yoon,S。;弗恩,A。;Givan,R.,《前向搜索规划的学习控制知识》,J.Mach。学习。第9683-718号决议(2008年)·Zbl 1225.68246号
[16] De la Rosa,T。;Jiménez,S。;Fuentetaja,R。;Borrajo,D.,用关系决策树扩展启发式规划,J.Artif。智力。研究,767-813(2011)·Zbl 1216.68242号
[17] Rintanen,J.,《作为可满足性的规划:启发式》,Artif。智力。J.,193,45-86(2012)·Zbl 1270.68276号
[18] 普拉特,C。;Verfaillie,G。;Lemaêtre,M。;Infantes,G.,非确定性和部分可观测领域中基于约束的控制器综合,(欧洲人工智能会议(2010)),681-686·Zbl 1211.93047号
[19] 福克斯,M。;Gerevini,A。;Long,D。;Serina,I.,《计划稳定性:重新规划与计划修复》(ICAPS,第6卷(2006)),212-221
[20] Borrajo博士。;罗比奇科娃,A。;Serina,I.,基于案例的规划进展,ACM Compute。调查。,47, 2, 35 (2015)
[21] Levesque,H.J。;Reiter,R。;Lespérance,Y。;林,F。;Scherl,R.B.,Golog:动态域的逻辑编程语言,J.Funct。逻辑程序。,31, 1-3, 59-83 (1997) ·Zbl 0880.68008号
[22] 萨迪纳,S。;德贾科莫,G。;Lespérance,Y。;Levesque,H.J.,《关于从理论到实施的语义学研究》,《数学年鉴》。Artif公司。智力。,41, 2-4, 259-299 (2004) ·Zbl 1048.68100号
[23] Röger,G。;赫尔默特,M。;Nebel,B.,《论adl和golog的相对表现力:拼图中的最后一块》(KR(2008))
[24] 克拉恩,J。;恩格曼,V。;Lakemeyer,G。;Röger,G.,《整合golog和规划:实证评估》(非单调推理研讨会(2008))
[25] 斯里瓦斯塔瓦,S。;Immerman,N。;Zilberstein,S.,广义规划的新表示和相关算法,Artif。智力。,175, 2, 615-647 (2011) ·Zbl 1216.68253号
[26] 阿尔博雷,A。;帕拉西奥斯,H。;Geffner,H.,《基于翻译的应急计划方法》(国际人工智能联合会议(2009))
[27] Boutiler,C。;Reiter,R。;Price,B.,一阶mdp的符号动态编程,(IJCAI,第1卷(2001)),690-700
[28] 格雷顿,C。;Thiébaux,S.,在归纳政策选择中利用一阶回归,(《第20届人工智能不确定性会议论文集》(2004),美国人工智能出版社),217-225
[29] Gulwani,S.,使用输入输出示例在电子表格中自动处理字符串,ACM SIGPLAN Not。,第46卷,317-330(2011),ACM·Zbl 1284.68700号
[30] Solar-Lezama,A。;Tancau,L。;博迪克,R。;塞希亚,S。;Saraswat,V.,有限程序的组合草图绘制,Oper。系统。修订版,40,404-415(2006)
[31] 莱克,B.M。;Salakhutdinov,R。;Tenenbaum,J.B.,《通过概率程序归纳法进行人类层面的概念学习》,《科学》,350,6266,1332-1338(2015)·兹比尔1355.68230
[32] Finkbeiner,B。;Schewe,S.,《有界合成》,国际期刊Softw。技术工具。变压器。,15, 5-6, 519-539 (2013)
[33] 巴克斯,F。;Kabanza,F.,《使用时序逻辑表达规划的搜索控制知识》,Artif。智力。,116, 1, 123-191 (2000) ·Zbl 0939.68827号
[34] 维洛索,M。;Carbonell,J。;佩雷斯,A。;Borrajo博士。;芬克,E。;Blythe,J.,《整合规划和学习:神童建筑》,J.Exp.Theor。Artif公司。智力。,7, 1, 81-120 (1995) ·兹伯利0939.68830
[35] Shivashankar,V。;库特,美国。;Nau,D。;Alford,R.,《单智能体规划的基于目标的层次化形式主义和算法》,(《第十一届自主智能体和多智能体系统国际会议论文集》,第2卷(2012年),国际自主智能体与多智能体系统基金会),981-988
[36] Nau,D.S。;金,T.-C。;O.伊尔加米。;库特,美国。;默多克,J.W。;Wu,D。;Yaman,F.,Shop2:HTN规划系统,J.Artif。智力。决议,20379-404(2003)·Zbl 1058.68106号
[37] Mitchell,T.M.,作为搜索的泛化,Artif。智力。,18, 2, 203-226 (1982)
[38] Muggleton,S.,归纳逻辑编程:在逻辑中学习语言的问题、结果和挑战,人工制品。智力。,114, 1, 283-296 (1999) ·Zbl 0939.68574号
[39] 帕拉西奥斯,H。;Geffner,H.,在有界宽度的一致规划问题中消除不确定性,J.Artif。智力。研究,35,623-675(2009)·兹比尔1183.68584
[40] 福克斯,M。;Long,D.,第二页。1:PDDL的扩展,用于表示时间规划领域,J.Artif。智力。决议,20,61-124(2003)·Zbl 1036.68093号
[41] 胡,Y。;De Giacomo,G.,《广义规划:综合适用于多种环境的计划》(国际人工智能联合会议(2011)),918-923
[42] 弗恩,A。;Khardon,R。;Tadepalli,P.,国际规划竞赛的第一个学习轨道,马赫。学习。,84, 1-2, 81-107 (2011)
[43] Jiménez,S。;德拉罗萨,T。;费尔南德斯,S。;Fernández,F。;Borrajo,D.,《自动化规划的机器学习综述》,Knowl。工程版次,27,04,433-467(2012)
[44] Bylander,T.,命题STRIPS规划的计算复杂性,Artif。智力。,69, 165-204 (1994) ·Zbl 0821.68065号
[45] Helmert,M.,《快速下行规划系统》,J.Artif。智力。第26号决议,191-246(2006)·Zbl 1182.68245号
[46] 里希特,S。;Westphal,M.,《LAMA规划师:用地标引导基于成本的随时规划》,J.Artif。智力。Res.,39,127-177(2010)·Zbl 1205.68383号
[47] 拉米雷斯,M。;利波维茨基,N。;Muise,C.,轻量级自动规划工具KiT(2015)
[48] Domshlak,C.,《容错规划:复杂性和编译》,(《第二十届国际自动化规划与调度会议论文集》,第二十届自动规划与调度国际会议论文集,ICAPS(2013))
[49] Shivashankar,V。;库特,美国。;Nau,D。;Alford,R.,《单智能体规划的基于目标的层次化形式主义和算法》,(《第十一届自主智能体和多智能体系统国际会议论文集》,第2卷(2012年),国际自主智能体与多智能体系统基金会),981-988
[50] 霍格,C。;Munoz-Avila,H。;Kuter,U.,HTN制造商:学习HTN,只需最少的额外知识工程,(AAAI(2008)),950-956
[51] 洛蒂纳克,D。;Jonsson,A.,使用不变性分析构建分层任务模型,(欧洲人工智能会议(2016))
[52] Marthi,B。;罗素,S。;Wolfe,J.,《高层行动的天使语义学》,(《第十七届国际自动化规划与调度会议论文集》,第十七届自动规划与调度国际会议论文集,ICAPS(2007)),232-239
[53] 阿尔福德,R。;库特,美国。;Nau,D.S.,《将HTN转换为PDDL:少量领域知识可以大有帮助》(国际人工智能联合会议(2009)),1629-1634
[54] 齐默尔曼,T。;Kambhampati,S.,《学习辅助的自动规划:回顾、总结、展望》,AI Mag.,24,2,73(2003)
[55] Bishop,C.M.,模式识别和机器学习(2006),Springer·Zbl 1107.68072号
[56] 克雷斯韦尔,S。;Coddington,A.M.,《将长期目标公式编译成PDDL》(ECAI(2004)),985-986
[57] 霍夫曼,J。;Edelkamp,S.,《ipc-4的确定性部分:概述》,J.Artif。智力。决议,519-579(2005)·Zbl 1080.68669号
[58] 蒂埃鲍克斯,S。;霍夫曼,J。;Nebel,B.,为捍卫PDDL公理,Artif。智力。,168, 1, 38-69 (2005) ·Zbl 1132.68714号
[59] 伊万科维奇,F。;Haslum,P.,《带公理的最优规划》,(国际人工智能联合会议(2015),AAAI出版社),1580-1586
[60] Chandra,A。;Merlin,P.,关系数据库中联合查询的优化实现,(第九届ACM计算理论年会论文集(1977))
[61] Michalski,R.S。;Carbonell,J.G。;Mitchell,T.M.,《机器学习:人工智能方法》(2013),Springer Science&Business Media
[62] Levesque,H.J.,《循环规划》(IJCAI(2005)),509-515
[63] Patrizi,F。;利波维茨基,N。;德贾科莫,G。;Geffner,H.,使用经典规划器计算ltl目标的无限计划,(第二十二届国际人工智能联合会议(2011年))
[64] Frances,G。;Geffner,H.,∃-条带:规划和约束满足中的存在量化,(IJCAI(2016)),3082-3088
[65] 弗恩,A。;Yoon,S.W。;Givan,R.,从随机行走中学习特定领域的控制知识,(ICAPS(2004)),191-199
[66] Fuentetaja,R。;Borrajo,D.,《通过主动学习改进计划的控制知识获取》,(机器学习:ECML 2006:第17届欧洲机器学习会议论文集。机器学习:ECM 2006:第十七届欧洲机器教育会议论文集,德国柏林,2006年9月18-22日(2006)),138-149
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。