跳到主要内容
文章

基于Landmark的启发式在线应急计划

出版:2018年9月1日出版历史
跳过抽象节

摘要

在应急计划问题中,代理拥有关于其状态的部分信息,并使用感知动作学习一些变量的值。当传感和驱动分离时,此类问题的计划通常可以被视为传感行动树,由一致性计划分离,一致性计划由无传感行动组成,这些行动能够执行下一个传感行动。我们提出了一种启发式的在线应急计划方法,重点是识别下一个有用的感知行动。我们根据经典规划改编的地标启发法选择下一个感知行动。我们讨论了平面图树的地标,提供了几个替代定义并讨论了它们的优点。我们的规划器的关键部分是新的基于地标的启发式方法,以及使用经典规划来解决中间一致规划问题的投影方法。由此产生的启发式应急计划器解决的问题比最先进的基于翻译的在线应急计划器要多得多,在大多数情况下,速度要快得多,在简单问题上速度高达3倍,在非简单域上速度快200倍。

工具书类

  1. Albore,A.、Palacios,H.和Geffner,H.(2009年)。基于翻译的应急计划方法。收录于:IJCAI,第1623-1628页。谷歌学者谷歌学者数字图书馆数字图书馆
  2. Bonet,B.和Geffner,H.(2000年)。基于不完全信息的规划作为信念空间中的启发式搜索。载于:AIPS’00会议记录,第52-61页。谷歌学者谷歌学者数字图书馆数字图书馆
  3. Bonet,B.和Geffner,H.(2011年)。经典重规划在部分可观测性下的规划:理论与实验。收录于:IJCAI,第1936至1941页。谷歌学者谷歌学者数字图书馆数字图书馆
  4. Brafman,R.I.和Shani,G.(2012年)。应急计划的多路径汇编方法。输入:AAAI。谷歌学者谷歌学者数字图书馆数字图书馆
  5. Brafman,R.I.和Shani,G.(2012年)。在具有部分信息和感知操作的域中重新规划。人工智能研究杂志(JAIR),45565---600。谷歌学者谷歌学者数字图书馆数字图书馆
  6. Brafman,R.I.和Shani,G.(2016)。基于回归的在线信念跟踪应急计划。人工智能,24131---152。谷歌学者谷歌学者数字图书馆数字图书馆
  7. Bryce,D.、Kambhampati,S.和Smith,D.E.(2006年)。用于信念空间搜索的规划图启发式算法。《人工智能研究杂志》,26,35--99。谷歌学者谷歌学者数字图书馆数字图书馆
  8. Heckerman,D.、Horvitz,E.和Middleton,B.(1993)。信息价值的近似非数学计算。IEEE模式分析和机器智能汇刊,15(3),292--298。谷歌学者谷歌学者数字图书馆数字图书馆
  9. Helmert,M.(2006)。快速向下规划系统。人工智能研究杂志,26191---246。谷歌学者谷歌学者数字图书馆数字图书馆
  10. Hoffmann,J.和Nebel,B.(2001年)。FF计划系统:通过启发式搜索快速生成计划。贾尔,14,253--302。谷歌学者谷歌学者交叉引用交叉引用
  11. Hoffmann,J.、Porteous,J.和Sebastia,L.(2004)。规划中的有序地标。人工智能研究杂志,22215--278。谷歌学者谷歌学者数字图书馆数字图书馆
  12. 霍华德·R·A(1960)。动态规划和马尔可夫过程。剑桥:麻省理工学院出版社。谷歌学者谷歌学者
  13. Karpas,E.和Domshlak,C.(2009年)。具有地标的最佳成本规划。In:IJCAI。谷歌学者谷歌学者数字图书馆数字图书馆
  14. Keyder,E.、Richter,S.和Helmert,M.(2010年)。健全完整的和/或图表地标。摘自:《欧洲人工智能会议论文集》,第335--340页。谷歌学者谷歌学者数字图书馆数字图书馆
  15. Komarnitsky,R.和Shani,G.(2016)。使用在线重新规划计算应急计划。摘自:《第三十届AAAI人工智能会议论文集》,2016年2月12日至17日,美国亚利桑那州凤凰城,第3159-3165页。谷歌学者谷歌学者数字图书馆数字图书馆
  16. Maliah,S.、Brafman,R.I.、Karpas,E.和Shani,G.(2014)。使用里程碑式启发式方法进行部分可观察的在线应急规划。2014年6月21日至26日,美国新罕布什尔州朴茨茅斯,ICAPS 2014,第二十四届国际自动规划与调度会议记录。谷歌学者谷歌学者数字图书馆数字图书馆
  17. Maliah,S.、Shani,G.和Brafman,R.I.(2016)。用于隐私保护规划的在线宏生成。摘自:《第二十六届国际自动规划与调度会议记录》,2016年6月12日至17日,英国伦敦,ICAPS 2016,第216页至第220页。谷歌学者谷歌学者数字图书馆数字图书馆
  18. Newton,M.A.H.(2009)。向导:全面学习宏观计划。斯特拉斯克莱德大学博士论文。谷歌学者谷歌学者
  19. Richter,S.和Westphal,M.(2010年)。LAMA规划师:用地标指导基于成本的任何时间规划。贾尔,39,127---177。谷歌学者谷歌学者数字图书馆数字图书馆
  20. Richter,S.和Westphal,M.(2010年)。喇嘛规划师:用地标指导任何时候基于成本的规划。《人工智能研究杂志》,39(1),127---177。谷歌学者谷歌学者数字图书馆数字图书馆
  21. Rintanen,J.、Heljanko,K.和Niemelä,I.(2006)。作为可满足性的计划:计划搜索的并行计划和算法。人工智能,170(12--13),1031--1080。谷歌学者谷歌学者数字图书馆数字图书馆
  22. Shani,G.和Brafman,R.I.(2011年)。在具有部分信息和感知操作的域中重新规划。收录于:IJCAI,第2021--2026页。谷歌学者谷歌学者数字图书馆数字图书馆
  23. Smith,T.和Simmons,R.(2004)。POMDP的启发式搜索值迭代。收入:UAI 2004。阿尔伯塔省班夫。谷歌学者谷歌学者数字图书馆数字图书馆
  24. Speck,D.、Ortlieb,M.和Mattmüller,R.(2015)。非确定性规划中的必要观察。收录于:《KI 2015:人工智能的进展——第38届德国人工智能年会》,2015年9月21日至25日,德国德累斯顿,《会议记录》,第181至193页。谷歌学者谷歌学者交叉引用交叉引用
  25. To,S.T.,Son,T.C.和Pontelli,E.(2015)。在信息不完整的情况下进行规划的通用方法:理论与实施。人工智能,227,1--51。谷歌学者谷歌学者数字图书馆数字图书馆
  26. To,S.T.,Pontelli,E.,&Son,T.C.(2009年)。具有明确的信念状态析取表示的一致规划器。包含:ICAPS。谷歌学者谷歌学者数字图书馆数字图书馆
  27. Zhu,L.和Givan,R.(2003)。通过规划图传播提取地标。载于:ICAPS 2003博士联合会,第156-160页。谷歌学者谷歌学者

建议

评论

登录选项

检查您是否可以通过登录凭据或您的机构访问本文。

登录

完全访问权限

  • 文章指标

    • 下载次数(过去12个月)0
    • 下载次数(最近6周)0

    其他指标