文章

基于Landmark的启发式在线应急计划

作者：
什洛米·玛丽亚

以色列Beer-Sheva内盖夫本古里安大学信息系统工程

以色列Beer Sheva内盖夫本古里安大学信息系统工程
查看个人资料

,
盖伊·沙尼

以色列Beer-Sheva内盖夫本古里安大学信息系统工程

以色列Beer-Sheva内盖夫本古里安大学信息系统工程
查看个人资料

,
罗恩·布拉夫曼

以色列内盖夫本古里安大学计算机科学系

以色列内盖夫本古里安大学计算机科学系
查看个人资料

自治代理和多代理系统第32卷第5期2018年9月第602-634页https://doi.org/10.1007/s10458-018-9389-9

出版：2018年9月1日出版历史

自治代理和多代理系统

摘要

在应急计划问题中，代理拥有关于其状态的部分信息，并使用感知动作学习一些变量的值。当传感和驱动分离时，此类问题的计划通常可以被视为传感行动树，由一致性计划分离，一致性计划由无传感行动组成，这些行动能够执行下一个传感行动。我们提出了一种启发式的在线应急计划方法，重点是识别下一个有用的感知行动。我们根据经典规划改编的地标启发法选择下一个感知行动。我们讨论了平面图树的地标，提供了几个替代定义并讨论了它们的优点。我们的规划器的关键部分是新的基于地标的启发式方法，以及使用经典规划来解决中间一致规划问题的投影方法。由此产生的启发式应急计划器解决的问题比最先进的基于翻译的在线应急计划器要多得多，在大多数情况下，速度要快得多，在简单问题上速度高达3倍，在非简单域上速度快200倍。

工具书类

Albore，A.、Palacios，H.和Geffner，H.（2009年）。基于翻译的应急计划方法。收录于：IJCAI，第1623-1628页。谷歌学者数字图书馆
Bonet，B.和Geffner，H.（2000年）。基于不完全信息的规划作为信念空间中的启发式搜索。载于：AIPS’00会议记录，第52-61页。谷歌学者数字图书馆
Bonet，B.和Geffner，H.（2011年）。经典重规划在部分可观测性下的规划：理论与实验。收录于：IJCAI，第1936至1941页。谷歌学者数字图书馆
Brafman，R.I.和Shani，G.（2012年）。应急计划的多路径汇编方法。输入：AAAI。谷歌学者数字图书馆
Brafman，R.I.和Shani，G.（2012年）。在具有部分信息和感知操作的域中重新规划。人工智能研究杂志（JAIR），45565---600。谷歌学者数字图书馆
Brafman，R.I.和Shani，G.（2016）。基于回归的在线信念跟踪应急计划。人工智能，24131---152。谷歌学者数字图书馆
Bryce，D.、Kambhampati，S.和Smith，D.E.（2006年）。用于信念空间搜索的规划图启发式算法。《人工智能研究杂志》，26，35--99。谷歌学者数字图书馆
Heckerman，D.、Horvitz，E.和Middleton，B.（1993）。信息价值的近似非数学计算。IEEE模式分析和机器智能汇刊，15（3），292--298。谷歌学者数字图书馆
Helmert，M.（2006）。快速向下规划系统。人工智能研究杂志，26191---246。谷歌学者数字图书馆
Hoffmann，J.和Nebel，B.（2001年）。FF计划系统：通过启发式搜索快速生成计划。贾尔，14，253--302。谷歌学者交叉引用
Hoffmann，J.、Porteous，J.和Sebastia，L.（2004）。规划中的有序地标。人工智能研究杂志，22215--278。谷歌学者数字图书馆
霍华德·R·A（1960）。动态规划和马尔可夫过程。剑桥：麻省理工学院出版社。谷歌学者
Karpas，E.和Domshlak，C.（2009年）。具有地标的最佳成本规划。In:IJCAI。谷歌学者数字图书馆
Keyder，E.、Richter，S.和Helmert，M.（2010年）。健全完整的和/或图表地标。摘自：《欧洲人工智能会议论文集》，第335--340页。谷歌学者数字图书馆
Komarnitsky，R.和Shani，G.（2016）。使用在线重新规划计算应急计划。摘自：《第三十届AAAI人工智能会议论文集》，2016年2月12日至17日，美国亚利桑那州凤凰城，第3159-3165页。谷歌学者数字图书馆
Maliah，S.、Brafman，R.I.、Karpas，E.和Shani，G.（2014）。使用里程碑式启发式方法进行部分可观察的在线应急规划。2014年6月21日至26日，美国新罕布什尔州朴茨茅斯，ICAPS 2014，第二十四届国际自动规划与调度会议记录。谷歌学者数字图书馆
Maliah，S.、Shani，G.和Brafman，R.I.（2016）。用于隐私保护规划的在线宏生成。摘自：《第二十六届国际自动规划与调度会议记录》，2016年6月12日至17日，英国伦敦，ICAPS 2016，第216页至第220页。谷歌学者数字图书馆
Newton，M.A.H.（2009）。向导：全面学习宏观计划。斯特拉斯克莱德大学博士论文。谷歌学者
Richter，S.和Westphal，M.（2010年）。LAMA规划师：用地标指导基于成本的任何时间规划。贾尔，39，127---177。谷歌学者数字图书馆
Richter，S.和Westphal，M.（2010年）。喇嘛规划师：用地标指导任何时候基于成本的规划。《人工智能研究杂志》，39（1），127---177。谷歌学者数字图书馆
Rintanen，J.、Heljanko，K.和Niemelä，I.（2006）。作为可满足性的计划：计划搜索的并行计划和算法。人工智能，170（12--13），1031--1080。谷歌学者数字图书馆
Shani，G.和Brafman，R.I.（2011年）。在具有部分信息和感知操作的域中重新规划。收录于：IJCAI，第2021--2026页。谷歌学者数字图书馆
Smith，T.和Simmons，R.（2004）。POMDP的启发式搜索值迭代。收入：UAI 2004。阿尔伯塔省班夫。谷歌学者数字图书馆
Speck，D.、Ortlieb，M.和Mattmüller，R.（2015）。非确定性规划中的必要观察。收录于：《KI 2015：人工智能的进展——第38届德国人工智能年会》，2015年9月21日至25日，德国德累斯顿，《会议记录》，第181至193页。谷歌学者交叉引用
To，S.T.，Son，T.C.和Pontelli，E.（2015）。在信息不完整的情况下进行规划的通用方法：理论与实施。人工智能，227，1--51。谷歌学者数字图书馆
To，S.T.，Pontelli，E.，&Son，T.C.（2009年）。具有明确的信念状态析取表示的一致规划器。包含：ICAPS。谷歌学者数字图书馆
Zhu，L.和Givan，R.（2003）。通过规划图传播提取地标。载于：ICAPS 2003博士联合会，第156-160页。谷歌学者

建议

使用在线计划计算应急计划图
在具有感知动作的部分可观察性的偶然规划中，主体积极利用感知来发现关于世界的有意义的事实。最近成功的方法将部分可观测的偶然性问题转化为不确定性问题。。。
阅读更多信息
确定性部分可观测权变规划中不可避免的死胡同
摘要
传统上，根据代理人在计划执行过程中获得的观察结果进行分支的应急计划必须从每个可能的初始状态达到目标状态。然而，在许多现实问题中，并不存在这样的计划。然而，有计划。。。
阅读更多信息
部分可观测应急计划的比较标准
AAMAS’19：第18届自治代理和多代理系统国际会议记录

在具有感知行为的部分可观测条件下的应急计划中，解决方案可以表示为计划树，在各种可能的观测上分支。通常，人们会寻求一个令人满意的计划，从而在每个叶上实现目标状态。在许多。。。
阅读更多信息

登录选项

检查您是否可以通过登录凭据或您的机构访问本文。

完全访问权限

获取此文章

其他指标
查看文章指标

文章指标
- 0
  引文总数
  查看引文
- 0
  总下载次数
- 下载次数（过去12个月）0
- 下载次数（最近6周）0
其他指标
查看作者指标
引用人
本出版物尚未被引用

基于Landmark的启发式在线应急计划

自治代理和多代理系统

摘要

工具书类

引用人

建议

使用在线计划计算应急计划图

确定性部分可观测权变规划中不可避免的死胡同

部分可观测应急计划的比较标准

评论

登录选项

完全访问权限

发布于

赞助商

合作中

出版商

出版历史

作者标记

限定符

会议

资金来源

其他指标

文章指标

其他指标

引用人

数字版

解说词

基于Landmark的启发式在线应急计划

自治代理和多代理系统

摘要

工具书类

引用人

建议

使用在线计划计算应急计划图

确定性部分可观测权变规划中不可避免的死胡同

部分可观测应急计划的比较标准

评论

登录选项

完全访问权限

发布于

赞助商

合作中

出版商

出版历史

作者标记

限定符

会议

资金来源

文章指标

其他指标

数字版

共享此出版物链接

在社交媒体上分享