研究论文

使用在线计划计算应急计划图

作者:

什洛米玛丽亚,

拉迪米尔科马尼茨基,

家伙沙尼作者信息和声明

ACM自主与自适应系统汇刊（TAAS）,体积16,问题1

文章编号：1，页数1-30

https://doi.org/10.1145/3488903

出版:2022年1月23日出版历史

获取访问权限

摘要

在具有感知行为的部分可观测条件下的应急计划中，智能体积极使用感知来发现关于世界的有意义的事实。最近成功的方法将部分可观测或有问题转化为非确定性完全可观测问题，然后使用规划器进行非确定性规划。然而，翻译可能会变得非常大，阻碍了非确定性规划师的任务。我们建议采用不同的方法，反复使用在线权变求解器来构建计划树。我们执行在线解算器返回的计划，直到下一个观测操作，然后对可能的观测值进行分支，并独立地重新规划每个分支。在许多情况下，计划树的状态变量数可以是指数宽度，但该树的结构允许我们使用有向图紧凑地表示它。我们建议一种机制来裁剪这样的图，从而减少计算工作量和存储空间。我们的方法还通过识别计划中的周期来处理非确定性领域。我们提供了一组实验，展示了我们比最先进的线下规划师更好地扩展规模的方法。

工具书类

[1]

亚历山大·阿尔博尔（Alexandre Albore）、赫克托·帕拉西奥斯（Héctor Palacios）和赫克托尔·盖夫纳（Hector Geffner）。2009年，基于翻译的应急计划方法。在国际JCAI会议记录. 1623–1628.

数字图书馆

[2]

P.Bertoli、A.Cimatti、M.Pistore、M.Roveri和P.Traverso。2001.MBP：基于模型的规划师。在IJCAI'01不确定性和不完全信息下的规划研讨会会议记录西雅图。

[3]

Avrim L.Blum和Merrick L.Furst。1997年。通过规划图分析快速规划。人工智能90, 1–2 (1997), 281–300.

数字图书馆

[4]

Blai Bonet和Hector Geffner。2001年。GPT：一种利用不确定性和部分信息进行规划的工具。在IJCAI-01不确定性和部分信息规划研讨会会议记录Citeser，82–87。

[5]

Blai Bonet和Hector Geffner。2011.经典重新规划在部分可观测性下的规划：理论和实验。在2011年7月16日至22日，西班牙加泰罗尼亚巴塞罗那第22届国际人工智能联合会议记录. 1936–1941.

数字图书馆

[6]

Blai Bonet和Hector Geffner。2014.感知规划的信念跟踪：宽度、复杂性和近似值。人工智能研究杂志50 (2014), 923–970.内政部：https://doi.org/10.1613/jair.4475

数字图书馆

[7]

布莱·博内、赫克托·帕拉西奥斯和赫克托尔·杰夫纳。2010.行为控制有限状态机的自动派生。在AAAI人工智能会议记录，第24卷。

数字图书馆

[8]

Ronen I.Brafman和Guy Shani。2012.应急计划的多路径汇编方法。在第26届AAAI人工智能会议记录.

数字图书馆

[9]

Ronen I.Brafman和Guy Shani。2012.在具有部分信息和感知操作的域中重新规划。人工智能研究杂志45, 1 (2012), 565–600.

数字图书馆

[10]

Ronen I.Brafman和Guy Shani。2014.关于使用回归的在线应急计划信念跟踪的特性。在ECAI 2014-21欧洲人工智能会议记录. 147–152.

数字图书馆

[11]

Ronen I.Brafman和Guy Shani。2016年，在线信念跟踪，使用回归进行应急计划。人工智能241 (2016), 131–152.内政部：https://doi.org/10.1016/j.artint.2016.08.005

数字图书馆

[12]

Dan Bryce、Subbarao Kambhampati和David E.Smith。2006.信念空间搜索的规划图启发式。人工智能研究杂志26, 1 (2006), 35–99.

数字图书馆

[13]

安东尼·卡桑德拉。1998年，POMDP应用调查。在AAAI 1998年秋季部分可观测马尔可夫决策过程规划研讨会工作说明会议记录第1724卷。

[14]

Anthony R.Cassandra、Michael L.Littman和Nevin Lianwen Zhang。2013.增量修剪：一种简单、快速、准确的方法，用于部分可观测的马尔可夫决策过程。在第十三届人工智能不确定性会议记录（UAI'97）摩根·考夫曼出版公司，美国加利福尼亚州旧金山，54-61。

数字图书馆

[15]

Alessandro Cimatti和Marco Roveri，2000年。通过符号模型检查进行一致性规划。人工智能研究杂志13 (2000), 305–338.

数字图书馆

[16]

方良大、刘永美、文西明。2015.关于情境演算中不确定性行为的知识和信念的进步。在第24届国际人工智能联合会议记录.

数字图书馆

[17]

玛丽亚·福克斯（Maria Fox）、阿方索·杰列维尼（Alfonso Gerevini）、德里克·朗（Derek Long）和伊万·塞琳娜（Ivan Serina）。2006.计划稳定性：重新规划与计划修复。在ICAPS会议记录，第6卷。212–221.

数字图书馆

[18]

埃里克·汉森。POMDP的稀疏随机有限状态控制器。在阿拉伯联合酋长国会议记录. 256–263.

数字图书馆

[19]

J.Hoffmann和B.Nebel。2001.FF计划系统：通过启发式搜索快速生成计划。JAIR公司14 (2001), 253–302.

数字图书馆

[20]

Jörg Hoffmann和Ronen Brafman。2005.通过启发式前向搜索和隐含信念状态进行应急计划。在ICAPS会议记录，第2005卷。

数字图书馆

[21]

胡玉霄和朱塞佩·德贾科莫。2011.用于合成有限状态控制器的通用框架和求解器。在2011年AAAI广义规划研讨会会议记录.

[22]

塞巴斯蒂安·荣格斯（Sebastian Junges）、尼尔斯·詹森（Nils Jansen）、拉尔夫·威默（Ralf Wimmer）、蒂姆·夸特曼（Tim Quatmann）、利奥诺·温特勒（Leonore Winterer）、朱斯特·佩特尔·卡托恩（Joost-Pieter Katoen。2018年，POMDP的有限状态控制器使用参数合成。在第34届人工智能不确定性会议论文集，2018年UAI，2018年8月6日至10日，加利福尼亚州蒙特雷Amir Globerson和Ricardo Silva（编辑），AUAI出版社，519–529。

[23]

托林·克拉森（Toryn Q.Klassen）、希拉·麦克莱思（Sheila A.McIlraith）和赫克托尔·莱夫斯克（Hector J.Levesque）。2018年，为情境演算中的迭代信念变化指定合理性级别。在第16届知识表示与推理原则国际会议论文集.

[24]

Radimir Komarnitsky和Guy Shani。2016年。使用在线重新规划计算应急计划。在第三十届AAAI人工智能会议记录，2016年2月12日至17日，亚利桑那州凤凰城。3159–3165.

数字图书馆

[25]

Hanna Kurniawati、David Hsu和Wee Sun Lee。2008年。Sarsop：通过逼近最优可达的置信空间来进行有效的基于点的pomdp规划。在机器人学学报：科学与系统，第2008卷。Citeser。

[26]

Shlomi Maliah、Ronen I.Brafman、Erez Karpas和Guy Shani。2014.使用里程碑式启发法的部分可观察在线应急计划。在第24届国际自动规划与调度会议记录.

数字图书馆

[27]

克里斯蒂安·穆伊斯（Christian J.Muise）、希拉·麦克莱思（Sheila A.McIlraith）和克里斯托弗·贝克（J.Christopher Beck）。2012.通过利用状态相关性改进非确定性规划。在第22届国际自动规划与调度会议记录.

数字图书馆

[28]

克里斯蒂安·J·缪斯（Christian J.Muise）、维沙克·贝勒（Vaishak Belle）和希拉·麦克莱思（Sheila A.McIlraith）。2014年，通过完全可观察的非确定性规划计算应急计划。在第28届AAAI人工智能会议记录.

数字图书馆

[29]

赫克特·帕拉西奥斯（Héctor Palacios）、亚历山大·阿尔博尔（Alexandre Albore）和赫克托尔·盖夫纳（Hector Geffner）。2014年，将应急计划编制为经典计划：新的翻译和结果。在ICAPS不确定性规划模型和范例研讨会论文集.

[30]

赫克托·帕拉西奥斯和赫克托尔·盖夫纳。2009年，消除宽度有限的一致规划问题中的不确定性。人工智能研究杂志35 (2009), 623–675.

数字图书馆

[31]

Pascal Poupart和Craig Boutiler。2003.有界有限状态控制器。神经信息处理系统研究进展16 (2003), 823–830.

数字图书馆

[32]

尤西·林塔南（Jussi Rintanen）。2008.经典规划和非确定性规划的回归。在2008年7月21日至25日在希腊帕特拉斯举行的ECAI 2008-18届欧洲人工智能会议记录. 568–572.内政部：https://doi.org/10.3233/978-1-58603-891-568

数字图书馆

[33]

尤西·林塔南（Jussi Rintanen）。2009年，规划和SAT。可满足性手册185 (2009), 483–504.

[34]

Scott Sanner和Kristian Kersting。2010.一阶POMDP的符号动态编程。在AAAI人工智能会议记录，第24卷。

数字图书馆

[35]

Guy Shani和Ronen I.Brafman。2011.在具有部分信息和感知操作的域中重新规划。在国际JCAI会议记录. 2021–2026.

数字图书馆

[36]

Guy Shani、Pascal Poupart、Ronen I.Brafman和Solomon Eyal Shimony。2008.针对基于点的算法的高效ADD操作。在ICAPS会议记录. 330–337.

数字图书馆

[37]

盖·沙尼、乔尔·皮诺和罗伯特·卡普洛。2013年，基于点的POMDP解算器调查。自治代理和多代理系统27, 1 (2013), 1–51.

数字图书馆

[38]

Dorin Shmaryahu、Guy Shani和Jörg Hoffmann。2019.部分可观察应急计划的比较标准。自治代理和多代理系统33, 5 (2019), 481–517.

数字图书馆

[39]

Sim Hyeong Seop、Kim Kee-Eung、Kim Jin Hyung、Du-Seong Chang和Myoung-Wan Koo。2008.分解POMDP的符号启发式搜索值迭代。在AAAI会议记录. 1088–1093.

数字图书馆

[40]

爱德华·桑迪克。1978.无限期部分可观测马尔可夫过程的最优控制：折现成本。运筹学26, 2 (1978), 282–304.

数字图书馆

[41]

Son Thanh To.2011年。不确定性下信念状态表征对规划的影响。在国际JCAI会议记录. 2856–2857.

数字图书馆

[42]

Son Thanh To、Enrico Pontelli和Tran Cao Son。2011.关于CNF和DNF代表在应急计划中的有效性。在国际JCAI会议记录. 2033–2038.

数字图书馆

[43]

Son Thanh To、Tran Cao Son和Enrico Pontelli。2011.关于应急计划中信念状态表示的有效性。在AAAI会议记录.

数字图书馆

[44]

Son Thanh To、Tran Cao Son和Enrico Pontelli。2011.应急计划中的关联表示：主要暗示与最小CNF公式。在AAAI会议记录.

数字图书馆

[45]

宋宇渊、阿兰·弗恩和罗伯特·吉万。2007年。FF回复：概率规划的基线。在ICAPS会议记录，第7卷。352–359.

数字图书馆

[46]

张晓迪、阿尔班·格雷斯汀和恩里科·斯卡拉。2020年，计算一致性规划的优秀反例。在AAAI人工智能会议记录，第34卷。10017–10024.

引用人

郭H吴F秦Y李·R李凯（Li K）李凯（Li K）(2023)机器人任务和运动规划的最新趋势：综述倒排索引综述10.1145/358313655：13秒(1-36)在线发布日期：2023年7月13日
https://dl.acm.org/doi/10.1145/3583136

索引术语

使用在线计划计算应急计划图
1. 计算方法
  1. 人工智能
    1. 计划和调度
      1. 不确定性下的规划

建议

基于Landmark的启发式在线应急计划

在应急计划问题中，代理拥有关于其状态的部分信息，并使用感知动作学习一些变量的值。当传感和驱动分离时，此类问题的计划通常可视为传感树。。。
部分可观测应急计划的比较标准
AAMAS’19：第18届自治代理和多代理系统国际会议记录

在具有感知行为的部分可观测条件下的应急计划中，解决方案可以表示为计划树，在各种可能的观测上分支。通常，人们会寻求一个令人满意的计划，从而在每个叶上实现目标状态。在许多。。。
确定性部分可观测权变规划中不可避免的死胡同
摘要
传统上，根据代理人在计划执行过程中获得的观察结果进行分支的应急计划必须从每个可能的初始状态达到目标状态。然而，在许多现实问题中，并不存在这样的计划。然而，有计划。。。

评论

信息和贡献者

问询处

发布于

自主和自适应系统上的封面图像ACM事务

自主和自适应系统ACM汇刊第16卷第1期

2021年3月

73页

国际标准编号：1556-4665

EISSN公司：1556-4703

内政部：10.1145/3505218

编辑：
瓦莱里·伊斯萨尼
法国Inria

如果复制品不是为了盈利或商业利益而制作或分发的，并且复制品的第一页载有本通知和完整引文，则允许免费制作本作品的全部或部分数字或硬拷贝以供个人或课堂使用。必须尊重ACM以外的其他人对本作品组成部分的版权。允许用信用证进行摘要。要以其他方式复制或重新发布，在服务器上发布或重新发布到列表，需要事先获得特定许可和/或付费。从请求权限[电子邮件保护].

出版商

计算机协会

美国纽约州纽约市

出版历史

出版：2022年1月23日

认可的：2021年9月1日

修订过的：2021年9月1日

收到：2020年8月1日

发表于TAAS体积16,问题1

权限

请求对此文章的权限。

检查更新

作者标记

限定符

研究文章
推荐

贡献者

其他指标

查看文章指标

文献计量学和引文

文献计量学

文章指标

1
引文总数
查看引文
282
总下载次数

下载次数（过去12个月）58
下载次数（最近6周）三

反映截至2024年9月20日的下载量

其他指标

查看作者指标

引文

引用人

郭H吴F秦Y李·R李凯（Li K）李凯（Li K）(2023)机器人任务和运动规划的最新趋势：综述倒排索引综述10.1145/358313655：13秒(1-36)在线发布日期：2023年7月13日
https://dl.acm.org/doi/10.1145/3583136

视图选项

获取访问权限

登录选项

检查您是否可以通过登录凭据或您的机构访问本文。

完全访问权限

获取此文章

查看选项

PDF格式

以PDF文件查看或下载。

电子阅读器

使用联机查看电子阅读器.

电子阅读器

全文

以全文形式查看本文。

HTML格式格式

在中查看本文HTML格式格式。

媒体

数字

其他

桌子

查看全文|下载PDF

查看问题目录