跳到主要内容
研究论文

使用在线计划计算应急计划图

出版:2022年1月23日 出版历史

摘要

在具有感知行为的部分可观测条件下的应急计划中,智能体积极使用感知来发现关于世界的有意义的事实。最近成功的方法将部分可观测或有问题转化为非确定性完全可观测问题,然后使用规划器进行非确定性规划。然而,翻译可能会变得非常大,阻碍了非确定性规划师的任务。我们建议采用不同的方法,反复使用在线权变求解器来构建计划树。我们执行在线解算器返回的计划,直到下一个观测操作,然后对可能的观测值进行分支,并独立地重新规划每个分支。在许多情况下,计划树的状态变量数可以是指数宽度,但该树的结构允许我们使用有向图紧凑地表示它。我们建议一种机制来裁剪这样的图,从而减少计算工作量和存储空间。我们的方法还通过识别计划中的周期来处理非确定性领域。我们提供了一组实验,展示了我们比最先进的线下规划师更好地扩展规模的方法。

工具书类

[1]
亚历山大·阿尔博尔(Alexandre Albore)、赫克托·帕拉西奥斯(Héctor Palacios)和赫克托尔·盖夫纳(Hector Geffner)。2009年,基于翻译的应急计划方法。国际JCAI会议记录. 1623–1628.
[2]
P.Bertoli、A.Cimatti、M.Pistore、M.Roveri和P.Traverso。2001.MBP:基于模型的规划师。IJCAI'01不确定性和不完全信息下的规划研讨会会议记录西雅图。
[3]
Avrim L.Blum和Merrick L.Furst。1997年。通过规划图分析快速规划。人工智能90, 1–2 (1997), 281–300.
[4]
Blai Bonet和Hector Geffner。2001年。GPT:一种利用不确定性和部分信息进行规划的工具。IJCAI-01不确定性和部分信息规划研讨会会议记录Citeser,82–87。
[5]
Blai Bonet和Hector Geffner。2011.经典重新规划在部分可观测性下的规划:理论和实验。2011年7月16日至22日,西班牙加泰罗尼亚巴塞罗那第22届国际人工智能联合会议记录. 1936–1941.
[6]
Blai Bonet和Hector Geffner。2014.感知规划的信念跟踪:宽度、复杂性和近似值。人工智能研究杂志50 (2014), 923–970.内政部:https://doi.org/10.1613/jair.4475
[7]
布莱·博内、赫克托·帕拉西奥斯和赫克托尔·杰夫纳。2010.行为控制有限状态机的自动派生。AAAI人工智能会议记录,第24卷。
[8]
Ronen I.Brafman和Guy Shani。2012.应急计划的多路径汇编方法。第26届AAAI人工智能会议记录.
[9]
Ronen I.Brafman和Guy Shani。2012.在具有部分信息和感知操作的域中重新规划。人工智能研究杂志45, 1 (2012), 565–600.
[10]
Ronen I.Brafman和Guy Shani。2014.关于使用回归的在线应急计划信念跟踪的特性。ECAI 2014-21欧洲人工智能会议记录. 147–152.
[11]
Ronen I.Brafman和Guy Shani。2016年,在线信念跟踪,使用回归进行应急计划。人工智能241 (2016), 131–152.内政部:https://doi.org/10.1016/j.artint.2016.08.005
[12]
Dan Bryce、Subbarao Kambhampati和David E.Smith。2006.信念空间搜索的规划图启发式。人工智能研究杂志26, 1 (2006), 35–99.
[13]
安东尼·卡桑德拉。1998年,POMDP应用调查。AAAI 1998年秋季部分可观测马尔可夫决策过程规划研讨会工作说明会议记录第1724卷。
[14]
Anthony R.Cassandra、Michael L.Littman和Nevin Lianwen Zhang。2013.增量修剪:一种简单、快速、准确的方法,用于部分可观测的马尔可夫决策过程。第十三届人工智能不确定性会议记录(UAI'97)摩根·考夫曼出版公司,美国加利福尼亚州旧金山,54-61。
[15]
Alessandro Cimatti和Marco Roveri,2000年。通过符号模型检查进行一致性规划。人工智能研究杂志13 (2000), 305–338.
[16]
方良大、刘永美、文西明。2015.关于情境演算中不确定性行为的知识和信念的进步。第24届国际人工智能联合会议记录.
[17]
玛丽亚·福克斯(Maria Fox)、阿方索·杰列维尼(Alfonso Gerevini)、德里克·朗(Derek Long)和伊万·塞琳娜(Ivan Serina)。2006.计划稳定性:重新规划与计划修复。ICAPS会议记录,第6卷。212–221.
[18]
埃里克·汉森。POMDP的稀疏随机有限状态控制器。阿拉伯联合酋长国会议记录. 256–263.
[19]
J.Hoffmann和B.Nebel。2001.FF计划系统:通过启发式搜索快速生成计划。JAIR公司14 (2001), 253–302.
[20]
Jörg Hoffmann和Ronen Brafman。2005.通过启发式前向搜索和隐含信念状态进行应急计划。ICAPS会议记录,第2005卷。
[21]
胡玉霄和朱塞佩·德贾科莫。2011.用于合成有限状态控制器的通用框架和求解器。2011年AAAI广义规划研讨会会议记录.
[22]
塞巴斯蒂安·荣格斯(Sebastian Junges)、尼尔斯·詹森(Nils Jansen)、拉尔夫·威默(Ralf Wimmer)、蒂姆·夸特曼(Tim Quatmann)、利奥诺·温特勒(Leonore Winterer)、朱斯特·佩特尔·卡托恩(Joost-Pieter Katoen。2018年,POMDP的有限状态控制器使用参数合成。第34届人工智能不确定性会议论文集,2018年UAI,2018年8月6日至10日,加利福尼亚州蒙特雷Amir Globerson和Ricardo Silva(编辑),AUAI出版社,519–529。
[23]
托林·克拉森(Toryn Q.Klassen)、希拉·麦克莱思(Sheila A.McIlraith)和赫克托尔·莱夫斯克(Hector J.Levesque)。2018年,为情境演算中的迭代信念变化指定合理性级别。第16届知识表示与推理原则国际会议论文集.
[24]
Radimir Komarnitsky和Guy Shani。2016年。使用在线重新规划计算应急计划。第三十届AAAI人工智能会议记录,2016年2月12日至17日,亚利桑那州凤凰城。3159–3165.
[25]
Hanna Kurniawati、David Hsu和Wee Sun Lee。2008年。Sarsop:通过逼近最优可达的置信空间来进行有效的基于点的pomdp规划。机器人学学报:科学与系统,第2008卷。Citeser。
[26]
Shlomi Maliah、Ronen I.Brafman、Erez Karpas和Guy Shani。2014.使用里程碑式启发法的部分可观察在线应急计划。第24届国际自动规划与调度会议记录.
[27]
克里斯蒂安·穆伊斯(Christian J.Muise)、希拉·麦克莱思(Sheila A.McIlraith)和克里斯托弗·贝克(J.Christopher Beck)。2012.通过利用状态相关性改进非确定性规划。第22届国际自动规划与调度会议记录.
[28]
克里斯蒂安·J·缪斯(Christian J.Muise)、维沙克·贝勒(Vaishak Belle)和希拉·麦克莱思(Sheila A.McIlraith)。2014年,通过完全可观察的非确定性规划计算应急计划。第28届AAAI人工智能会议记录.
[29]
赫克特·帕拉西奥斯(Héctor Palacios)、亚历山大·阿尔博尔(Alexandre Albore)和赫克托尔·盖夫纳(Hector Geffner)。2014年,将应急计划编制为经典计划:新的翻译和结果。ICAPS不确定性规划模型和范例研讨会论文集.
[30]
赫克托·帕拉西奥斯和赫克托尔·盖夫纳。2009年,消除宽度有限的一致规划问题中的不确定性。人工智能研究杂志35 (2009), 623–675.
[31]
Pascal Poupart和Craig Boutiler。2003.有界有限状态控制器。神经信息处理系统研究进展16 (2003), 823–830.
[32]
尤西·林塔南(Jussi Rintanen)。2008.经典规划和非确定性规划的回归。2008年7月21日至25日在希腊帕特拉斯举行的ECAI 2008-18届欧洲人工智能会议记录. 568–572.内政部:https://doi.org/10.3233/978-1-58603-891-568
[33]
尤西·林塔南(Jussi Rintanen)。2009年,规划和SAT。可满足性手册185 (2009), 483–504.
[34]
Scott Sanner和Kristian Kersting。2010.一阶POMDP的符号动态编程。AAAI人工智能会议记录,第24卷。
[35]
Guy Shani和Ronen I.Brafman。2011.在具有部分信息和感知操作的域中重新规划。国际JCAI会议记录. 2021–2026.
[36]
Guy Shani、Pascal Poupart、Ronen I.Brafman和Solomon Eyal Shimony。2008.针对基于点的算法的高效ADD操作。ICAPS会议记录. 330–337.
[37]
盖·沙尼、乔尔·皮诺和罗伯特·卡普洛。2013年,基于点的POMDP解算器调查。自治代理和多代理系统27, 1 (2013), 1–51.
[38]
Dorin Shmaryahu、Guy Shani和Jörg Hoffmann。2019.部分可观察应急计划的比较标准。自治代理和多代理系统33, 5 (2019), 481–517.
[39]
Sim Hyeong Seop、Kim Kee-Eung、Kim Jin Hyung、Du-Seong Chang和Myoung-Wan Koo。2008.分解POMDP的符号启发式搜索值迭代。AAAI会议记录. 1088–1093.
[40]
爱德华·桑迪克。1978.无限期部分可观测马尔可夫过程的最优控制:折现成本。运筹学26, 2 (1978), 282–304.
[41]
Son Thanh To.2011年。不确定性下信念状态表征对规划的影响。国际JCAI会议记录. 2856–2857.
[42]
Son Thanh To、Enrico Pontelli和Tran Cao Son。2011.关于CNF和DNF代表在应急计划中的有效性。国际JCAI会议记录. 2033–2038.
[43]
Son Thanh To、Tran Cao Son和Enrico Pontelli。2011.关于应急计划中信念状态表示的有效性。AAAI会议记录.
[44]
Son Thanh To、Tran Cao Son和Enrico Pontelli。2011.应急计划中的关联表示:主要暗示与最小CNF公式。AAAI会议记录.
[45]
宋宇渊、阿兰·弗恩和罗伯特·吉万。2007年。FF回复:概率规划的基线。ICAPS会议记录,第7卷。352–359.
[46]
张晓迪、阿尔班·格雷斯汀和恩里科·斯卡拉。2020年,计算一致性规划的优秀反例。AAAI人工智能会议记录,第34卷。10017–10024.

引用人

查看全部
  • (2023)机器人任务和运动规划的最新趋势:综述倒排索引综述10.1145/358313655:13秒(1-36)在线发布日期:2023年7月13日

索引术语

  1. 使用在线计划计算应急计划图

    建议

    评论

    信息和贡献者

    问询处

    发布于

    自主和自适应系统上的封面图像ACM事务
    自主和自适应系统ACM汇刊 第16卷第1期
    2021年3月
    73页
    国际标准编号:1556-4665
    EISSN公司:1556-4703
    内政部:10.1145/3505218
    期刊目录

    出版商

    计算机协会

    美国纽约州纽约市

    出版历史

    出版:2022年1月23日
    认可的:2021年9月1日
    修订过的:2021年9月1日
    收到:2020年8月1日
    发表于TAAS体积16,问题1

    权限

    请求对此文章的权限。

    检查更新

    作者标记

    1. 自动化规划
    2. 应急计划
    3. 部分可观测性

    限定符

    • 研究文章
    • 推荐

    贡献者

    其他指标

    文献计量学和引文

    文献计量学

    文章指标

    • 下载次数(过去12个月)58
    • 下载次数(最近6周)
    反映截至2024年9月20日的下载量

    其他指标

    引文

    引用人

    查看全部
    • (2023)机器人任务和运动规划的最新趋势:综述倒排索引综述10.1145/358313655:13秒(1-36)在线发布日期:2023年7月13日

    视图选项

    获取访问权限

    登录选项

    完全访问权限

    查看选项

    PDF格式

    以PDF文件查看或下载。

    PDF格式

    电子阅读器

    使用联机查看电子阅读器.

    电子阅读器

    全文

    以全文形式查看本文。

    全文

    HTML格式格式

    在中查看本文HTML格式格式。

    HTML格式

    媒体

    数字

    其他

    桌子

    分享

    分享

    共享此出版物链接

    在社交媒体上分享