研究论文 在上共享 使用在线计划计算应急计划图作者:什洛米 玛丽亚,拉迪米尔 科马尼茨基,家伙 沙尼作者信息和声明ACM自主与自适应系统汇刊(TAAS),体积16,问题1文章编号:1,页数1-30https://doi.org/10.1145/3488903出版:2022年1月23日 出版历史 获取引文提醒新增引文提醒!此警报已成功添加,并将发送到:只要您选择的记录被引用,您就会收到通知。新引文提醒!拜托登录到您的帐户 获取访问权限目录ACM自主与自适应系统汇刊(TAAS)体积16,问题1下一篇文章Gist Trace-based Learning:多边互动中的高效公约下一步摘要工具书类信息和贡献者文献计量学和引文获取访问权限工具书类媒体桌子分享摘要在具有感知行为的部分可观测条件下的应急计划中,智能体积极使用感知来发现关于世界的有意义的事实。最近成功的方法将部分可观测或有问题转化为非确定性完全可观测问题,然后使用规划器进行非确定性规划。然而,翻译可能会变得非常大,阻碍了非确定性规划师的任务。我们建议采用不同的方法,反复使用在线权变求解器来构建计划树。我们执行在线解算器返回的计划,直到下一个观测操作,然后对可能的观测值进行分支,并独立地重新规划每个分支。在许多情况下,计划树的状态变量数可以是指数宽度,但该树的结构允许我们使用有向图紧凑地表示它。我们建议一种机制来裁剪这样的图,从而减少计算工作量和存储空间。我们的方法还通过识别计划中的周期来处理非确定性领域。我们提供了一组实验,展示了我们比最先进的线下规划师更好地扩展规模的方法。工具书类[1]亚历山大·阿尔博尔(Alexandre Albore)、赫克托·帕拉西奥斯(Héctor Palacios)和赫克托尔·盖夫纳(Hector Geffner)。2009年,基于翻译的应急计划方法。在国际JCAI会议记录. 1623–1628.数字图书馆谷歌学者[2]P.Bertoli、A.Cimatti、M.Pistore、M.Roveri和P.Traverso。2001.MBP:基于模型的规划师。在IJCAI'01不确定性和不完全信息下的规划研讨会会议记录西雅图。谷歌学者[3]Avrim L.Blum和Merrick L.Furst。1997年。通过规划图分析快速规划。人工智能90, 1–2 (1997), 281–300.数字图书馆谷歌学者[4]Blai Bonet和Hector Geffner。2001年。GPT:一种利用不确定性和部分信息进行规划的工具。在IJCAI-01不确定性和部分信息规划研讨会会议记录Citeser,82–87。谷歌学者[5]Blai Bonet和Hector Geffner。2011.经典重新规划在部分可观测性下的规划:理论和实验。在2011年7月16日至22日,西班牙加泰罗尼亚巴塞罗那第22届国际人工智能联合会议记录. 1936–1941.数字图书馆谷歌学者[6]Blai Bonet和Hector Geffner。2014.感知规划的信念跟踪:宽度、复杂性和近似值。人工智能研究杂志50 (2014), 923–970.内政部:https://doi.org/10.1613/jair.4475数字图书馆谷歌学者[7]布莱·博内、赫克托·帕拉西奥斯和赫克托尔·杰夫纳。2010.行为控制有限状态机的自动派生。在AAAI人工智能会议记录,第24卷。数字图书馆谷歌学者[8]Ronen I.Brafman和Guy Shani。2012.应急计划的多路径汇编方法。在第26届AAAI人工智能会议记录.数字图书馆谷歌学者[9]Ronen I.Brafman和Guy Shani。2012.在具有部分信息和感知操作的域中重新规划。人工智能研究杂志45, 1 (2012), 565–600.数字图书馆谷歌学者[10]Ronen I.Brafman和Guy Shani。2014.关于使用回归的在线应急计划信念跟踪的特性。在ECAI 2014-21欧洲人工智能会议记录. 147–152.数字图书馆谷歌学者[11]Ronen I.Brafman和Guy Shani。2016年,在线信念跟踪,使用回归进行应急计划。人工智能241 (2016), 131–152.内政部:https://doi.org/10.1016/j.artint.2016.08.005数字图书馆谷歌学者[12]Dan Bryce、Subbarao Kambhampati和David E.Smith。2006.信念空间搜索的规划图启发式。人工智能研究杂志26, 1 (2006), 35–99.数字图书馆谷歌学者[13]安东尼·卡桑德拉。1998年,POMDP应用调查。在AAAI 1998年秋季部分可观测马尔可夫决策过程规划研讨会工作说明会议记录第1724卷。谷歌学者[14]Anthony R.Cassandra、Michael L.Littman和Nevin Lianwen Zhang。2013.增量修剪:一种简单、快速、准确的方法,用于部分可观测的马尔可夫决策过程。在第十三届人工智能不确定性会议记录(UAI'97)摩根·考夫曼出版公司,美国加利福尼亚州旧金山,54-61。数字图书馆谷歌学者[15]Alessandro Cimatti和Marco Roveri,2000年。通过符号模型检查进行一致性规划。人工智能研究杂志13 (2000), 305–338.数字图书馆谷歌学者[16]方良大、刘永美、文西明。2015.关于情境演算中不确定性行为的知识和信念的进步。在第24届国际人工智能联合会议记录.数字图书馆谷歌学者[17]玛丽亚·福克斯(Maria Fox)、阿方索·杰列维尼(Alfonso Gerevini)、德里克·朗(Derek Long)和伊万·塞琳娜(Ivan Serina)。2006.计划稳定性:重新规划与计划修复。在ICAPS会议记录,第6卷。212–221.数字图书馆谷歌学者[18]埃里克·汉森。POMDP的稀疏随机有限状态控制器。在阿拉伯联合酋长国会议记录. 256–263.数字图书馆谷歌学者[19]J.Hoffmann和B.Nebel。2001.FF计划系统:通过启发式搜索快速生成计划。JAIR公司14 (2001), 253–302.数字图书馆谷歌学者[20]Jörg Hoffmann和Ronen Brafman。2005.通过启发式前向搜索和隐含信念状态进行应急计划。在ICAPS会议记录,第2005卷。数字图书馆谷歌学者[21]胡玉霄和朱塞佩·德贾科莫。2011.用于合成有限状态控制器的通用框架和求解器。在2011年AAAI广义规划研讨会会议记录.谷歌学者[22]塞巴斯蒂安·荣格斯(Sebastian Junges)、尼尔斯·詹森(Nils Jansen)、拉尔夫·威默(Ralf Wimmer)、蒂姆·夸特曼(Tim Quatmann)、利奥诺·温特勒(Leonore Winterer)、朱斯特·佩特尔·卡托恩(Joost-Pieter Katoen。2018年,POMDP的有限状态控制器使用参数合成。在第34届人工智能不确定性会议论文集,2018年UAI,2018年8月6日至10日,加利福尼亚州蒙特雷Amir Globerson和Ricardo Silva(编辑),AUAI出版社,519–529。谷歌学者[23]托林·克拉森(Toryn Q.Klassen)、希拉·麦克莱思(Sheila A.McIlraith)和赫克托尔·莱夫斯克(Hector J.Levesque)。2018年,为情境演算中的迭代信念变化指定合理性级别。在第16届知识表示与推理原则国际会议论文集.谷歌学者[24]Radimir Komarnitsky和Guy Shani。2016年。使用在线重新规划计算应急计划。在第三十届AAAI人工智能会议记录,2016年2月12日至17日,亚利桑那州凤凰城。3159–3165.数字图书馆谷歌学者[25]Hanna Kurniawati、David Hsu和Wee Sun Lee。2008年。Sarsop:通过逼近最优可达的置信空间来进行有效的基于点的pomdp规划。在机器人学学报:科学与系统,第2008卷。Citeser。交叉参考谷歌学者[26]Shlomi Maliah、Ronen I.Brafman、Erez Karpas和Guy Shani。2014.使用里程碑式启发法的部分可观察在线应急计划。在第24届国际自动规划与调度会议记录.数字图书馆谷歌学者[27]克里斯蒂安·穆伊斯(Christian J.Muise)、希拉·麦克莱思(Sheila A.McIlraith)和克里斯托弗·贝克(J.Christopher Beck)。2012.通过利用状态相关性改进非确定性规划。在第22届国际自动规划与调度会议记录.数字图书馆谷歌学者[28]克里斯蒂安·J·缪斯(Christian J.Muise)、维沙克·贝勒(Vaishak Belle)和希拉·麦克莱思(Sheila A.McIlraith)。2014年,通过完全可观察的非确定性规划计算应急计划。在第28届AAAI人工智能会议记录.数字图书馆谷歌学者[29]赫克特·帕拉西奥斯(Héctor Palacios)、亚历山大·阿尔博尔(Alexandre Albore)和赫克托尔·盖夫纳(Hector Geffner)。2014年,将应急计划编制为经典计划:新的翻译和结果。在ICAPS不确定性规划模型和范例研讨会论文集.谷歌学者[30]赫克托·帕拉西奥斯和赫克托尔·盖夫纳。2009年,消除宽度有限的一致规划问题中的不确定性。人工智能研究杂志35 (2009), 623–675.数字图书馆谷歌学者[31]Pascal Poupart和Craig Boutiler。2003.有界有限状态控制器。神经信息处理系统研究进展16 (2003), 823–830.数字图书馆谷歌学者[32]尤西·林塔南(Jussi Rintanen)。2008.经典规划和非确定性规划的回归。在2008年7月21日至25日在希腊帕特拉斯举行的ECAI 2008-18届欧洲人工智能会议记录. 568–572.内政部:https://doi.org/10.3233/978-1-58603-891-568数字图书馆谷歌学者[33]尤西·林塔南(Jussi Rintanen)。2009年,规划和SAT。可满足性手册185 (2009), 483–504.谷歌学者[34]Scott Sanner和Kristian Kersting。2010.一阶POMDP的符号动态编程。在AAAI人工智能会议记录,第24卷。数字图书馆谷歌学者[35]Guy Shani和Ronen I.Brafman。2011.在具有部分信息和感知操作的域中重新规划。在国际JCAI会议记录. 2021–2026.数字图书馆谷歌学者[36]Guy Shani、Pascal Poupart、Ronen I.Brafman和Solomon Eyal Shimony。2008.针对基于点的算法的高效ADD操作。在ICAPS会议记录. 330–337.数字图书馆谷歌学者[37]盖·沙尼、乔尔·皮诺和罗伯特·卡普洛。2013年,基于点的POMDP解算器调查。自治代理和多代理系统27, 1 (2013), 1–51.数字图书馆谷歌学者[38]Dorin Shmaryahu、Guy Shani和Jörg Hoffmann。2019.部分可观察应急计划的比较标准。自治代理和多代理系统33, 5 (2019), 481–517.数字图书馆谷歌学者[39]Sim Hyeong Seop、Kim Kee-Eung、Kim Jin Hyung、Du-Seong Chang和Myoung-Wan Koo。2008.分解POMDP的符号启发式搜索值迭代。在AAAI会议记录. 1088–1093.数字图书馆谷歌学者[40]爱德华·桑迪克。1978.无限期部分可观测马尔可夫过程的最优控制:折现成本。运筹学26, 2 (1978), 282–304.数字图书馆谷歌学者[41]Son Thanh To.2011年。不确定性下信念状态表征对规划的影响。在国际JCAI会议记录. 2856–2857.数字图书馆谷歌学者[42]Son Thanh To、Enrico Pontelli和Tran Cao Son。2011.关于CNF和DNF代表在应急计划中的有效性。在国际JCAI会议记录. 2033–2038.数字图书馆谷歌学者[43]Son Thanh To、Tran Cao Son和Enrico Pontelli。2011.关于应急计划中信念状态表示的有效性。在AAAI会议记录.数字图书馆谷歌学者[44]Son Thanh To、Tran Cao Son和Enrico Pontelli。2011.应急计划中的关联表示:主要暗示与最小CNF公式。在AAAI会议记录.数字图书馆谷歌学者[45]宋宇渊、阿兰·弗恩和罗伯特·吉万。2007年。FF回复:概率规划的基线。在ICAPS会议记录,第7卷。352–359.数字图书馆谷歌学者[46]张晓迪、阿尔班·格雷斯汀和恩里科·斯卡拉。2020年,计算一致性规划的优秀反例。在AAAI人工智能会议记录,第34卷。10017–10024.交叉参考谷歌学者 引用人查看全部郭H吴F秦Y李·R李凯(Li K)李凯(Li K)(2023)机器人任务和运动规划的最新趋势:综述倒排索引综述10.1145/358313655:13秒(1-36)在线发布日期:2023年7月13日https://dl.acm.org/doi/10.1145/3583136 索引术语 使用在线计划计算应急计划图计算方法人工智能计划和调度不确定性下的规划 建议 基于Landmark的启发式在线应急计划 在应急计划问题中,代理拥有关于其状态的部分信息,并使用感知动作学习一些变量的值。当传感和驱动分离时,此类问题的计划通常可视为传感树。。。阅读更多信息部分可观测应急计划的比较标准AAMAS’19:第18届自治代理和多代理系统国际会议记录 在具有感知行为的部分可观测条件下的应急计划中,解决方案可以表示为计划树,在各种可能的观测上分支。通常,人们会寻求一个令人满意的计划,从而在每个叶上实现目标状态。在许多。。。阅读更多信息确定性部分可观测权变规划中不可避免的死胡同摘要传统上,根据代理人在计划执行过程中获得的观察结果进行分支的应急计划必须从每个可能的初始状态达到目标状态。然而,在许多现实问题中,并不存在这样的计划。然而,有计划。。。阅读更多信息 评论 Please enable JavaScript to view thecomments powered by Disqus. 信息和贡献者问询处发布于 自主和自适应系统ACM汇刊 第16卷第1期2021年3月73页国际标准编号:1556-4665EISSN公司:1556-4703内政部:10.1145/3505218编辑:瓦莱里·伊斯萨尼法国Inria期刊目录 如果复制品不是为了盈利或商业利益而制作或分发的,并且复制品的第一页载有本通知和完整引文,则允许免费制作本作品的全部或部分数字或硬拷贝以供个人或课堂使用。必须尊重ACM以外的其他人对本作品组成部分的版权。允许用信用证进行摘要。要以其他方式复制或重新发布,在服务器上发布或重新发布到列表,需要事先获得特定许可和/或付费。从请求权限[电子邮件保护].出版商计算机协会美国纽约州纽约市出版历史出版:2022年1月23日认可的:2021年9月1日修订过的:2021年9月1日收到:2020年8月1日发表于TAAS体积16,问题1权限请求对此文章的权限。请求权限检查更新作者标记自动化规划应急计划部分可观测性限定符研究文章推荐贡献者 其他指标查看文章指标文献计量学和引文文献计量学 文章指标 1引文总数查看引文282总下载次数下载次数(过去12个月)58下载次数(最近6周)三反映截至2024年9月20日的下载量 其他指标查看作者指标引文 引用人查看全部郭H吴F秦Y李·R李凯(Li K)李凯(Li K)(2023)机器人任务和运动规划的最新趋势:综述倒排索引综述10.1145/358313655:13秒(1-36)在线发布日期:2023年7月13日https://dl.acm.org/doi/10.1145/3583136 视图选项获取访问权限 登录选项检查您是否可以通过登录凭据或您的机构访问本文。登录完全访问权限获取此文章 查看选项 PDF格式以PDF文件查看或下载。PDF格式 电子阅读器使用联机查看电子阅读器.电子阅读器全文以全文形式查看本文。全文 HTML格式格式在中查看本文HTML格式格式。HTML格式媒体数字其他桌子分享分享共享此出版物链接复制链接已复制!复制失败。在社交媒体上分享LinkedIn链接Reddit网站电子邮件附属公司什洛米 玛丽亚以色列内盖夫本古里安大学软件和信息系统工程查看个人资料拉迪米尔 科马尼茨基以色列内盖夫本古里安大学软件和信息系统工程查看个人资料家伙 沙尼以色列内盖夫本古里安大学软件和信息系统工程https://orcid.org/0000-0003-4131-0382查看个人资料