×

基于知识的程序是部分可观察领域的简洁策略。 (英语) Zbl 1504.68214号

总结:我们建议通过基于知识的项目(KBP)来表达应急计划的政策。KBP,由引入R.费金等。[关于知识的推理。马萨诸塞州剑桥:麻省理工学院出版社(1995;Zbl 0839.68095号)], 是描述代理应根据其当前知识执行的操作的高级协议:分支条件是代理可解释的认知公式。本文的主要目的是证明KBP可以被视为一种简洁的语言,用于表达单主体应急计划中的策略。
KBP在概念上与部分可观察规划文献中用于表达策略的语言非常接近:与它们一样,它们具有条件和循环结构,动作是原子程序,布尔公式是选择执行路径的信念。现在,KBP的特殊性是分支条件指的是信念状态,而不是观察结果。
由于它们的结构相似性,用于表示策略的KBP和标准语言具有相同的表达能力:每个标准策略都可以表示为KBP,每个KBP都可以“展开”为标准策略。然而,与标准策略相比,KBP更简洁、易读、更易于解释。另一方面,它们需要更多的在线计算时间,但我们表明这是一个不可避免的权衡。我们按照四个标准研究基于知识的程序:表达性、简洁性、在线执行的复杂性和验证的复杂性。

MSC公司:

68T27型 人工智能中的逻辑
68T20型 人工智能背景下的问题解决(启发式、搜索策略等)
68立方英尺 知识表示
PDF格式BibTeX公司 XML格式引用
全文: 内政部 哈尔

参考文献:

[1] 亚历山大·阿尔博尔;赫克托宫(Palacios,Héctor);赫克托·杰夫纳,《基于翻译的应急计划方法》(2009年《国际JCAI汇编》(2009)),1623-1628
[2] 亚历山大·阿尔博尔;赫克托宫(Palacios,Héctor);Hector Geffner,《在非确定性一致性规划中消除不确定性》(Proc.ECAI 2010(2010)),465-470·Zbl 1211.68392号
[3] 安徒生,米克尔·比克加德(Mikkel Birkegaard);托马斯·博兰德(Thomas Bolander);Jensen,Martin Holm,条件认知规划(JELIA 2012(2012),94-106)·Zbl 1361.68214号
[4] 奥斯特罗姆,卡尔·约翰,状态信息不完全的马尔可夫过程的最优控制,J.Math。分析。申请。,10, 1, 174-205 (1965) ·兹伯利0137.35803
[5] Aucher,Guillaume,回归和认识规划的DEL序列,J.Appl。非类别。日志。,222337-367(2012年)·Zbl 1398.03068号
[6] 纪尧姆拍卖行;托马斯·博兰德(Thomas Bolander),《认知规划中的不确定性》(IJCAI Proc.2013(2013)),第27-33页
[7] 克里斯特·Bäckström;Jonsson,Peter,紧凑平面表示的算法和限制,J.Artif。智力。研究,44,141-177(2012)·Zbl 1280.68233号
[8] 克里斯特·Bäckström;安德斯·琼森(Anders Jonsson);Jonsson,Peter,Automaton plans,J.Artif。智力。研究,51,255-291(2014)·Zbl 1364.68329号
[9] Jorge A.Baier。;Sheila A.McIlraith,《关于用有意义的计划进行规划》(Proc.KR 2006(2006)),第492-502页
[10] 瓦夏克·贝勒(Belle,Vaishak);Levesque,Hector J.,ALLEGRO:随机动力域中基于信念的规划(Proc.IJCAI 2015(2015)),2762-2769·Zbl 1388.68274号
[11] Daniel S.Bernstein。;齐尔伯斯坦,什洛莫;Immerman,Neil,马尔可夫决策过程分散控制的复杂性,(Proc.UAI 2000(2000)),32-37
[12] 皮耶吉奥·贝尔托利(Piergiorgio Bertoli);亚历山德罗·西马蒂;马可·罗维里(Marco Roveri);Traverso,Paolo,部分可观测性下的强规划,Artif。智力。,170, 4-5, 337-384 (2006) ·Zbl 1131.68095号
[13] 托马斯·博兰德(Thomas Bolander);Andersen、Mikkel Birkegaard,《单智能体和多智能体系统的认识规划》,J.Appl。非类别。日志。,21, 1, 9-34 (2011) ·Zbl 1242.68285号
[14] 托马斯·博兰德(Thomas Bolander);托尔斯滕·恩格斯;安德烈亚斯·赫齐格(Andreas Herzig);罗伯特·马特米勒(Robert Mattmüller);Nebel,Bernhard,《政策和应急计划的动态逻辑》,(2019年《JELIA公报》(2019)),659-674·Zbl 1525.68152号
[15] 博内,布莱;Hector Geffner,《在信念空间中用不完全信息作为启发式搜索的规划》(Proc.AIPS 2000(2000)),52-61
[16] 博内,布莱;Geffner,Hector,通过经典重新规划进行部分可观测性规划:理论和实验,(Proc.IJCAI 2011(2011)),1936-1941
[17] 博内,布莱;赫克托·杰夫纳(Hector Geffner),《具有线性转换的灵活和可扩展的部分可观察规划》(Proc.AAAI 2014(2014)),2235-2241·Zbl 1396.68116号
[18] 博内,布莱;Hector Geffner,《感知规划的信念跟踪:宽度、复杂性和近似值》,J.Artif。智力。决议,50923-970(2014)·Zbl 1396.68116号
[19] 罗恩·布拉夫曼(Ronen I.Brafman)。;Shani,Guy,用部分信息和感知动作重新规划领域,J.Artif。智力。研究,45,565-600(2012)·Zbl 1253.68295号
[20] 罗恩·布拉夫曼(Ronen I.Brafman)。;Shani,Guy,使用回归进行应急计划的在线信念跟踪,Artif。智力。,241, 131-152 (2016) ·Zbl 1392.68383号
[21] 罗恩·布拉夫曼(Ronen I.Brafman)。;Joseph Y.Halpern。;约姆·肖姆,关于任务的知识要求,阿蒂夫。智力。,98, 1-2, 317-350 (1998) ·Zbl 0903.68182号
[22] 罗恩·布拉夫曼(Ronen I.Brafman)。;盖·沙尼;Zilberstein,Shlomo,多智能体领域部分可观测性下的定性规划(Proc.AAAI 2013(2013)),130-137
[23] 丹尼尔·布莱斯(Daniel Bryce);威廉·库欣(William Cushing);Kambhampati,Subbarao,《与州无关的规划图:确定性、非确定性和概率规划》,Artif。智力。,175, 3-4, 848-889 (2011) ·Zbl 1216.68239号
[24] 塞缪尔·巴斯(Samuel R.Buss)。;Hay,Louise,《关于SAT的真实可还原性》,Inf.Comput。,91, 1, 86-102 (1991) ·Zbl 0800.68443号
[25] 特里斯坦·查里尔;塞巴斯蒂安·甘布林;亚历山大·尼沃;弗朗索瓦·施瓦岑特鲁伯(François Schwarzentruber),《辛提卡的世界:可扩展的高阶知识》(Intikka’s world:scalable high-order knowledge),(2019年IJCAI期刊(2019)),6494-6496
[26] 亚历山德罗·西马蒂;马可·皮斯托雷(Marco Pistore);马可·罗维里(Marco Roveri);Traverso、Paolo、通过符号模型检查的弱、强和强循环规划、Artif。智力。,147, 1-2, 35-84 (2003) ·Zbl 1082.68800号
[27] 克拉恩,延斯;Neuss,Malte,模态情境演算中具有默认值的基于知识的程序,(Proc.ECAI 2016(2016)),1309-1317·兹比尔1403.68258
[28] 克拉斯滕,约尔格;Lakemeyer,Gerhard,《使用ES的基于知识的程序基础》(Proc.KR 2006(2006)),第318-328页
[29] 阿德南·达尔维什;Marquis,Pierre,《知识汇编地图》,J.Artif。智力。决议,17,229-264(2002)·Zbl 1045.68131号
[30] 朱塞佩·德贾科莫;Lespérance,伊夫斯;Patrizi,Fabio,有界情境演算行动理论,Artif。智力。,237, 172-203 (2016) ·Zbl 1357.68227号
[31] 朱塞佩·德贾科莫;Lespérance,伊夫斯;法比奥·帕特里齐;Vassos,Stavros,有界信念情境演算代理的进展与验证,Stud.Log。,104, 4, 705-739 (2016) ·Zbl 1397.68191号
[32] 罗纳德·费金;Joseph Y.Halpern。;摩西,约拉姆;瓦尔迪,莫舍,《知识推理》(1995),麻省理工学院出版社·Zbl 0839.68095号
[33] 保罗·费拉里斯;Giunchiglia,Enrico,《规划在非确定性领域中的可满足性》(Proc.AAAI 2000(2000)),748-753
[34] 赫克托尔·盖夫纳;Bonet,Blai,《自动化规划模型和方法的简明介绍》(《人工智能和机器学习综合讲座》(2013),Morgan&Claypool出版社)·Zbl 1270.68012号
[35] 马利克·加拉布;Nau,Dana S。;Traverso,Paolo,《自动化规划与行动》(2016),剑桥大学出版社·兹比尔1074.68613
[36] 顾依兰;米哈伊尔·苏琴斯基(Mikhail Soutchanski),《修正情境演算中的可判定推理》(Proc.IJCAI 2007(2007)),1891-1897
[37] 彼得·哈斯鲁姆(Peter Haslum);Peter Jonsson,《关于不完全信息规划复杂性的一些结果》(Proc.ECP 1999(1999)),308-318
[38] Hemachandra,Lane A.,《强大的指数层次结构崩溃》,J.Compute。系统。科学。,39, 3, 299-322 (1989) ·Zbl 0693.03022号
[39] 安德烈亚斯·赫齐格(Andreas Herzig);杰罗姆·朗;Marquis,Pierre,《使用认知逻辑的行动表示和部分可观察规划》(Proc.IJCAI 2003(2003)),1067-1072
[40] 霍夫曼,约格;Brafman,Ronen I.,通过启发式前向搜索和隐含信念状态的权变规划,(ICAPS 2005(2005)Proc.),71-80
[41] Leslie Pack的Kaelbling;迈克尔·利特曼。;Cassandra,Anthony R.,部分可观测随机域中的规划和行动,人工制品。智力。,10199-134(1998年)·Zbl 0908.68165号
[42] Karlsson,Lars,《不确定性条件下的渐进规划》(Proc.IJCAI 2001(2001)),431-438
[43] 理查德·卡普(Richard M.Karp),组合问题中的可约性(Proc.Computer Computations的复杂性(1972)),第85-103页·Zbl 1467.68065号
[44] 理查德·卡普(Richard M.Karp)。;Lipton,Richard J.,《非均匀和均匀复杂性类之间的一些联系》(Proc.STOC 1980(1980)),302-309
[45] 杰罗姆·朗;Zanuttini,Bruno,《以知识为基础的计划作为计划——计划验证的复杂性》(Proc.ECAI-2012(2012)),504-509·Zbl 1327.68277号
[46] 杰罗姆·朗;Zanuttini,Bruno,《以知识为基础的计划作为计划:计划存在的简洁性和复杂性》(TARK Proc.2013(2013))·Zbl 1327.68277号
[47] 杰罗姆·朗;布鲁诺·扎努蒂尼(Bruno Zanuttini),基于概率信念的项目(Proc.IJCAI-15(2015)),1594-1600
[48] 拉弗尼,诺埃尔;Lang,Jéróme,《从基于知识的程序到基于信念的分级程序》,第一部分:在线推理,Synthese,147,2,277-321(2005)·Zbl 1085.68163号
[49] 拉弗尼,诺埃尔;Lang,Jéróme,《从基于知识的程序到基于信念的分级程序,第二部分:离线推理》(国际计算机学会2005年(2005)),497-502·Zbl 1085.68163号
[50] 李彦军;于、权;王燕京,《免费的更多:过渡系统整合规划的动态认知框架》,J.Log。计算。,27, 8, 2383-2410 (2017) ·Zbl 1402.68168号
[51] Löwe,Benedikt;埃里克·帕奎特(Eric Pacuit);Witzel,Andreas,DEL规划和一些可处理的案例,(《2011年LORI公报》(2011年)),179-192年·Zbl 1298.03054号
[52] 玛丽亚·什洛米;罗恩·布拉夫曼(Ronen I.Brafman)。;埃雷兹·卡帕斯;盖·沙尼(Shani,Guy),使用里程碑式启发法的部分可观察在线应急计划(Proc.ICAPS 2014(2014))
[53] 阿尔伯特·R·迈耶(Albert R.Meyer)。;Stockmeyer,Larry J.,正则表达式与平方的等价问题需要指数空间,(第13届交换与自动机理论年会(1972)),125-129
[54] Robert C.Moore,《知识与行动的形式理论》(1985),PN
[55] Morgenstern,Leora,《行动和计划的知识前提条件》(IJCAI 1987(1987)Proc.),867-874
[56] 克里斯蒂安·穆伊斯(Christian J.Muise)。;瓦夏克·贝勒(Belle,Vaishak);McIlraith,Sheila A.,《通过完全可观测的非确定性规划计算应急计划》(Proc.AAAI 2014(2014)),2322-2329
[57] Nebel,Bernhard,《论命题规划形式主义的可编译性和表达力》,J.Artif。智力。第1271-315号决议(2000年)·Zbl 0943.68182号
[58] 罗纳德·彼得里克(Ronald Petrick);Bacchus,Fahiem,《将基于知识的方法扩展到信息和感知不完整的规划》(Proc.ICAPS 2004(2004)),2-11
[59] 乔尔·皮诺(Joelle Pineau);杰弗里·戈登(Geoffrey J.Gordon)。;Thrun,Sebastian,大型POMDP的基于点的任意时间近似,J.Artif。智力。研究,27,335-380(2006)·Zbl 1182.68262号
[60] Poupart,帕斯卡;Boutiler,Craig,有界有限状态控制器(Proc.NIPS 2004(2004)),823-830
[61] 雷蒙德·赖特,《行动中的知识:指定和实现动态系统的逻辑基础》(2001),麻省理工学院出版社·Zbl 1018.03022号
[62] Jussi Rintanen,《具有部分可观测性的规划复杂性》(ICAPS 2004(2004),第345-354页)
[63] Rintanen,Jussi,离散信念空间中的条件规划(Proc.IJCAI 2005(2005)),1260-1265
[64] 阿卜杜拉·萨菲定;弗朗索瓦州施瓦岑特鲁伯;布鲁诺·扎努蒂尼(Bruno Zanuttini),《基于知识的定性分散政策》(Proc.AAAI 2018(2018)),6270-6277
[65] Walter J.Savitch,《不确定性和确定性磁带复杂性之间的关系》,J.Compute。系统。科学。,4, 2, 177-192 (1970) ·Zbl 0188.33502号
[66] Schwarzentruber,François,《Hintikka的世界:具有高阶知识的代理人》,(2018年《国际JCAI公报》(2018)),5859-5861
[67] 艾伦·斯科特;乌尔里克·斯特奇;van Rooij,Iris,扫雷车可能不是NP完整的,但是很难,数学。智力。,33, 5-17 (2011) ·Zbl 1248.68223号
[68] 理查德·斯莫尔伍德(Richard D.Smallwood)。;Sondik,Edward J.,有限时域上部分可观测马尔可夫过程的最优控制,Oper。第21号、第5号、第1071-1088号决议(1973年)·Zbl 0275.93059号
[69] 儿子曹操(Trao Cao);Baral,Chitta,《形式化传感行动:基于过渡函数的方法》,Artif。智力。,125, 1-2, 19-91 (2001) ·Zbl 0969.68152号
[70] 致Son Thanh;儿子Tran Cao;Enrico Pontelli,《信息不完整情况下规划的通用方法:理论与实施》,Artif。智力。,227, 1-51 (2015) ·Zbl 1346.68181号
[71] 范德梅登,罗恩;Vardi,Moshe Y.,基于知识的规范的综合(扩展摘要),(Proc.CONCUR 1998,第1466卷(1998)),34-49
[72] Wagner,Klaus W.,有界查询类,SIAM J.计算。,19, 5, 833-846 (1990) ·Zbl 0711.68047号
[73] 本杰明·扎里;Claßen,Jens,《基于知识的程序对描述逻辑动作的验证》(Proc.IJCAI 2015(2015)),3278-3284
[74] 本杰明·扎里;Claßen,Jens,《果洛计划对非局部效应作用的可判定验证》(Proc.AAAI 2016(2016)),1109-1115
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。