文件Zbl 1504.68214-zbMATH Open

基于知识的程序是部分可观察领域的简洁策略。（英语） Zbl 1504.68214号

Artif公司。智力。 288，文章ID 103365，26 p.（2020）。

总结：我们建议通过基于知识的项目（KBP）来表达应急计划的政策。KBP，由引入R.费金等。[关于知识的推理。马萨诸塞州剑桥：麻省理工学院出版社（1995；Zbl 0839.68095号)], 是描述代理应根据其当前知识执行的操作的高级协议：分支条件是代理可解释的认知公式。本文的主要目的是证明KBP可以被视为一种简洁的语言，用于表达单主体应急计划中的策略。
KBP在概念上与部分可观察规划文献中用于表达策略的语言非常接近：与它们一样，它们具有条件和循环结构，动作是原子程序，布尔公式是选择执行路径的信念。现在，KBP的特殊性是分支条件指的是信念状态，而不是观察结果。
由于它们的结构相似性，用于表示策略的KBP和标准语言具有相同的表达能力：每个标准策略都可以表示为KBP，每个KBP都可以“展开”为标准策略。然而，与标准策略相比，KBP更简洁、易读、更易于解释。另一方面，它们需要更多的在线计算时间，但我们表明这是一个不可避免的权衡。我们按照四个标准研究基于知识的程序：表达性、简洁性、在线执行的复杂性和验证的复杂性。

引用于2文件

MSC公司：

68T27型	人工智能中的逻辑
68T20型	人工智能背景下的问题解决（启发式、搜索策略等）
68立方英尺	知识表示

PDF格式 BibTeX公司 XML格式引用

全文：内政部哈尔

参考文献：

[1]	亚历山大·阿尔博尔；赫克托宫（Palacios，Héctor）；赫克托·杰夫纳，《基于翻译的应急计划方法》（2009年《国际JCAI汇编》（2009）），1623-1628
[2]	亚历山大·阿尔博尔；赫克托宫（Palacios，Héctor）；Hector Geffner，《在非确定性一致性规划中消除不确定性》（Proc.ECAI 2010（2010）），465-470·Zbl 1211.68392号
[3]	安徒生，米克尔·比克加德（Mikkel Birkegaard）；托马斯·博兰德（Thomas Bolander）；Jensen，Martin Holm，条件认知规划（JELIA 2012（2012），94-106）·Zbl 1361.68214号
[4]	奥斯特罗姆，卡尔·约翰，状态信息不完全的马尔可夫过程的最优控制，J.Math。分析。申请。，10, 1, 174-205 (1965) ·兹伯利0137.35803
[5]	Aucher，Guillaume，回归和认识规划的DEL序列，J.Appl。非类别。日志。，222337-367（2012年）·Zbl 1398.03068号
[6]	纪尧姆拍卖行；托马斯·博兰德（Thomas Bolander），《认知规划中的不确定性》（IJCAI Proc.2013（2013）），第27-33页
[7]	克里斯特·Bäckström；Jonsson，Peter，紧凑平面表示的算法和限制，J.Artif。智力。研究，44，141-177（2012）·Zbl 1280.68233号
[8]	克里斯特·Bäckström；安德斯·琼森（Anders Jonsson）；Jonsson，Peter，Automaton plans，J.Artif。智力。研究，51，255-291（2014）·Zbl 1364.68329号
[9]	Jorge A.Baier。；Sheila A.McIlraith，《关于用有意义的计划进行规划》（Proc.KR 2006（2006）），第492-502页
[10]	瓦夏克·贝勒（Belle，Vaishak）；Levesque，Hector J.，ALLEGRO:随机动力域中基于信念的规划（Proc.IJCAI 2015（2015）），2762-2769·Zbl 1388.68274号
[11]	Daniel S.Bernstein。；齐尔伯斯坦，什洛莫；Immerman，Neil，马尔可夫决策过程分散控制的复杂性，（Proc.UAI 2000（2000）），32-37
[12]	皮耶吉奥·贝尔托利（Piergiorgio Bertoli）；亚历山德罗·西马蒂；马可·罗维里（Marco Roveri）；Traverso，Paolo，部分可观测性下的强规划，Artif。智力。，170, 4-5, 337-384 (2006) ·Zbl 1131.68095号
[13]	托马斯·博兰德（Thomas Bolander）；Andersen、Mikkel Birkegaard，《单智能体和多智能体系统的认识规划》，J.Appl。非类别。日志。，21, 1, 9-34 (2011) ·Zbl 1242.68285号
[14]	托马斯·博兰德（Thomas Bolander）；托尔斯滕·恩格斯；安德烈亚斯·赫齐格（Andreas Herzig）；罗伯特·马特米勒（Robert Mattmüller）；Nebel，Bernhard，《政策和应急计划的动态逻辑》，（2019年《JELIA公报》（2019）），659-674·Zbl 1525.68152号
[15]	博内，布莱；Hector Geffner，《在信念空间中用不完全信息作为启发式搜索的规划》（Proc.AIPS 2000（2000）），52-61
[16]	博内，布莱；Geffner，Hector，通过经典重新规划进行部分可观测性规划：理论和实验，（Proc.IJCAI 2011（2011）），1936-1941
[17]	博内，布莱；赫克托·杰夫纳（Hector Geffner），《具有线性转换的灵活和可扩展的部分可观察规划》（Proc.AAAI 2014（2014）），2235-2241·Zbl 1396.68116号
[18]	博内，布莱；Hector Geffner，《感知规划的信念跟踪：宽度、复杂性和近似值》，J.Artif。智力。决议，50923-970（2014）·Zbl 1396.68116号
[19]	罗恩·布拉夫曼（Ronen I.Brafman）。；Shani，Guy，用部分信息和感知动作重新规划领域，J.Artif。智力。研究，45，565-600（2012）·Zbl 1253.68295号
[20]	罗恩·布拉夫曼（Ronen I.Brafman）。；Shani，Guy，使用回归进行应急计划的在线信念跟踪，Artif。智力。，241, 131-152 (2016) ·Zbl 1392.68383号
[21]	罗恩·布拉夫曼（Ronen I.Brafman）。；Joseph Y.Halpern。；约姆·肖姆，关于任务的知识要求，阿蒂夫。智力。，98, 1-2, 317-350 (1998) ·Zbl 0903.68182号
[22]	罗恩·布拉夫曼（Ronen I.Brafman）。；盖·沙尼；Zilberstein，Shlomo，多智能体领域部分可观测性下的定性规划（Proc.AAAI 2013（2013）），130-137
[23]	丹尼尔·布莱斯（Daniel Bryce）；威廉·库欣（William Cushing）；Kambhampati，Subbarao，《与州无关的规划图：确定性、非确定性和概率规划》，Artif。智力。，175, 3-4, 848-889 (2011) ·Zbl 1216.68239号
[24]	塞缪尔·巴斯（Samuel R.Buss）。；Hay，Louise，《关于SAT的真实可还原性》，Inf.Comput。，91, 1, 86-102 (1991) ·Zbl 0800.68443号
[25]	特里斯坦·查里尔；塞巴斯蒂安·甘布林；亚历山大·尼沃；弗朗索瓦·施瓦岑特鲁伯（François Schwarzentruber），《辛提卡的世界：可扩展的高阶知识》（Intikka’s world:scalable high-order knowledge），（2019年IJCAI期刊（2019）），6494-6496
[26]	亚历山德罗·西马蒂；马可·皮斯托雷（Marco Pistore）；马可·罗维里（Marco Roveri）；Traverso、Paolo、通过符号模型检查的弱、强和强循环规划、Artif。智力。，147, 1-2, 35-84 (2003) ·Zbl 1082.68800号
[27]	克拉恩，延斯；Neuss，Malte，模态情境演算中具有默认值的基于知识的程序，（Proc.ECAI 2016（2016）），1309-1317·兹比尔1403.68258
[28]	克拉斯滕，约尔格；Lakemeyer，Gerhard，《使用ES的基于知识的程序基础》（Proc.KR 2006（2006）），第318-328页
[29]	阿德南·达尔维什；Marquis，Pierre，《知识汇编地图》，J.Artif。智力。决议，17，229-264（2002）·Zbl 1045.68131号
[30]	朱塞佩·德贾科莫；Lespérance，伊夫斯；Patrizi，Fabio，有界情境演算行动理论，Artif。智力。，237, 172-203 (2016) ·Zbl 1357.68227号
[31]	朱塞佩·德贾科莫；Lespérance，伊夫斯；法比奥·帕特里齐；Vassos，Stavros，有界信念情境演算代理的进展与验证，Stud.Log。，104, 4, 705-739 (2016) ·Zbl 1397.68191号
[32]	罗纳德·费金；Joseph Y.Halpern。；摩西，约拉姆；瓦尔迪，莫舍，《知识推理》（1995），麻省理工学院出版社·Zbl 0839.68095号
[33]	保罗·费拉里斯；Giunchiglia，Enrico，《规划在非确定性领域中的可满足性》（Proc.AAAI 2000（2000）），748-753
[34]	赫克托尔·盖夫纳；Bonet，Blai，《自动化规划模型和方法的简明介绍》（《人工智能和机器学习综合讲座》（2013），Morgan&Claypool出版社）·Zbl 1270.68012号
[35]	马利克·加拉布；Nau，Dana S。；Traverso，Paolo，《自动化规划与行动》（2016），剑桥大学出版社·兹比尔1074.68613
[36]	顾依兰；米哈伊尔·苏琴斯基（Mikhail Soutchanski），《修正情境演算中的可判定推理》（Proc.IJCAI 2007（2007）），1891-1897
[37]	彼得·哈斯鲁姆（Peter Haslum）；Peter Jonsson，《关于不完全信息规划复杂性的一些结果》（Proc.ECP 1999（1999）），308-318
[38]	Hemachandra，Lane A.，《强大的指数层次结构崩溃》，J.Compute。系统。科学。，39, 3, 299-322 (1989) ·Zbl 0693.03022号
[39]	安德烈亚斯·赫齐格（Andreas Herzig）；杰罗姆·朗；Marquis，Pierre，《使用认知逻辑的行动表示和部分可观察规划》（Proc.IJCAI 2003（2003）），1067-1072
[40]	霍夫曼，约格；Brafman，Ronen I.，通过启发式前向搜索和隐含信念状态的权变规划，（ICAPS 2005（2005）Proc.），71-80
[41]	Leslie Pack的Kaelbling；迈克尔·利特曼。；Cassandra，Anthony R.，部分可观测随机域中的规划和行动，人工制品。智力。，10199-134（1998年）·Zbl 0908.68165号
[42]	Karlsson，Lars，《不确定性条件下的渐进规划》（Proc.IJCAI 2001（2001）），431-438
[43]	理查德·卡普（Richard M.Karp），组合问题中的可约性（Proc.Computer Computations的复杂性（1972）），第85-103页·Zbl 1467.68065号
[44]	理查德·卡普（Richard M.Karp）。；Lipton，Richard J.，《非均匀和均匀复杂性类之间的一些联系》（Proc.STOC 1980（1980）），302-309
[45]	杰罗姆·朗；Zanuttini，Bruno，《以知识为基础的计划作为计划——计划验证的复杂性》（Proc.ECAI-2012（2012）），504-509·Zbl 1327.68277号
[46]	杰罗姆·朗；Zanuttini，Bruno，《以知识为基础的计划作为计划：计划存在的简洁性和复杂性》（TARK Proc.2013（2013））·Zbl 1327.68277号
[47]	杰罗姆·朗；布鲁诺·扎努蒂尼（Bruno Zanuttini），基于概率信念的项目（Proc.IJCAI-15（2015）），1594-1600
[48]	拉弗尼，诺埃尔；Lang，Jéróme，《从基于知识的程序到基于信念的分级程序》，第一部分：在线推理，Synthese，147，2，277-321（2005）·Zbl 1085.68163号
[49]	拉弗尼，诺埃尔；Lang，Jéróme，《从基于知识的程序到基于信念的分级程序，第二部分：离线推理》（国际计算机学会2005年（2005）），497-502·Zbl 1085.68163号
[50]	李彦军；于、权；王燕京，《免费的更多：过渡系统整合规划的动态认知框架》，J.Log。计算。，27, 8, 2383-2410 (2017) ·Zbl 1402.68168号
[51]	Löwe，Benedikt；埃里克·帕奎特（Eric Pacuit）；Witzel，Andreas，DEL规划和一些可处理的案例，（《2011年LORI公报》（2011年）），179-192年·Zbl 1298.03054号
[52]	玛丽亚·什洛米；罗恩·布拉夫曼（Ronen I.Brafman）。；埃雷兹·卡帕斯；盖·沙尼（Shani，Guy），使用里程碑式启发法的部分可观察在线应急计划（Proc.ICAPS 2014（2014））
[53]	阿尔伯特·R·迈耶（Albert R.Meyer）。；Stockmeyer，Larry J.，正则表达式与平方的等价问题需要指数空间，（第13届交换与自动机理论年会（1972）），125-129
[54]	Robert C.Moore，《知识与行动的形式理论》（1985），PN
[55]	Morgenstern，Leora，《行动和计划的知识前提条件》（IJCAI 1987（1987）Proc.），867-874
[56]	克里斯蒂安·穆伊斯（Christian J.Muise）。；瓦夏克·贝勒（Belle，Vaishak）；McIlraith，Sheila A.，《通过完全可观测的非确定性规划计算应急计划》（Proc.AAAI 2014（2014）），2322-2329
[57]	Nebel，Bernhard，《论命题规划形式主义的可编译性和表达力》，J.Artif。智力。第1271-315号决议（2000年）·Zbl 0943.68182号
[58]	罗纳德·彼得里克（Ronald Petrick）；Bacchus，Fahiem，《将基于知识的方法扩展到信息和感知不完整的规划》（Proc.ICAPS 2004（2004）），2-11
[59]	乔尔·皮诺（Joelle Pineau）；杰弗里·戈登（Geoffrey J.Gordon）。；Thrun，Sebastian，大型POMDP的基于点的任意时间近似，J.Artif。智力。研究，27，335-380（2006）·Zbl 1182.68262号
[60]	Poupart，帕斯卡；Boutiler，Craig，有界有限状态控制器（Proc.NIPS 2004（2004）），823-830
[61]	雷蒙德·赖特，《行动中的知识：指定和实现动态系统的逻辑基础》（2001），麻省理工学院出版社·Zbl 1018.03022号
[62]	Jussi Rintanen，《具有部分可观测性的规划复杂性》（ICAPS 2004（2004），第345-354页）
[63]	Rintanen，Jussi，离散信念空间中的条件规划（Proc.IJCAI 2005（2005）），1260-1265
[64]	阿卜杜拉·萨菲定；弗朗索瓦州施瓦岑特鲁伯；布鲁诺·扎努蒂尼（Bruno Zanuttini），《基于知识的定性分散政策》（Proc.AAAI 2018（2018）），6270-6277
[65]	Walter J.Savitch，《不确定性和确定性磁带复杂性之间的关系》，J.Compute。系统。科学。，4, 2, 177-192 (1970) ·Zbl 0188.33502号
[66]	Schwarzentruber，François，《Hintikka的世界：具有高阶知识的代理人》，（2018年《国际JCAI公报》（2018）），5859-5861
[67]	艾伦·斯科特；乌尔里克·斯特奇；van Rooij，Iris，扫雷车可能不是NP完整的，但是很难，数学。智力。，33, 5-17 (2011) ·Zbl 1248.68223号
[68]	理查德·斯莫尔伍德（Richard D.Smallwood）。；Sondik，Edward J.，有限时域上部分可观测马尔可夫过程的最优控制，Oper。第21号、第5号、第1071-1088号决议（1973年）·Zbl 0275.93059号
[69]	儿子曹操（Trao Cao）；Baral，Chitta，《形式化传感行动：基于过渡函数的方法》，Artif。智力。，125, 1-2, 19-91 (2001) ·Zbl 0969.68152号
[70]	致Son Thanh；儿子Tran Cao；Enrico Pontelli，《信息不完整情况下规划的通用方法：理论与实施》，Artif。智力。，227, 1-51 (2015) ·Zbl 1346.68181号
[71]	范德梅登，罗恩；Vardi，Moshe Y.，基于知识的规范的综合（扩展摘要），（Proc.CONCUR 1998，第1466卷（1998）），34-49
[72]	Wagner，Klaus W.，有界查询类，SIAM J.计算。，19, 5, 833-846 (1990) ·Zbl 0711.68047号
[73]	本杰明·扎里；Claßen，Jens，《基于知识的程序对描述逻辑动作的验证》（Proc.IJCAI 2015（2015）），3278-3284
[74]	本杰明·扎里；Claßen，Jens，《果洛计划对非局部效应作用的可判定验证》（Proc.AAAI 2016（2016）），1109-1115

此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配，可能包含数据转换错误。在某些情况下，zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献，而不要求完整或完全匹配。

任何	在任何地方
一个	内部文档标识符
澳大利亚	作者、编辑
人工智能	内部作者标识符
钛	标题
洛杉矶	语言
所以	来源
ab公司	回顾，摘要
第页	出版年份
车辆	评审员
复写的副本	MSC代码
美国犹他州	关键字
日期	文档类型(j个：期刊文章；b条：book；一：图书文章）

一&b条	逻辑和
一\|b条	逻辑或
!ab公司	逻辑不
美国广播公司*	右通配符
"ab c公司"	短语
(ab c公司)	圆括号

示例

领域

操作员

基于知识的程序是部分可观察领域的简洁策略。（英语） Zbl 1504.68214号

MSC公司：

关键词：

引文：

软件：

参考文献：

示例

领域

操作员

基于知识的程序是部分可观察领域的简洁策略。 （英语） Zbl 1504.68214号

MSC公司：

关键词：

引文：

软件：

参考文献：

基于知识的程序是部分可观察领域的简洁策略。（英语） Zbl 1504.68214号